İnformasiya cəmiyyəti problemləri, 2013, №2(8), 13-20
www.jpis.az 13
UOT 004.65:006.72
Qurbanova Ə.M.
AMEA İnformasiya Texnologiyaları İnstitutu, Bakı, Azərbaycan
afruz@iit.ab.az
TERMİNOLOJİ İNFORMATİKA SAHƏSİNDƏ APARILAN ELMİ-NƏZƏRİ
ARAŞDIRMALAR VƏ ONLARIN TƏHLİLİ
Məqalədə terminologiya və informatikanın yeni istiqaməti olan terminoloji informatika
sahəsində aparılan tədqiqatlar araşdırılıb və onlar təhlil edilib. Terminoloji biliklər bazasının
yaradılması istiqamətində beynəlxalq təcrübə tədqiq edilib. Müasir informasiya-kommunikasiya
texnologiyalarının imkanlarından istifadə etməklə Azərbaycanda terminologiya fəaliyyətinin yeni
modelinin işlənməsi təklif olunub.
Açar sözlər: terminoloji informatika, linqvistik informatika, ontologiya, leksik verilənlər bazası,
leksik biliklər bazası, terminoloji verilənlər bazası, terminoloji biliklər bazası.
Giriş
Son illər həm milli, həm də xarici linqvistikada ayrı-ayrı predmet sahələrində və müxtəlif
dillərdə terminologiyanın problemlərinin hərtərəfli öyrənilməsinə böyük diqqət ayrılır. Milli
sərhədlərin açılması və genişlənməsi, elmi-texniki inqilabın ictimai həyatın bütün sferalarına
təsiri ilə əlaqədar müasir həyat fəaliyyətinin yüksəlməsi tədqiqatçılar arasında peşəkar ünsiyyət
dilinə (Language for special purposes (LSP) - xüsusi məqsədlər üçün dil – dilin müxtəlif
funksional formalarıdır, elmin və texnikanın müxtəlif sahələrində təcrübə mübadiləsi, xüsusi
bilik sahələrində ünsiyyət, əsasən də, informasiyanın ötürülməsi üçün təyin olunub) marağın
artmasına səbəb olub. Bu isə yeni terminlər, o cümlədən leksikoqrafik terminlər axınının
əhəmiyyətli dərəcədə çoxalmasına gətirib çıxarıb ki, onların da sistemləşdirilməsi və izahının
verilməsi zəruridir.
Bu gün sənədlərin böyük əksəriyyəti mütəxəssislər üçün nəzərdə tutulduğundan onların
çoxu terminologiyadan ibarətdir. Başqa sözlə, formula, kod, simvollar və qrafika kimi dil
elementlərini özünə daxil
edən terminologiya faktların, fikirlərin və biliklərin təqdimatı üçün
əsas vasitədir [1].
Bundan başqa, xüsusi bilik və informasiyanın (birdilli və ya çoxdilli olmasından asılı
olmayaraq) ötürülməsi terminoloji resursların yaradılması və yayılması ilə birbaşa əlaqəlidir. Bu
proses təkcə elm və texnikada deyil, həmçinin hüquq, dövlət idarəçiliyi, səhiyyə və digər sahələr
üçün də zəruridir. Həmçinin terminologiya sənədlərin işlənməsi və yayılmasında da əsas rol
oynayır. Terminologiya bir elm sahəsi kimi biliyin yüksəkkeyfiyyətli, effektli təqdimatı və
ötürülməsi üçün konsepsiya və metodologiya təklif edir. Bu metodologiyalar dil üzrə
mütəxəssislər tərəfindən, eləcə də, müvafiq hazırlıqdan sonra digər sahənin mütəxəssisləri
tərəfindən istifadə oluna bilər. Eyni zamanda, bu metodologiyalar terminoloji resursların və
biliyin digər formalarının aşkarlanması, yayılması, ötürülməsi, saxlanması və dəstəklənməsi
məqsədilə alətlərin sayının çoxalması üçün də əsas yaradır.
Elmin sosial rolunun artması, informasiyanın həcminin daim çoxalması həm yeni, həm
inkişaf edən, həm də artıq formalaşan bilik sahələrinin termin sistemlərinin tədqiqatını zəruri
etmişdir. Biliyin müxtəlif sahələrinin termin sistemlərinin ayrıca tədqiqat obyektinə çevrilməsi
hazırkı dövrdə inkişaf edən və tədqiqat metodları təkmilləşən terminoqrafiya və terminşünaslıq
kimi müstəqil elm sahələrinin meydana gəlməsinə səbəb olmuşdur [2].
Terminşünaslıq (terminologiya) - tipologiyası, mənşəyi, forması, məzmunu və fəaliyyəti,
həmçinin istifadəsi, nizama salınması və yaradılması nöqteyi-nəzərindən xüsusi leksikanı
öyrənən elmdir. Terminologiya bir-biri ilə əlaqəli olan bir neçə fənnin tədqiqat obyektidir. Belə
ki, terminologiya linqvistikada nəzəriyyə obyekti, tətbiqi terminşünaslıqda unifikasiya,
İnformasiya cəmiyyəti problemləri, 2013, №2(8), 13-20
14 www.jpis.az
standartlaşma və nizamlanma obyekti, informatikada informasiya sistemlərinin süni dillərinin
yaradılması üçün materialdır. Xüsusi bilik sahələrinin anlayışlarının ifadə edilməsinə xidmət
edən dil işarələrinin məcmusu kimi, terminologiya xüsusi fənndir, baniləri Avstriyadan
E.Vyuster və keçmiş Sovetlər birliyindən D.S.Lotte olmuşdur. E.Vyuster terminologiyanı
linqvistika, məntiq, ontologiya, informatika və konkret bilik sahələrinin kəsişməsində xüsusi
fənn adlandırmışdır. Sovet alimi V.M.Leyçik isə terminologiyanı öz predmet və metodları ilə
sərbəst fənn hesab edir [3].
Digər tərəfdən, informasiya texnologiyaları və sistemlərinin inkişafı, müxtəlif elm sahələri
və fəaliyyət sferalarında beynəlxalq əməkdaşlıq əlaqələrinin qloballaşması müxtəlif dillərin
terminologiyalarının tədqiqatını aktuallaşdırmış, yeni yanaşmalar və məsələlər müəyyən
edilmişdir.
İstənilən terminoloji tədqiqat böyük həcmdə terminoloji informasiyanın yığılması və
işlənməsi zərurətini ortaya çıxarır ki, bu məsələlərin də yerinə yetirilməsi üçün effektli alətlərdən
biri terminoloji verilənlər bazasının yaradılmasıdır. Məlumdur ki, verilənlər bazası müəyyən
qaydalarla təşkil olunan, ümumi prinsiplərlə təsvir edilən, saxlanılan və idarə olunan verilənlər
məcmusu, eləcə də, müəyyən predmet sahəsinin informasiya modelidir.
Qeyd edək ki, xüsusi ontologiyanın (biliyin təqdimatı və idarə edilməsi, mətnin analizi və
s.) qurulması, termin banklarının yaradılması və istismarında yardımçı olan metod və alətlərin
təklif edilməsi üçün təbii dilin emalı
(Natural Language Processing, NLP) kifayət qədər
təkmilləşib. NLP süni intellekt və riyazi linqvistikanın ümumi istiqamətidir, təbii dilin kompüter
analizi və sintezinin problemlərini öyrənir.
Hazırkı dövrdə yeni elmi sahələrə (məs. biotibb və s.) olan elmi tələbatın artması, digər
tərəfdən də bu sahələrə aid çap materiallarının günbəgün çoxalması artıq terminologiyanın
sistemli şəkildə və avtomatik əldə olunmasının əhəmiyyətinə əlavə maraq oyadır.
Yuxarıda deyilənlər nəzərə alınaraq, son zamanlar terminologiya və informatikanın ümumi
istiqaməti olan terminoloji informatika sahəsinə xüsusi diqqət ayrılır, bu sahədə mühüm
tədqiqatlar aparılır.
Terminoloji informatika terminoloji işin yerinə yetirilməsində hesablama metodlarından
istifadə məsələlərini öyrənir, mətnin analizi (text mining), informasiyanın axtarılması və əldə
edilməsi, sorğu sistemləri, ontologiyanın qurulması və s. sahələrdə mühüm əhəmiyyət kəsb edir.
Mətnin analizi, yeni biliklərin əldə edilməsi isə ən yaxşı şəkildə terminlərdə əks olunur və onlar
yeni anlayışlar hesab edilir.
Terminoloji informatika sahəsində aparılan araşdırmaların nəticələri bu sahə üzrə keçirilən
beynəlxalq konfrans, simpozium və elmi seminarların materiallarında əks olunur.
Terminoloji informatika sahəsi üzrə keçirilən beynəlxalq elmi seminarlar və konfranslar
Terminoloji informatikanın müxtəlif problemləri və məsələləri ilə bağlı “Computational
terminology (CompuTerm)” adı altında beynəlxalq elmi seminarlar keçirilir.
İlk Beynəlxalq seminar 1998-ci ildə Kanadanın Monreal Universitetində “CompuTerm’98”
adı altında terminoloji informatika sahəsinin tanınmış alimləri Didye Buriqu (Fransa), Kristyan
Jakmo (Fransa) və Monreal Universitetinin professoru Mari-Klod Lomun təşkilatçılığı ilə
keçirilmişdir.
Seminarda terminologiyanın tətbiqi aspektləri (əldə edilməsi, aşkarlanması, lüğətlərin
yaradılması və s.) üzrə maraqlarını bölüşən tədqiqatçılar bir araya gəlmişlər. Seminarın məqsədi
bu sahələr arasında boşluğu aradan qaldırmaq üçün innovativ ideyalarla və terminlərin avtomatik
emalının ayrı-ayrı aspektlərinin nəticələri ilə mübadiləyə təkan vermək olmuşdur.
Seminarın keçirilməsinin əhəmiyyəti və müvəffəqiyyəti son zamanlar terminologiyanın
avtomatlaşdırılması ilə əlaqəli elmdə baş verən müxtəlif proseslərə marağın artdığı qənaətinə
gəlinməsi olmuşdur [4].
İnformasiya cəmiyyəti problemləri, 2013, №2(8), 13-20
www.jpis.az 15
Terminoloji informatika üzrə “CompuTerm'02" II beynəlxalq seminar 2002-ci ildə
Pensilvaniya Universitetində (ABŞ) keçirilmişdir. Seminarda, əsasən, maşın tərcüməsi, mətnin
intellektual analizi və biliyin avtomatik əldə edilməsi və s. məsələlərdə terminlərin rolu və
terminoloji informatika sahəsində digər tədqiqatlar müzakirə olunmuşdur [5].
2004-cü ildə Cenevrədə (İsveçrə) keçirilən “CompuTerm'04” III beynəlxalq seminarın
məqsədi NLP üzrə tədqiqatçıların terminologiyada birləşməsi və terminoloji informatika
sahəsində son nailiyyətlərin və NLP-nin tətbiq olunduğu bir çox sahələrə təsirinin müzakirəsi
olmuşdur. Seminarda terminoloji resursların standartlaşdırılması, xüsusi ünsiyyət lüğətlərinin və
tezaurusların yaradılması və s. kimi məsələlərə baxılmışdır. Seminarda həmçinin
terminologiyanın əldə edilməsi (mining terminology), strukturlaşdırılması və idarə olunması
(terminlərin klasterləşdirilməsi, təsnifatlaşdırılması məsələləri), terminoloji resursların
inteqrasiyası və yeniləndirilməsi, terminoloji informasiyanın tətbiqi, terminologiyanın təqdimat
formatının ümumi qiymətləndirilməsi və s. məsələlər müzakirə olunmuşdur [6].
Qeyd etmək lazımdır ki, linqvistik informatika üzrə “Coling” adı altında beynəlxalq
konfranslar keçirilir. Bu konfransların ötən əsrin 60-cı illərindən başlayan tarixi var. Belə ki, iki
ildən bir keçirilən beynəlxalq konfransa mütəmadi olaraq 700 nümayəndə cəlb edilir. İlk
konfrans 1965-ci ildə Nyu-Yorkda (ABŞ) keçirilmişdir. Həmin vaxtdan etibarən keçirilən bu
konfrans NLP üzrə dünyada aparıcı mövqe tutur. Son beş konfrans (Coling 2004) Cenevrədə,
(Coling - ACL 2006) Sidneydə, (Coling 2008) Mançesterdə, (Coling 2010) Pekində və (Coling
2012) Mumbaidə keçirilmişdir. Coling NLP və hesablamalar ilə əlaqəli texniki sahələrin böyük
spektrini əhatə edir. XXV “Coling” Beynəlxalq konfransı 2014-cü ildə Dublində keçiriləcək [7].
2000-ci ildən başlayaraq hər il mətnin intellektual işlənməsi və linqvistik informatika üzrə
“CICLing” (Conference on Intelligent text processing and Computational Lingistics) adı altında
beynəlxalq konfranslar keçirilir. Bu konfransların keçirilməsi mətnin intellektual işlənməsi və
linqvistik informatikanın inkişaf etdiyi müxtəlif sahələrdən olan alimlər arasında fikir
mübadiləsini genişləndirmək məqsədini daşıyır. Əsas ideya tətbiqi linqvistikada incəsənətin
vəziyyəti haqqında ümumi təsəvvür əldə etməkdir. 2012-ci ildə Nyu Dehlidə (Hindistan)
Hindistan Texnologiya İnstitutu tərəfindən “CICLing” XIII Beynəlxalq konfransı keçirilmiş və
onun materialları Springer Lecture Notes (kompüter elmləri üzrə) jurnalının xüsusi buraxılışında
dərc olunmuşdur [8].
Terminoloji informatika üzrə keçirilən beynəlxalq seminarlarda dünyanın müxtəlif
ölkələrindən bu sahə üzrə tədqiqatlar aparan nüfuzlu alimlərdən Xurşid Əhməd (Böyük
Britaniya), Teresa Kabre (İspaniya), Kyo Kaqeura (Yaponiya) İngrid Meyer (Kanada), Padmini
Srinivasan (ABŞ) və digərləri iştirak etmişlər.
Terminoloji informatika sahəsi üzrə kitablar
Terminoloji informatika sahəsində bir sıra kitablar nəşr olunmuşdur. Bu kitablarda
terminoloji informatikanın müxtəlif problemlərini əhatə edən məsələlər öz əksini tapmışdır.
Müəllifləri Didye Buriqu, Kristyan Jakmo və Mari-Klod Lom olan “Terminoloji
informatika sahəsində son yeniliklər” (“Recent advances in computational terminology”) adlı
kitaba (2001) terminologiyanın avtomatik təhlili, saxlanılması və istifadəsi üzrə araşdırmalar
aparan tədqiqatçıların, eləcə də, tətbiqi terminologiya, terminoloji informatika, informasiya
axtarışı və süni intellekt sahəsinin mütəxəssislərinin 17 məqaləsi daxil edilib. Kitabda
terminoloji informatika üzrə birinci beynəlxalq seminarın (Bu seminarda müxtəlif elmi
cəmiyyətlərdən olan tədqiqatçılar bir araya gəlmiş və tədqiqat sahəsini “terminoloji informatika”
adlandırmışlar) materialları öz əksini tapıb [9].
Kitaba daxil edilən məqalələrdə terminoloji informatikanın terminologiya, linqvistika və
kompüter elmləri ilə kəsişməsi sahəsində innovativ və mühüm nailiyyətlər əks olunmuş, eləcə
də, terminoloji informatikanın tətbiq oluna biləcəyi sahələrin geniş spektri göstərilmişdir.
İnformasiya cəmiyyəti problemləri, 2013, №2(8), 13-20
16 www.jpis.az
Kitabda həmçinin ikidilli lüğətlərin hazırlanması, terminoqrafiya və avtomatik referatlaşma
məsələləri təsvir olunub.
Terminologiyanın texniki və ictimai-siyasi aspektləri haqqında ətraflı məlumatın toplandığı
“Terminologiya: nəzəriyyə, metod və tətbiqlər” (Terminology: theory, methods, and
applications) kitabı (1999) terminoloqlar və müvafiq sahə mütəxəssisləri üçün nəzərdə tutulub.
Qeyd edək ki, kitabın müəllifi İspaniyanın Pompey Fabra Universitetinin (linqvistika və
terminologiyanı tədris edir) professoru Mari Teresa Kabredir [10].
Terminologiya yaradıcılığının sistemliliyi və dinamikası üçün qaydaların aşkar edilməsi
terminologiya nəzəriyyəsinin möhkəm əsası üçün mühüm əhəmiyyət kəsb edir. Tokio Milli
İnformatika İnstitutunun professoru Kyo Kaqeuranın müəllifi olduğu və 2002-cildə nəşr olunan
“Terminologiyanın dinamikası” (The Dynamics of Terminology) kitabında yapon
terminologiyasının müəyyən sahələrində yuxarıda deyilən iki faktorun qarşılıqlı fəaliyyəti
təqdim olunur [11].
Burada terminlər və onların tərkib elementləri arasındakı münasibətlərə, tərkib elementləri
ilə terminologiyanın qurulmasında istifadə olunan konseptual kombinasiyaların tiplərinin
qarşılıqlı əlaqələrinə detallarla baxılır. Müəllif terminologiya
artımının inkişaf
qanunauyğunluqlarının kəmiyyət analizini təqdim edir.
Bu sahədə daha bir kitab “Leksikoqrafiya üzrə praktiki təlimat” (A Practical Guide to
Lexicography) adı altında Leyden Universitetinin (Hollandiya) fəxri professoru Piet van
Sterkenburqun redaktəsi ilə 2003-cü ildə nəşr olunmuşdur. Kitabda leksika və onun müxtəlif tip
lüğətlərdə təsvirində təlimatların vəziyyəti əks olunur. Leksikoqrafiyaya bu cür yanaşma
ekspertlər qrupunu birləşdirir, ümumi və konkret məqsədlər üçün lüğətlərin toplanması və
işlənməsində addım-addım qərar qəbuletmə prosesinə aparır [12]. Təbii ki, elektron lüğətlər,
verilənlər bazaları ilə idarəetmə kitabın əsas mövzusudur. Leksikoqrafiya üzrə praktiki təlimat
müasir leksikanın nailiyyətləri, imkanları və problemləri haqqında bilgilər almağa kömək edir.
2007-ci ildə Mayduquri Universitetinin (Nigeriya) professoru Bassey Edem Antianın
redaktəsi ilə nəşr olunan “Terminologiyada qeyri-müəyyənlik və təbii dilin işlənməsi”
(Indeterminacy in Terminology and LSP) kitabında nəzəri, antropoloji və koqnitiv linqvistikaya
əsaslanan tematik tədqiqatlar və metodologiya, həmçinin terminoloji tədqiqat nəzəriyyəsi və
tarixi, ontologiyanın qurulması, proqram təminatının lokallaşdırılması və s. təqdim olunur [13].
Cənubi Koreyanın paytaxtı Seul şəhərində kompüter linqvistikası üzrə keçirilən
“CICLing’2004” V beynəlxalq konfransının materialları kitab şəklində “Linqvistik informatika
və mətnin intellektual işlənməsi” (Computational Linguistics and Intelligent Text Processing)
adı altında nəşr olunub [14].
2004-cü ildə nəşr olunan “Ontoloji mühəndislik” (Ontological Engineering) kitabında
semantik veb, elektron kommersiya və biliklərlə idarəetmə məsələləri təqdim olunur. Məlumdur
ki, ontologiya ümumi leksikanı təmin edir, terminin mənası və terminlərarası münasibətləri təyin
edir. Son onilllikdə ontologiyaya çox diqqət yetirilir. Hazırda ontologiya bilik mühəndisliyi, süni
intellekt və kompüter elmlərində istifadə edilir. Kitabda ontoloji mühəndisliyin əsas məsələləri
təqdim olunur [15].
Dünyanın müxtəlif ölkələrindən olan alimlər terminoloji informatika sahəsində əhəmiyyətli
tədqiqatlar aparırlar. Belə alimlərdən biri olan kompüter elmləri sahəsində doktorluq dərəcəsini
1997-ci ildə ABŞ-ın Pensilvaniya Universitetində almış Srinivas Banqalor “Supertagging” (təbii
dilin işlənməsində mürəkkəb leksik təsvirlərin istifadəsi) üzrə dissertasiyasına görə kompüter
texnologiyalarının innovativ tətbiqinə gətirib çıxaran ən yaxşı tədqiqat işi kimi Morris və Doroti
Rubinov mükafatlarına layiq görülüb. O, NLP, nitqin emalı, dil modelinin hazırlanması, maşın
tərcüməsi və s. sahələrdə tanınmış ekspertdir. S.Banqalor “Linqvistik informatika” jurnalının
redaksiya heyətinin üzvü, ACL və IEEE-nin bir sıra konfranslarının proqram komitələrinin üzvü,
həmçinin 2008-ci ildə İEEE-nin keçirdiyi ünsiyyət dili texnologiyası üzrə seminarın
təşkilatçılarından biri olmuşdur. [16].
İnformasiya cəmiyyəti problemləri, 2013, №2(8), 13-20
www.jpis.az 17
Belçikanın Leven Katolik Universitetinin kompüter elmləri fakultəsinin professoru Mari-
Fransin Moens məzmunun mətndən avtomatik çıxarılması və tanınması, diskursun qarvanması,
biliyin əldə olunması, hər hansı istifadəçinin yazdığı məzmunun və anlaşılmaz səsli mətnin
işlənməsi və s. sahələrdə tədqiqatlar aparır [17].
İrlandiyalı alim, kompüter elmləri üzrə professor Əhməd Xurşid neyron hesablamalar,
terminologiya və ontologiya, NLP, xüsusilə, informasiyanın əldə edilməsi və s. istiqamətlərdə
araşdırmalar aparmışdır. Onun neyron hesablamaları istiqamətində tədqiqatları dilin təkamülünü
təqlid edən Multi-net neyron sistemlərinə gətirib çıxarmış və həmin sistem şəkillərin və onların
mətn təsvirinin birgə axtarışında istifadə edilib. O, terminologiya və ontologiya sahələrində
tədqiqatlar aparmış, tədqiqatlarının praktiki məqsədi müxtəlif şərtlərin öhdəsindən gələ bilən
informasiya sisteminin yaradılması olmuşdur [18].
Terminoloji informatika sahəsində fundamental tədqiqatları ilə seçilən alimlərdən biri də
İngrid Meyerdir. Ottava Universitetinin (Kanada) professoru olan İ.Meyer terminologiya
sahəsində bir sıra innovativ ideyaların (terminoloji biliklər bazasının yaradılması, zəngin-bilik
konteksti (knowledge-rich context), determinləşmə və s.) müəllifidir.
Terminoloji informatika sahəsində aparılan araşdırmaların təhlili
İngrid Meyerin fundamental tədqiqatının nəticələrini əks etdirən, həmmüəllifi olduğu
“Terminoloji resursların yeni nəslinə doğru: terminoloji biliklər bazasının yaradılması təcrübəsi”
adlı məqaləsi COGNITERM adlanan terminoloji biliklər bazasının qurulması layihəsini təsvir
edir. Məqalədə leksikoloji informatika və bilik mühəndisliyi sahələrində müasir inkişafla əlaqəli
tədqiqatlar əsas yer tutur. Tədqiqat işində həmçinin COGNITERM-in strukturunun təsviri təqdim
edilmiş, onun ənənəvi termin bankı ilə müqayisədə üstünlükləri araşdırılmış və bu işdən əldə
edilən bir sıra metodoloji məsələlər verilmişdir [19].
Araşdırmanın əsas məqsədi terminologiyada olduğu kimi, leksikoloji informatika
sahəsində də xüsusi dünya biliklərinin (terminoloji anbarda saxlanılan) növü və sayı ilə əlaqəli
tədqiqatların həlli vacib məsələlərinin mövcudluğunu önə çəkməkdir. Qeyd edək ki,
Ottava
Universitetinin süni intellekt laboratoriyasında yaradılan yeni tip terminoloji anbar olan
COGNITERM termin bankı ilə biliklər bazasının vəhdəti, terminoloji biliklər bazasıdır (TBB).
COGNITERM terminologiyada istifadə olunan bilik mühəndisliyinin ümumi alətləri – CODE-un
(Conceptually Oriented Design Environment - konseptual yönümlü təsvir mühiti) istifadəsilə
ikidilli (fransız, ingilis) terminoloji biliklər bazasıdır.
Dünyada
böyük həcmli terminoloji verilənlər bazaları mövcuddur, onlardan biri də
Kanadada bir milyondan çox termini özündə əks etdirən TERMİUM III-dür. Bu baza yalnız
potensial istifadəçilər üçün nəzərdə tutulub. TERMİUM III-dən texniki sənədlərdə, informasiya
ilə idarəetmədə, tədris sahəsində, eləcə də, informasiyanın axtarılması, maşın tərcüməsi və
ekspert sistemlərdə istifadə olunmasına baxmayaraq, əsas istifadəçiləri tərcüməçilərdir.
Böyük terminoloji verilənlər bazası olan TERMİUM III-ün əsas çatışmazlığı ondan
ibarətdir ki, termin haqqında, əsasən, linqvistik informasiyanı verir. Burada konseptual
informasiya aydın deyil, səpələnmiş, strukturlaşdırılmamış vəziyyətdə, ziddiyyətlidir.
Bu problemləri nəzərə alaraq, tədqiqatçılar biliklərə əsaslanan yeni növ terminoloji
anbarların yaradılmasını təklif edirlər.
Hələ ötən əsrin 90-cı illərində Kembric Universitetinin (Böyük Britaniya) professoru
Branimir Boguraev (kompüter linqvistikası) və
Stenford Universitetinin (ABŞ) professoru Bet
Levin leksik biliklər bazası (LBB) ilə leksik verilənlər bazasını (LVB) müqayisə etməyə
çalışmışlar. Onların fikrincə, LBB və LVB iki xüsusiyyətinə görə fərqlənirlər. Belə ki, LVB
sözün sinoniminə əsaslanan leksik xarakteristikanı verdiyi halda, LBB ümumiləşdirməyə,
həmçinin leksik nəticə çıxarmağa, beləliklə də, leksikonun dinamik genişlənməsinə imkan verir
[20]. Hər iki xarakteristika TBB üçün vacibdir.
İnformasiya cəmiyyəti problemləri, 2013, №2(8), 13-20
18 www.jpis.az
Terminologiya və bilik mühəndisliyi arasında əlaqəni araşdıran tədqiqatçılar bu
münasibətin əsasında ekspertin, bir tərəfdən, bilik-ünsiyyət
konteksti, digər tərəfdən, biliyin
təqdimatı texnologiyası kontekstində vasitəçi kimi cəlb edilməli olduğu qənaətinə gəlmişlər. Bu
tip bilik-ünsiyyət konteksti öz ardınca üç əsas fəaliyyət istiqamətini meydana çıxarır:
1.
Biliyin əldə edilməsi - üç elementdən ibarətdir: fəaliyyət, dərketmə və ünsiyyət. Bu
zaman mütəxəssisdən təcrübəçi, alim və müəllim rolunu oynamaq tələb olunur.
Ekspertlər tədris vərdişlərinə görə bir-birindən fərqlənirlər. Onlar biliyi təqdim etmək üçün
dil qabiliyyətinə malik olmaya, lazımi biliyi tələb etməyə bilərlər. Onlar mühəndis (iqtisadçı)
biliklərini fərqli və ziddiyyətli problemlərlə təqdim edərək sahəni dəyişə və ya müxtəlif şəklə
sala bilərlər.
2.
Biliyin formallaşdırılması. Bilik “rəfdən hazır gəlmir”. Qeyd edildiyi kimi, bilik qeyri-
ardıcıl, ziddiyyətli və çoxölçülü ola bilər. O, “dərketmə” üçün çətin ola bilər, çünki
daim dəyişir, bu səbəbdən, bilik tam və aydın olmur.
3.
Biliyin dəqiqləşdirilməsi. Bilik iki istiqamətdə - bilik sisteminə əsaslanan test yolu ilə
yoxlanılmaqla və mütəmadi yeniləşdirilməklə dəqiqləşdirilə bilər.
Xüsusi biliyin əldə edilməsi, formallaşdırılması və həyata keçirilməsi sahəsində ekspert
olan və ya olmayan istifadəçiyə kömək məqsədilə CODE adlanan bilik mühəndisliyi vasitəsi
işlənmiş və testdən keçirilmişdir. CODE-un istifadəsi TBB-in daha dəqiq konsepsiyasının
işlənməsinə kömək edir.
COGNITERM terminoloji verilənlər bazası ilə biliklər bazası arasında hibrid (onların
cütləşməsindən alınan baza) kimi nəzərdə tutulub. Hər bir konsepsiya informasiyanın iki əsas
kateqoriyasından ibarət oxşar formalı struktur şəklində təqdim olunur. Konseptual informasiya
kateqoriyası biliklər bazası komponenti, konseptual xarakteristikanın siyahısı və onun
qiymətləndirilməsidir. TBB müxtəlif semantik şəbəkədə qrafik formada vizuallaşa bilər. Hər iki
iyerarxik (ümumi, hissə-tam və s.) və qeyri-iyerarxik münasibət qrafik formada ola bilər. CODE
anlayışın 4 koordinatının bütün xüsusiyyətlərinin birləşməsindən ibarət olan Xarakterik
Müqayisə Matrisini təqdim edir. Nəhayət, COGNITERM üzrə naviqasiya CODE brauzeri
vasitəsilə həyata keçirilir. CODE biliyin anlayışlar və ya onların xarakteristikalarının adı ilə əldə
edilməsinə imkan verir.
TBB informasiya, informasiyanın əldə edilməsi və sistemləşdirilməsinə dəstək nöqteyi-
nəzərindən TVB-dən üstündür. Belə ki, TVB-də informasiya aydın, aşkar şəkildə kodlaşdırılmır,
TBB-də isə əksinə, informasiya aydın, aşkar şəkildə anlayışlarla kodlaşdırılır. TBB konseptual
münasibətin aşkar təqdimatına imkan verir və ardıcıllığı asanlaşdırır (məsələn, bütün anlayışların
koordinatının təyini eyni növ termindən olmalıdır). Konseptual münasibətin aşkar təqdimatı
biliyin strukturunun qrafik formada təqdimatına uyğundur. Bu aspekt COGNİTERM layihəsində
xüsusi vurğulanır.
TVB-dən fərqli olaraq, TBB olan COGNİTERM informasiyanın saxlanması üçün zəruri
mühiti təmin etməklə yanaşı, informasiyanın sistemləşdirilməsi və əldə edilməsinə kömək
məqsədi daşıyan bir mexanizmdir. Bu mexanizm terminoloqu informasiyanın (bir iyerarxik
səviyyədən digərinə) təkrarlanmasından azad edir.
Adi TVB termin-konsepsiya istiqamətini təşkil edir: termini bilməklə onun izahını,
sinonimini və s. bilmək olar. Terminoloji tədqiqat, əsasən, konsepsiya-termin istiqamətində
aparılır.
COGNİTERM istifadəçiləri fikirlərindəki terminin adının artıq mövcud olub-olmamasını
müəyyənləşdirmək üçün hər hansı konseptual xarakteristika vasitəsilə bu bazaya daxil ola
bilərlər.
Tədqiqatçıların fikrincə, təklif edilən yanaşmanın inkişaf etdirilməsi vacibdir, çünki terminoloji
iş üçün vacib sayılan ekspertlər və digər terminoloqlar tərəfindən yoxlanılma burada çətindir.
Belə ki, yaradılan TBB, əsasən, hipermətn formasındadır və daha çox “hamar” mətnlərə - ümumi
İnformasiya cəmiyyəti problemləri, 2013, №2(8), 13-20
www.jpis.az 19
qəbul olunmuş terminoloji yazılara tətbiq oluna bilir. Bu səbəbdən, təklif edilən metodlara
yenidən baxılması və təkmilləşdirilməsi tələb olunur.
Bu tədqiqat biliyin əldə edilməsi prosesinin asanlaşdırılması üçün TBB konsepsiyasının
reallaşdırılması və inkişafına yönəlmişdir. Müəlliflər ümid edirlər ki, TBB və LBB tədqiqatçıları
biliyin əldə edilməsinin avtomatlaşdırılması üsullarının daha da yaxşılaşdırılması üzrə
imkanların araşdırılmasında əməkdaşlıq edəcəklər.
Nəticə
Terminoloji informatika sahəsində aparılan elmi-nəzəri araşdırmaların təhlili terminoloji
biliklər bazasının üstünlüklərini və perspektivlərini ortaya çıxarır. Terminoloji verilənlər
bazasının ciddi elmi tədqiqatların aparılması vasitəsinə çevrilməsi onun böyük praktiki
əhəmiyyətini göstərir və bu istiqamətdə tədqiqatların perspektivliyinə zəmin yaradır.
Bu səbəbdən, dünyada terminologiya fəaliyyətinə istər nəzəri, istərsə də praktiki cəhətdən
böyük diqqət ayrılır. Belə ki, elmi, texniki və iqtisadi fəaliyyətin müvəffəqiyyəti dəqiq işlənmiş
terminologiyadan əhəmiyyətli dərəcədə asılıdır.
Yuxarıda
qeyd
edilənlər
Azərbaycanda
müasir
informasiya-kommunikasiya
texnologiyalarının imkanlarından istifadə etməklə terminologiya fəaliyyətinin yeni informasiya
modelinin – terminoloji informasiya sisteminin işlənməsini zəruri edir.
Ədəbiyyat
1.
Danzin A. Strategic Planning Study Group: Towards a European Language Infrastructure,
Why terminology?, 1992,
http://www.computing.surrey.ac.uk/ai/-pointer/report/section1.html
2.
Хохлова Е.Л. Содержание терминологического поля в многоязычной терминографии:
Применительно к исторической терминологии в английском, французском, немецком
и русском языках, 2005, 236 стр., http://www.dissercat.com
3.
Меркель С.Э. Семантико-дистрибутивная верификация терминологического знака,
Волгоград
,
2001, http://31f.ru/dissertation
4.
First Workshop on Computational Terminology, University of Montreal (Canada), 1998,
http://perso.limsi.fr/jacquemi/COMPUTERM/coling-workshop.html
5.
Second International Workshop on Computational Terminology, Association for
Computational Linguistics, Stroudsburg, PA, http://dl.acm.org/citation.cfm?id=111877
6.
CompuTerm 2004 - 3rd International Workshop on Computational Terminology,
Proceedings
of
the
Workshop,
29
August
2004,
Geneva,
Switzerland.
http://acl.ldc.upenn.edu/coling2004/W7/pdf/proceedings.pdf
7.
COLING 2014, the 25th International Conference on Computational Linguistics,
Helix
Conference Centre at Dublin City University (DCU), 23-29 August 2014, http://www.coling-
2014.org
8.
13th International Conference on Intelligent Text Processing and Computational Linguistics,
March 11–17, 2012, Indian Institute of Technology Delhi, New Delhi, India,
http://www.cicling.org/2012
9.
Recent advances in computational terminology. Edited
by Bourigault D., Jacquemin C.,
L'Homme
M.-C.
John
Benjamins
Publishing,
2001,
379
pages,
http://benjamins.com/#catalog/books/nlp.2
10.
Cabré M.T. Terminology: theory, methods, and applications. Terminology and Lexicography
Research and Practice, 1, John Benjamins Publishing, 1999, 248 p.
11.
Kageura K. The Dynamics of Terminology, Terminology and Lexicography Research and
Practice, 5, John Benjamins Publishing, 2002, 322 p.
12.
A Practical Guide to Lexicography. Edited by Sterkenburg P. V. Terminology and
Lexicography Research and Practice, 6, John Benjamins Publishing, 2003, 460 p.
İnformasiya cəmiyyəti problemləri, 2013, №2(8), 13-20
20 www.jpis.az
13.
Indeterminacy in Terminology and LSP. Edited by Antia B. Terminology and Lexicography
Research and Practice, 8, John Benjamins Publishing, 2007, 236 p.
14.
Alexander Gelbukh (Ed.). Computational Linguistics and Intelligent Text Processing, 5th
International Conference, CICLing 2004, Seoul, Korea, February 15-21, 2004, Proceedings,
Series: Lecture Notes in Computer Science, Vol. 2945, 2004, XVIII, 651 p.
15.
Gómez-Pérez A., Fernández-López M., Corcho O. Ontological Engineering: With Examples
from the Areas of Knowledge Management, E-Commerce and the Semantic Web, Springer,
2004, 403 p.
16.
Bangalore
S.
Short
biography,
http://www.research.att.com/people/Bangalore_
Srinivas/index.html
17.
Moens M.-F. Short biography, http://people.cs.kuleuven.be/~sien.moens
18.
Ahmad K. Short biography
, http://www.tcd.ie/Neuroscience/partners/PI%20Profiles/
Khurshid_Ahmad2.php
19.
Meyer I., Skuce D., Bowker L., Eck K. Towards a New Generation of Terminological
Resources:
An
Experiment
in
Building
a
Terminological
Knowledge
Base,
http://acl.ldc.upenn.edu/C/C92/C92-3146.pdf
20.
Boguraev B., Levin B. Models for Lexical Knowledge Bases, in J. Pustejovsky, ed.,
Semantics and the Lexicon, Kluwer, Dordrecht, Also appears in Electronic Text Research,
Proceedings of the Sixth Annual Conference of the Centre for the New OED, University of
Waterloo, Waterloo, Ontario, 1990, 65-78 pp.
УДК 004.65:006.72
Гурбанова Афруз М.
Институт Информационных Технологий НАНА, Баку, Азербайджан
afruz@iit.ab.az
Научно-теоретические исследования в области вычислительной терминологии и их
анализ
Изучены исследования в области нового направления информатики и терминологии –
вычислительной терминологии, проведен их анализ. Исследован международный опыт в
создании терминологической базы знаний. Обоснована необходимость разработки новой
модели терминологической деятельности в Азербайджане с использованием
возможностей современных информационных технологий.
Ключевые слова: вычислительная терминология, вычислительная лингвистика,
онтология, лексическая база данных, лексическая база знаний, терминологическая база
данных, терминологическая база знаний.
Afruz M. Gurbanova
Institute of Information Technology ANAS, Baku, Azerbaijan
afruz@iit.ab.az
Scientific and theoretical research conducted in the field of terminological informatics and
its comparative analysis
The researches in a new direction of terminology and informatics (computer science), i.e.
terminological informatics are studied, their comparative analysis conducted. International
experience in developing terminological knowledge base is studied. Development of a new
model of terminological activities in Azerbaijan using capabilities of modern information-
communication technologies is proposed.
Keywords: computational terminology, computational linguistics, ontology, lexical database,
lexical knowledge base, terminological database, terminological knowledge base.
Dostları ilə paylaş: |