semantička načela. Krylova M.N. Funkcionalno-semantička analiza kao osnova za sustavno proučavanje jezičnih jedinica. Funkcionalno-semantička kategorija usporedbe

semantička načela.  Krylova M.N.  Funkcionalno-semantička analiza kao osnova za sustavno proučavanje jezičnih jedinica.  Funkcionalno-semantička kategorija usporedbe
semantička načela. Krylova M.N. Funkcionalno-semantička analiza kao osnova za sustavno proučavanje jezičnih jedinica. Funkcionalno-semantička kategorija usporedbe

Riječ semantika dolazi iz starogrčkog jezika: σημαντικός sēmantikos, što znači „značajan“, a kao pojam prvi ju je upotrijebio francuski filolog i povjesničar Michel Breal.

Semantika je znanost koja proučavanje značenja riječi(leksička semantika), mnoga pojedinačna slova (u starim alfabetima), rečenice - semantičke fraze i tekstovi. Bliska je drugim disciplinama kao što su semiologija, logika, psihologija, teorija komunikacije, stilistika, filozofija jezika, lingvistička antropologija i simbolička antropologija. Skup pojmova koji imaju zajednički semantički faktor naziva se semantičko polje.

Što je semantika

Ova znanost proučava jezično i filozofsko značenje jezika, programskih jezika, formalne logike, semiotike i provodi analizu teksta. Vezano je za:

  • sa znakovnim riječima;
  • riječi;
  • fraze;
  • znakovi;
  • simboli i što oni znače, njihova oznaka.

Problem razumijevanja bio je predmet mnogih istraživanja tijekom dužeg vremenskog razdoblja, ali su se tim pitanjem bavili uglavnom psiholozi, a ne lingvisti. Ali samo u lingvistici proučavanje tumačenja znakova ili simbola koriste se u zajednicama pod određenim okolnostima i kontekstima. U ovom prikazu zvukovi, izrazi lica, govor tijela i proksemija imaju semantički (smisleni) sadržaj, a svaki od njih uključuje nekoliko grana. U pisanom jeziku stvari poput strukture odlomka i interpunkcije sadrže semantički sadržaj.

Formalna analiza semantike preklapa se s mnogim drugim područjima studija, uključujući:

  • leksikologija;
  • sintaksa;
  • pragmatika;
  • etimologija i drugi.

Nepotrebno je reći da je definicija semantike također dobro definirano područje za sebe, često sa sintetičkim svojstvima. U filozofiji jezika, semantika i referenca su usko povezani. Daljnja srodna područja uključuju filologiju, komunikaciju i semiotiku.

Semantika je u suprotnosti sa sintaksom, proučavanjem kombinatorike jedinica jezika (bez osvrta na njihovo značenje) i pragmatikom, proučavanjem odnosa između simbola jezika, njihovog značenja i korisnika jezika. Područje proučavanja u ovom slučaju također ima značajne veze s različitim reprezentacijskim teorijama značenja, uključujući prave teorije značenja, teorije povezanosti značenja i teorije korespondencije značenja. Svaki od njih povezan je s općim filozofskim proučavanjem stvarnosti i prezentacijom značenja.

Lingvistika

U lingvistici je semantika potpolje posvećeno proučavanju značenja, svojstvene razinama riječi, fraza, rečenica i širih jedinica diskursa (analiza teksta ili naracije). Proučavanje semantike također je usko povezano s predmetima reprezentacije, reference i označavanja. Glavno istraživanje ovdje je usmjereno na proučavanje značenja znakova i proučavanje odnosa između različitih jezičnih jedinica i složenica kao što su:

  • homonimija;
  • sinonimija;
  • antonimija
  • metonimija;

Ključni problem je kako dati više značenja velikim dijelovima teksta kao rezultat sastava manjih jedinica značenja.

Montagijska gramatika

Kasnih 1960-ih Richard Montague (semantička wikipedia) predložio je sustav za definiranje semantičkih zapisa u smislu lambda računa. Montagu je pokazao da se značenje teksta kao cjeline može rastaviti na značenja njegovih dijelova iu relativno malim pravilima kombinacije. Koncept takvih semantičkih atoma ili primitiva je temeljan za jezik misaone hipoteze 1970-ih.

Unatoč svojoj eleganciji, Montaguova gramatika bila je ograničena varijabilnosti ovisnom o kontekstu u smislu riječi i dovela je do nekoliko pokušaja uključivanja konteksta.

Prema Montagueu, jezik nije skup oznaka pričvršćenih na stvari, već skup alata čiji su elementi važni u načinu na koji funkcioniraju, a ne u njihovoj vezanosti za stvari.

Specifičan primjer ovog fenomena je semantička višeznačnost, značenja nisu potpuna bez nekih elemenata konteksta. Nijedna riječ nema značenje koje se može identificirati bez obzira što se još nalazi u njezinoj blizini.

Formalna semantika

Izvedeno iz djela Montagua. Visoko formalizirana teorija semantike prirodnog jezika u kojoj se izrazima dodjeljuju oznake (značenja) kao što su pojedinci, vrijednosti istine ili funkcije od jednog do drugog. Istinitost rečenice, i što je još zanimljivije, njezin logički odnos s drugim rečenicama, tada se procjenjuje u odnosu na tekst.

Prava uvjetna semantika

Još jedna formalizirana teorija koju je stvorio filozof Donald Davidson. Cilj ove teorije je povezujući svaku rečenicu prirodnog jezika s opisom uvjeta pod kojima je istinita, na primjer: "snijeg je bijel" je istina ako i samo ako je snijeg bijel. Izazov je doći do pravih uvjeta za bilo koju rečenicu od fiksnih značenja dodijeljenih pojedinim riječima i fiksnih pravila za njihovo kombiniranje.

U praksi je uvjetna semantika analogna apstraktnom modelu; konceptualno se, međutim, razlikuju po tome što istinska uvjetna semantika nastoji povezati jezik s iskazima o stvarnom svijetu (u obliku metajezičkih iskaza), a ne s apstraktnim modelima.

Pojmovna semantika

Ova teorija je pokušaj da se objasni svojstva strukture argumenta. Pretpostavka iza ove teorije je da sintaktička svojstva fraza odražavaju značenja riječi koje ih vode.

Leksička semantika

Jezična teorija koja istražuje značenje riječi. Ova teorija to razumije značenje riječi u potpunosti se odražava u njezinu kontekstu. Ovdje značenje riječi leži u njenim kontekstualnim odnosima. To jest, svaki dio rečenice koji ima smisla i kombinira se sa značenjima drugih komponenti označava se kao semantička komponenta.

Računalna semantika

Računalna semantika usmjerena je na obradu jezičnog značenja. Za to su opisani specifični algoritmi i arhitektura. Unutar tog okvira analiziraju se i algoritmi i arhitekture, u smislu rješivosti, složenosti vremena/prostora, potrebnih struktura podataka i komunikacijskih protokola.

Umjetna semantika je skupina ključnih riječi i fraza za pretraživanje za kreiranje sadržaja, t.j. stvaranje semantičke jezgre, koji može privući pozornost na sadržaj ili povećati promet na web resursu itd. Uglavnom, umjetna semantika ili semantika teksta koristi se za kreiranje sadržaja, oglašavanja.

Semantika online

U informatici pojam semantika odnosi se na značenje jezičnih konstrukcija, za razliku od njihovog oblika (sintakse). Ona osigurava pravila za tumačenje sintakse, što ne daje izravno vrijednost, ali ograničava moguća tumačenja onoga što je deklarirano. U ontološkoj tehnologiji, ovaj se pojam odnosi na značenje pojmova, svojstava i odnosa koji formalno predstavljaju objekte, događaje i scene stvarnog svijeta u logičkom pristupu, kao što je logika opisa koja se obično provodi na Internetu.

Značenje pojmova logike opisa i uloga određeno je njihovom modelsko-teorijskom semantikom temeljenom na interpretacijama. Koncepti, svojstva i odnosi definirani u ontologijama mogu se primijeniti izravno u označavanju web stranice, u bazama podataka grafova u obliku okidača. Semantika programskih jezika i drugih jezika važan je problem i područje proučavanja u informatici. Razvijeni su različiti načini opisivanja programskih jezika koji se formalno temelje na matematičkoj logici.

Semantički modeli

Online semantika odnosi se na širenje World Wide Weba kroz implementacija dodanih metapodataka korištenjem metoda semantičkog modeliranja podataka. U semantičkom webu termini kao što su semantička mreža i semantički model podataka koriste se za opisivanje specifičnih tipova modela podataka koje karakterizira korištenje usmjerenih grafova, u kojima vrhovi označavaju koncepte ili entitete svijeta i njihova svojstva, a lukovi odnose između ih.

Na webu su malobrojne analize riječi, strukture poveznica i dekompozicije weba i uključuju dio, vrstu i slične veze. U automatiziranim ontologijama, reference se računaju kao vektori bez eksplicitnog značenja. Razvijaju se različite automatizirane tehnologije za izračunavanje značenja riječi: latentno semantičko indeksiranje i strojevi za vektorsku podršku, kao i obrada prirodnog jezika, neuronske mreže i metode predikatnog računa.

Psihologija

U psihologiji, semantičko pamćenje je pamćenje za značenje – drugim riječima, aspekt sjećanja koji zadržava samo suštinu, opće značenje zapamćenog iskustva, dok je epizodna memorija sjećanje na efemerne detalje - pojedinačne značajke ili jedinstvene značajke iskustva. Izraz "epizodična memorija" skovali su Tulvig i Schacter u kontekstu "deklarativnog pamćenja", što je uključivalo jednostavno zbrajanje činjeničnih ili objektivnih informacija o objektu.

Sjećanja se mogu prenositi kroz generaciju ili izolirana unutar jedne generacije zbog kulturnih poremećaja. Različite generacije mogu imati različita iskustva u sličnim točkama u svojim vremenskim linijama. To može stvoriti vertikalno heterogenu semantičku mrežu za određene riječi u homogenoj kulturi.

Zašto značenje zanima filozofe i psihologe i zašto se smatra kontroverznim „problemom“, nije teško razumjeti. Razmislite o naizgled nevinom pitanju: "Što znači riječ krava "krava"?". Naravno, ovo nije neka posebna životinja. Možda je onda čitava klasa životinja kojoj dajemo naziv krava "krava"? Sve su krave različite na ovaj ili onaj način; i u svakom slučaju, nitko ne poznaje i ne bi mogao poznavati sve pripadnike klase krava, ali bi se ipak željelo misliti da znamo značenje riječi krava, te da je možemo ispravno koristiti kada se govori o određenim životinjama koje smo nikad prije nisam vidio. Postoji li jedno ili više svojstava koja razlikuju krave od svih drugih objekata koje nazivamo drugačije? Rasuđujući na ovaj način, upadamo u filozofski spor između "nominalista" i "realista" koji se u ovom ili onom obliku nastavlja od Platonovog vremena do danas. Imaju li stvari koje nazivamo istim imenom neka zajednička "bitna" svojstva po kojima se mogu identificirati (kako bi rekli "realisti"), ili nemaju ništa zajedničko jedno s drugim, osim imena, koji običaj jesmo li se naučili primijeniti na njih (kako bi "nominalist" mogao reći)? A krava nije posebno težak slučaj. Jer može se uzeti zdravo za gotovo da se krave mogu definirati u smislu biološke klasifikacije rod-vrsta. Ali što je s riječju stol "stol"? Stolovi dolaze u različitim oblicima i veličinama, izrađeni su od raznih materijala i koriste se u razne svrhe. Ali stolovi su, barem fizički, vidljivi i opipljivi objekti; a za njih je moguće sastaviti neki popis definirajućih karakteristika. Ali što je s riječima kao što su istina "istina", ljepota "ljepota", dobrota "ljubaznost, dobra kvaliteta" itd.? Imaju li sve ove stvari koje opisujemo kao "lijepe" ili "dobre" neko zajedničko svojstvo? Ako je tako, kako ga identificirati i opisati? Možda bi trebalo reći da je značenje takvih riječi kao što su istina, ljepota i dobrota "pojam" ili "ideja" povezana s njima u "umovima" govornika dotičnog jezika,^ i općenito da su "značenja " su "koncepti" ili "ideje"? Reći ovo znači ponovno zalaziti u filozofske i psihološke sporove, jer mnogi filozofi i psiholozi vrlo sumnjaju u mogućnost postojanja pojmova (ili čak "uma"). Ali čak i ako te poteškoće ostavimo po strani ili ih odbijemo razmotriti, otkrit ćemo da postoje i druga pitanja povezana sa značenjem i više ili manje filozofske prirode. Ima li smisla reći da je netko upotrijebio riječ koja ima drugačije značenje od onoga što znači riječ "stvarno"? Postoji li uopće "pravo" ili "ispravno" značenje riječi?

9.1.4. VRIJEDNOST "VRIJEDNOSTI"

Do sada smo govorili samo o značenjima riječi. Za rečenice smo također rekli da imaju značenje. Je li izraz "značenje" ovdje korišten u istom smislu? Inače, često kažemo da rečenice i kombinacije riječi jesu ili nisu „smislene“, ali obično ne kažemo da riječi nisu „smislene“. Je li onda moguće ukazati na razliku, a možda i cijeli niz razlika, između pojmova "biti smislen" i "imati značenje"? O ovim i mnogim drugim srodnim pitanjima više puta su raspravljali filozofi i lingvisti. Već je postalo istinito u izlaganju semantičke teorije skrenuti pozornost na višestruka značenja "značenja".

Uz filozofska pitanja postoje ona koja su izravno povezana s kompetencijom jezikoslovca. Filozofi, poput "prvog dolaza", obično uzimaju "riječi" i "rečenice" zdravo za gotovo. Lingvist to ne može. Riječi i rečenice za njega su prvenstveno jedinice gramatičkog opisa; uz njih se prepoznaju i druge gramatičke jedinice. Lingvist mora razmotriti opće pitanje o tome kako su gramatičke jedinice raznih vrsta povezane s jedinicama semantičke analize. Posebno mora ispitati pitanje treba li napraviti razliku između "leksičkog" i "gramatičkog" značenja.

Do sada nitko nije predstavio, barem u općem obliku, zadovoljavajući i razumna teorija semantika. I to treba jasno prepoznati u svakoj raspravi o problemima ove discipline. Međutim, nepostojanje koherentne i cjelovite teorije semantike ne znači da do sada nije napravljen nikakav napredak na području teorijskog proučavanja značenja. U nastavku donosimo kratak pregled najvažnijih dostignuća jezikoslovaca i filozofa posljednjih godina.

Semantiku smo već privremeno definirali kao znanost o značenju; a ova je definicija jedina stvar koja spaja svu semantiku. Čim se počnemo upoznavati s određenim semantičkim djelima, susrećemo se s toliko raznolikim pristupima definiranju i uspostavljanju značenja da zbunjuje neiskusnog čitatelja. Razlikuju se između "emocionalnog" i "konceptualnog" značenja, između "značenja" (značenja) i "značenja" (značenja), između "performativnog" i "opisnog" značenja, između "značenja" i "reference", između "denotata" " i "konotacija", između "znakova" i "simbola", između "proširenja" i "intenzije", između "implikacije", "posljedice" i "pretpostavke", između "analitičkog" i "sintetičkog" itd. terminologija semantike je bogata i potpuno zbunjujuća, budući da se uporaba pojmova od strane različitih autora razlikuje u nedostatku bilo kakve dosljednosti i jednoobraznosti. Zbog toga pojmovi koje uvodimo u ovom poglavlju neće nužno imati isto značenje kao u drugim radovima posvećenim semantici.

Počinjemo s kratkom kritikom tradicionalnog pristupa definiranju značenja.

9.2. TRADICIONALNA SEMANTIKA

9.2.1. IME STVARI

Tradicionalna gramatika temeljila se na pretpostavci da je riječ (u smislu "značenja"; usp. § 5.4.4) osnovna jedinica sintakse i semantike (usp. također § 1.2.7 i § 7.1.2). Riječ se smatrala "znakom" koji se sastoji od dva dijela; nazvat ćemo te dvije komponente oblik riječi i njegove vrijednost. (Podsjetimo da je ovo samo jedno od značenja koje izraz "oblik" ima u lingvistici; "oblik" riječi kao "znaka" ili leksičke jedinice mora se razlikovati od specifičnih "slučajnih" ili flekcijskih "oblika" u koja se riječ pojavljuje u rečenicama; usp. § 4.1.5.) Vrlo rano u povijesti tradicionalne gramatike pojavilo se pitanje odnosa između riječi i "stvari" na koje su se odnosile ili "označavale". Starogrčki filozofi iz vremena Sokrata, a nakon njih i Platona, formulirali su ovo pitanje u terminima koji se od tada uobičajeno upotrebljavaju u raspravi. Za njih je semantički odnos koji se odvija između riječi i "stvari" bio onaj "imenovanja"; a onda se pojavio sljedeći problem: imaju li "imena" koja dajemo "stvarima" "prirodno" ili "konvencionalno" porijeklo (usp. § 1.2.2). Kako se tradicionalna gramatika razvijala, postalo je uobičajeno razlikovati značenje riječi i "stvari" ili "stvari" koje se danom riječi "imenuju", "nazivaju". Srednjovjekovni su gramatičari ovu razliku formulirali ovako: oblik riječi (onaj dio dictio koji je okarakteriziran kao vox) označava "stvari" pomoću "koncepta" povezanog s oblikom u glavama govornika tog jezika; a ovaj koncept je značenje riječi (njezino značenje). Ovaj koncept ćemo smatrati tradicionalnim pogledom na odnos između riječi i "stvari". Kao što je već spomenuto, ovo je gledište, u načelu, bilo temelj filozofske definicije "dijelove govora" u skladu s za njih "metodama označavanja" (usp. § 1.2.7.) Ne ulazeći u detaljno izlaganje tradicionalne teorije "značenja", napominjemo samo da je terminologija korištena u ovoj teoriji nije isključio mogućnost dvosmislene, ili nepodijeljene, upotrebe izraza "označiti" (označiti): moglo bi se reći da oblik riječi "označava" "pojam" pod koji se "stvari" podvode ("apstrahiranjem" " od njihovih "slučajnih" svojstava); također bi se moglo reći da "označava" same "stvari". Što se tiče odnosa između "pojmova" i "stvari", ovo je, naravno, bilo predmetom značajnih filozofskih kontroverzi (razlike između "nominista" i "realista" posebno su upečatljive; usp. § 9.1.3). Ovdje možemo zanemariti te filozofske razlike.

9.2.2. REFERENCA

Ovdje je korisno uvesti suvremeni izraz za označavanje "stvari", razmatranih sa stajališta "imenovanja", "imenovanja" ih riječima. Ovo je izraz referent. Reći ćemo da je odnos koji se odvija između riječi i stvari (njihovih referenta) odnos reference (povezanost): riječi korelirati sa stvarima (i nemojte ih "označiti" ili "imenovati"). Ako prihvatimo razliku između oblika, značenja i referenta, tada možemo dati dobro poznati shematski prikaz tradicionalnog pogleda na odnos među njima u obliku trokuta (ponekad nazvanog "semiotički trokut"), prikazanog na sl. . 23. Isprekidana crta između forme i referenta označava da je odnos između njih neizravan; oblik je povezan sa svojim referentom kroz posredničko (pojmovno) značenje koje je povezano sa svakim od njih neovisno. Dijagram jasno ilustrira važnu točku da je u tradicionalnoj gramatici riječ rezultat kombiniranja određenog oblika s određenim značenjem.

Već smo spomenuli filozofske i psihološke sporove o statusu "pojmova" i "ideja" u "um" (usp. §9.1.3). Tradicionalna semantika uzdiže postojanje "pojmova" na princip svih teorijskih konstrukcija i stoga (gotovo neizbježno) potiče subjektivizam i introspekciju u proučavanju značenja. Kao što Haas piše, "empirijska znanost ne može se u potpunosti osloniti na metodu istraživanja koja se sastoji od ljudi koji promatraju u svojim mislima, svaki u svom vlastitom umu." Ova kritika sugerira usvajanje stajališta da je semantika, ili bi trebala biti, empirijska znanost, a to je gledište poželjno, koliko je to moguće, a ne vezano uz takva kontroverzna filozofska i psihološka pitanja kao što je razlika između "tijela" i "duha" ili status "koncepti". Pridržavat ćemo se ovog stajališta kada razmatramo semantiku u ovim poglavljima. Treba, međutim, naglasiti da metodološko odbacivanje "mentalizma" ne znači prihvaćanje "mehanizma", kako smatraju neki lingvisti. Bloomfieldova "mehanistička" i "pozitivistička" definicija značenja riječi kao cjelovitog "znanstvenog" opisa njenog referenta više je štetna za napredak u području semantike nego tradicionalna definicija u smislu "koncepta", budući da je Bloomfieldova definicija preferencijalno usredotočuje se na relativno mali skup riječi unutar rječnika prirodnih jezika, riječi koje odgovaraju "stvarima" koje se u načelu mogu opisati pomoću fizikalnih znanosti. Štoviše, počiva na dvije implicitne i neutemeljene pretpostavke: (i) da je "znanstveni" opis referenta ovih riječi povezan s načinom na koji govornici određenog jezika koriste te riječi (većina govornika ima malo pojma o "znanstveni" opis); (ii) da se značenje svih riječi može sažeti u iste pojmove. Istina je da se može smatrati da Bloomfieldov pristup (koji se nalazi i kod drugih pisaca) ovisi o "realističkom" pogledu na odnos između jezika i "svijeta", gledištu koje se ne razlikuje mnogo od onog mnogih "konceptualista"; barem implicira pretpostavku da jednom postoji, na primjer, riječ inteligencija "um, intelekt, mentalne sposobnosti", onda postoji i nešto na što se odnosi (a to "nešto" bi trebalo biti na zadovoljavajući način opisano sredstvima "znanosti" u vremenu); budući da postoji riječ ljubav "ljubav, voljeti", postoji i nešto, na što se riječ odnosi, itd. Stav koji lingvist mora zauzeti je onaj koji je neutralan u odnosu na "mentalizam" i "mehanizam" - stav koji je u skladu s oba gledišta, ali ne podrazumijeva nijedno od njih.

9.2.7. "OSTENZIVNA" DEFINICIJA

Prethodni odlomak implicitno sadrži još jednu kritiku tradicionalne semantike (kao i nekih modernih teorija). Već smo vidjeli da pojam "značenje" u svojoj uobičajenoj upotrebi ima mnoga "značenja". Kada nekome postavimo pitanje – „Što znači ta riječ x? - u svakodnevnom (ne filozofskom i ne visokospecijaliziranom) razgovoru dobivamo (i to nas nimalo ne čudi) odgovore koji se razlikuju po obliku, ovisno o okolnostima i situaciji u kojoj postavljamo ovo pitanje. Ako nas zanima značenje riječi na jeziku koji nije naš, onda je odgovor na naše pitanje najčešće prijevod. (“Prijevod” se dotiče svih vrsta problema od semantičkog interesa, ali ih za sada nećemo doticati; usp. § 9.4.7.) Za nas je sada situacija očitija kada pitamo o značenjima riječi u naš vlastiti jezik (ili drugi jezik, koji "znamo", barem "djelomično", - općenito pojam " potpuno znanje jezik" je, naravno, fikcija). Pretpostavimo da želimo znati značenje riječi krava u nevjerojatnoj (ali prikladnoj za naše potrebe) situaciji u kojoj postoji nekoliko krava na obližnjoj livadi. Moglo bi nam se reći: “Vidiš li one životinje tamo? Ovo su krave." Ovaj način prenošenja značenja riječi krava "krava" uključuje element onoga što filozofi nazivaju ostenzivna definicija. (Ostenzivna (vizualna) definicija je takva definicija kada izravno "ukazuje" na odgovarajući objekt.) Ali ostenzivna definicija sama po sebi nikada nije dovoljna, budući da osoba koja tumači ovu "definiciju" prije svega mora znati značenje “pokazujuća” gesta u danom kontekstu (i da zna da je govornikova namjera upravo dati “definiciju”) i, što je još važnije, mora ispravno identificirati objekt na koji “pokazuje”. U slučaju našeg hipotetskog primjera, riječi te životinje "te životinje" ograničavaju mogućnost pogrešnog razumijevanja. (Ne eliminiraju ga u potpunosti; ali pretpostavit ćemo da je "definicija" značenja krave interpretirana na zadovoljavajući način.) Teorijsko značenje ovog previše pojednostavljenog i prilično nerealnog primjera ima dva aspekta: prvo, pokazuje poteškoću u objašnjavanju značenje bilo koje riječi bez upotrebe drugih riječi kako bi ograničili i učinili eksplicitnijim "polje" "indikacije" (on potvrđuje ideju da je vjerojatno nemoguće utvrditi, a možda čak i znati, značenje jedne riječi bez poznavanja značenja drugim riječima, s kojim je "povezan"; na primjer, krava "krava" povezana je sa životinjskom "životinjom"); drugo, ostenzivna definicija odnosi se samo na relativno mali skup riječi. Zamislite, na primjer, uzaludnost pokušaja da se na ovaj način objasni značenje riječi istinito "ispravno, istinito", lijepo "lijepo, lijepo, veličanstveno" itd.! Značenje takvih riječi obično se objašnjava, iako ne uvijek uspješno, pomoću sinonima (pretpostavlja se da su značenja već poznata osobi koja postavlja pitanje) ili pomoću prilično dugih definicija tipa koji se obično daje u rječnicima. I opet, ovdje se jasno očituje neizbježna kružnost semantike: u rječniku ne postoji niti jedna točka koja se može uzeti kao polazište i iz koje se može izvesti smisao svega ostalog. Ovaj problem "kružnosti" bit će razmotren u nastavku (usp. § 9.4.7).

9.2.8. KONTEKST

Još jedna značajka svakodnevnih situacija u kojima se nalazimo kada pitamo o značenju riječi je da nam se često kaže: "Ovisi o kontekstu." (“Dajte mi kontekst u kojem ste naišli na tu riječ i ja ću vam objasniti njezino značenje.”) Često je nemoguće odrediti značenje riječi bez “stavljanja u kontekst”; a korisnost rječnika u izravnom je razmjeru s brojem i raznolikošću "konteksta" koji su u njima navedeni kod riječi. Često (a to je možda i najčešći slučaj) značenje riječi objašnjava se na sljedeći način: daje se "sinonim" koji ukazuje na "kontekstualna" ograničenja koja reguliraju upotrebu dotične riječi (dodano: "pokvareno (o jajima )"; užeglo: "pokvareno (o maslacu)" itd.). Činjenice kao što su raznolikost načina na koje u praksi određujemo značenje riječi, "kružnost" rječnika i bitna uloga "konteksta" ne dobivaju puno teorijsko priznanje u tradicionalnoj semantici.

9.2.9. "ZNAČENJE" I "UPOTREBA"

Ovdje možemo spomenuti poznatu i vrlo popularnu Wittgensteinovu parolu: "Ne tražite značenje riječi, tražite njezinu upotrebu." Izraz "uporaba" sam po sebi nije jasniji od pojma "značenje"; ali zamjenom jednog termina drugim, semantičar napušta tradicionalnu tendenciju definiranja 'značenja' u terminima 'značenja'. Wittgensteinovi vlastiti primjeri (u njegovom kasnijem djelu) pokazuju da su, kako je on to vidio, "uporabe" u kojima se riječi pojavljuju u jeziku najrazličitije prirode. Nije iznio (i nije deklarirao svoju namjeru da iznese) teoriju "upotrebe" riječi kao teoriju semantike. Ali vjerojatno imamo pravo iz Wittgensteinove programske izjave izdvojiti sljedeća načela. Jedini test primjenjiv na proučavanje jezika je "korištenje" jezičnih iskaza u raznim situacijama. Svakidašnjica. Izrazi kao što su "značenje riječi" i "značenje rečenice (ili prijedloga)" su u opasnosti da budu zavedeni jer nas navode da tražimo "značenja" koja imaju i identificiramo njihova "značenja" s entitetima kao što su kao fizički objekti, "koncepti" dani "umu", ili "situacije" (stanja stvari) u fizičkom svijetu.

Nemamo izravne dokaze o razumijevanju izjava, već imamo podatke o njima. nesporazumi(nesporazum) - kada se nešto "poremeti" u procesu komunikacije. Ako, na primjer, nekome kažemo donesi mi crvenu knjigu koja je na stolu gore "donesi mi crvenu knjigu koja je na stolu gore", a on nam donese knjigu druge boje, ili kutiju umjesto knjigu, ili siđe dolje u potragu za knjigom, ili učini nešto sasvim neočekivano, onda sasvim opravdano možemo reći da je “pogrešno razumio” cijelu ili dio naše izjave (moguća su i druga objašnjenja, naravno). Ako učini ono što se od njega očekuje (pođe u pravom smjeru i vrati se s pravom knjigom), onda možemo reći da je ispravno shvatio izjavu. Želimo naglasiti da (u ovakvom slučaju) postoje prima facie “bihevioralne” činjenice koje ukazuju da nije bilo nesporazuma. Sasvim je moguće da ako bismo nastavili vrlo ustrajno testirati njegovo "razumijevanje" riječi donijeti "donesi" ili crveno "crveno" ili knjiga "knjiga", onda bi došao trenutak kada bi nešto što je učinio ili rekao otkrilo da je njegov "razumijevanje" ovih riječi donekle je drugačije od našeg, da on izvodi zaključke iz izjava koje sadrže te riječi koje mi ne izvodimo (ili obrnuto, da zaključujemo koje on ne izvodi), ili da ih koristi za oznake za nešto drugačija klasa predmeta ili radnji. Normalna komunikacija temelji se na pretpostavci da svi "razumijemo" riječi na isti način; ova se pretpostavka s vremena na vrijeme prekrši, ali ako se ne dogodi, činjenica "razumijevanja" se uzima zdravo za gotovo. Imamo li ili nemamo iste "koncepte" u našim "umovima" kada razgovaramo jedni s drugima, pitanje je na koje se ne može odgovoriti osim u smislu "korištenja" riječi u iskazima. Tvrdnja da svi istu riječ "shvaćaju" na malo različite načine vjerojatno je točna, ali prilično besmislena. Semantika se bavi objašnjavanjem stupnja jednoobraznosti u "korištenju" jezika koji omogućuje normalnu komunikaciju. Nakon što napustimo stajalište da je "značenje" riječi ono što ona "označava", sasvim prirodno prepoznajemo da se moraju uspostaviti određeni odnosi različitih vrsta kako bi se objasnila "uporaba". Dva "faktora" koje treba razlikovati su referenca(o čemu smo već raspravljali gore) i značenje(osjećaj).

9.2.10. NEDETERMINISTIČKA VRIJEDNOST

Dakle, predlažemo da se napusti stajalište da je "značenje" riječi ono što ona "znači", a u procesu komunikacije to "označeno" govornik "prenosi" (u određenom smislu) slušatelju; prilično smo se spremni složiti da determinizam (određenost) značenja riječi nije ni nužan ni poželjan. Kao što smo vidjeli, upotreba jezika u normalnim situacijama može se objasniti na temelju mnogo slabije pretpostavke, naime da među govornicima određenog jezika postoji suglasnost o "upotrebi" riječi (na što se one odnose, na što znače itd.) dovoljno da se otkloni "nesporazum". Ovaj zaključak se mora imati na umu u svakoj analizi "značenja" riječi i rečenica. Uzet ćemo to zdravo za gotovo u narednim odjeljcima ova dva poglavlja o semantici.

O takvim društveno propisanim izjavama potrebno je dati još dvije primjedbe kao što je Kako ste? "Zdravo!". Obično imaju karakter "gotovih" formacija, odnosno uče ih izvorni govornici kao neanalizirane cijele cjeline i, sasvim je očito, ne rekonstruiraju se u svakom pojedinom slučaju kada se koriste u okolnostima koje nakon Fursa, možemo nazvati "tipični događaji koji se ponavljaju u lancu društveni proces". Budući da su takve prirode, moglo bi ih se objasniti u terminima "bihevioralne" koncepcije: dotični iskazi mogli bi se opisati kao "uvjetne reakcije" na situacije u kojima se javljaju. Ovu činjenicu semantičar ne smije zanemariti. Velik dio naše svakodnevne upotrebe jezika sasvim je adekvatno opisan u "bihevioralnim" terminima i može se povezati s činjenicom da "igramo" određene "uloge" u procesu implementacije društveno propisanih, "ritualnih" obrazaca ponašanja. Gledano s gledišta ovog aspekta upotrebe jezika, ljudski pojedinci pokazuju ponašanje slično onom mnogih životinja, čiji se "komunikacijski sustavi" sastoje od skupa "gotovih izjava" korištenih u određenim situacijama. Tipičniji ljudski aspekti jezičnog ponašanja, koji ovise o generativnim svojstvima jezika, kao i o semantičkim predodžbama o značenju, referenci i značenju, ne mogu se uvjerljivo objasniti proširivanjem na njih "biheviorističkih" pojmova "stimulans" i "odgovor". Međutim, istina je da ljudski jezik uključuje i "bihevioralnu" komponentu. Iako o tome nećemo dalje govoriti u nastavku, teoretski bismo tu istinu trebali prepoznati ovdje.

9.3.7. FATIČKA ZAJEDNOST

S tim u vezi, potrebno je spomenuti i onaj aspekt jezičnog ponašanja na koji je B. Malinovsky upotrijebio termin "fatička komunikacija". Skrenuo je pozornost na činjenicu da se mnogim našim iskazima pogrešno pripisuje kao jedina ili glavna funkcija prenošenje ili traženje informacija, izdavanje naredbi, izražavanje nada, potreba i želja, ili čak "izražavanje emocija" (u nejasnom smislu u kojem stručnjaci u semantici često koriste ovaj posljednji izraz); zapravo služe uspostavljanju i održavanju osjećaja društvene solidarnosti i društvenog samoodržanja. Mnoge "gotove" izjave poput Kako ste? "Halo!", društveno propisano u određenim kontekstima, može obavljati upravo tu funkciju "fatične komunikacije". No, postoje mnoge druge izjave koje su govornici više-manje slobodno konstruirani, ali istovremeno prenose informaciju i služe u svrhu „fatičke komunikacije“. Primjer bi bio izraz It "s another beautiful day" Opet lijep dan, izgovoren (pretpostavkom) kao prva fraza u razgovoru između kupca i trgovca. Jasno je da glavna funkcija ove izjave nije "prenijeti" trgovcu koje informacije o vremenu; ovo je jasan primjer "fatične" komunikacije." Međutim, u isto vrijeme, ovaj izričaj ima drugačije značenje od nebrojenih drugih iskaza koji bi se mogli pojaviti u ovom kontekstu i mogli bi jednako dobro služe svrhama 'fatičke' komunikacije. komunikacija"; a sljedeći "korak" u razgovoru obično se povezuje s tim pojedinim iskazom na temelju njegovog značenja. Stoga moramo razlikovati taj aspekt " korištenje" iskaza koji se mogu pripisati provedbi "fatičke komunikacije" i onog dijela koji se mora izdvojiti kao njihovo značenje (ako imaju značenje u smislu naše definicije.) Ali to prepoznajemo čak i kada je iskaz iskazan. Oba ova aspekta svojstvena su iskazu, dominantan dio "upotrebe" iskaza može biti ili prvi ili drugi aspekt. Malinowski je pretjerivao kada je tvrdio da je prijenos informacija jedna od "najperifernijih i visokospecijaliziranih funkcija" jezika.

9.3.8. PROŠIRENJE KONCEPTA "POSJEDAVANJE ZNAČENJA" NA SVE JEZIČNE JEDINICE

Do sada smo ilustrirali pojam smisla samo u odnosu na čitave prijedloge, koji se smatraju nerazložljivim jedinicama. Sada ćemo nastaviti s izjavama, a ne rečenicama, i nastaviti se pozivati ​​na intuitivni pojam "konteksta"; ali sada ćemo generalizirati pojam postojanja značenja u smislu sljedećeg principa: svaki jezični element koji se pojavljuje u iskazu ima značenje, osim ako nije potpuno unaprijed određen ("obavezan") u danom kontekstu.

Jasno je da se pojam posjedovanja značenja (kako je ovdje definirano) primjenjuje na sve razine analize iskaza, uključujući i fonološku razinu. Na primjer, postoji mnogo konteksta u kojima bi se riječi janje "janje" i ovan "ovan" mogle koristiti s istim uspjehom, a odgovarajuće izjave mogu se razlikovati samo u tim riječima. Budući da su ti iskazi naizgled različiti po značenju (referenti riječi janje i ovan su različiti i, općenito govoreći, implikacije "sadržane" u odgovarajućim iskazima su različite), fonemi /l/ i /r/ ne samo da imaju značenje, ali u ovim rečenicama imaju različita značenja. Postoje i drugi iskazi koji sadrže riječi osim janjeta i ovna u kojima se razlika u značenju može izraziti isključivo fonološkom opozicijom /l/ - /r/. Kao što smo vidjeli u prethodnom poglavlju (usp. § 3.1.3), fonološka struktura pojedinih jezika u konačnici počiva na moći diferencijacije fonema (točnije, na diferenciranoj moći njihovih "razlikovnih značajki"), ograničenoj određene granice koje nameće dodatni princip fonetske sličnosti. Postoje, dakle, dobri razlozi za primjenu pojma imanja značenja čak i na razini fonološke analize. Vrijedi napomenuti, međutim, da u slučaju fonetski različitih, ali "sličnih" glasova, značenje nužno podrazumijeva drugačije značenje, barem u nekim kontekstima. Na "višim" razinama to nije slučaj. Kada je riječ o jezicima u kojima se pojavljuju glasovi [l] i [r], ali nikada ne razlikuju iskaze, kažemo da su u tim jezicima naznačeni glasovi u odnosu dodatne distribucije ili slobodne varijacije (drugim riječima , da su alternativne fonetske realizacije iste fonološke jedinice, usp. § 3.3.4). U onim kontekstima u kojima glasovi govora koji se inače razlikuju kao zasebne fonološke jedinice imaju isto značenje, razumno se mogu okarakterizirati kao sinonimi. Primjeri su početni samoglasnici u alternativnom izgovoru riječi ekonomija (suprotan slučaj je razlika u kvaliteti istih samoglasnika u taktu /bi:t/ : bet /bet/ itd.) ili kontroverzni naglasni obrazac: kontroverza.

Iako semantičar teoretski mora prepoznati načelo primjenjivosti vlasništva nad značenjima na fonološkoj razini, u svom praktičnom radu obično se ne bavi značenjem fonoloških jedinica. Razlog je taj što fonološke jedinice nikada nemaju objektivnu korelaciju i ne ulaze ni u kakve semantičke odnose, osim u odnose istosti i razlike značenja. Štoviše, odnos istovjetnosti značenja, kada se javlja između fonoloških jedinica (fonološka "sinonimija" kako je gore ilustrirano), sporadičan je i nesistemski. Mora se opisati u smislu alternativnih pravila provedbe za pojedine riječi; nakon što se ova pravila steknu, ništa drugo nije potrebno. Općenito govoreći (posebno treba spomenuti slučaj "zvučnog simbolizma" - semantički zanimljivog fenomena koji ovdje nećemo razmatrati zbog ograničenih mogućnosti; usp. § 1.2.2), "značenje" dane fonološke jedinice je jednostavno svoju različitost od svih ostalih fonoloških jedinica (ako ih ima) koje bi se mogle pojaviti u istom kontekstu.

9.3.9. OGRANIČENI KONTEKSTI

Sada se možemo obratiti na razliku između iskaza i rečenica (usp. § 5.1.2). Treba imati na umu dvije točke. Prvi. Kada koristimo jezik za međusobnu komunikaciju, ne pravimo rečenice, već iskaze; takvi se iskazi izriču u određenim kontekstima i ne mogu se razumjeti (čak i unutar granica utvrđenih za tumačenje pojma "razumijevanje"; usp. § 9.2.9) bez poznavanja relevantnih kontekstualnih značajki. Štoviše, tijekom razgovora (pretpostavimo da je riječ o razgovoru), kontekst se neprestano razvija, u smislu da „upija“ iz onoga što je rečeno i što se događa sve što je bitno za proizvodnju i razumijevanje naknadnih izjave. Ekstremni slučaj konteksta koji nisu "razvijeni" u tom smislu bili bi oni u kojima se sudionici razgovora ne oslanjaju na prethodno znanje jedni o drugima, niti na "informacije" sadržane u prethodno izgovorenim izjavama, ali u kojima se više koriste opća mišljenja, običaje i pretpostavke koje prevladavaju u ovoj posebnoj "sferi diskursa" iu ovom društvu. Takvi konteksti – nazvat ćemo ih ograničeni konteksti(ograničeni konteksti) - relativno su rijetki, budući da razumijevanje većine izjava ovisi o informacijama sadržanim u prethodnim izjavama. Ne smijemo izgubiti iz vida odnos između izjava i konkretnih konteksta.

Druga je točka da, budući da govornici nikada ne proizvode rečenice (budući da su rečenice teorijske jedinice koje su uspostavili lingvisti da opisuju distributivna ograničenja na pojavu klasa gramatičkih elemenata), ne može postojati izravni odnos između rečenica i određenih konteksta. Istodobno, iskazi imaju gramatičku strukturu koja ovisi o njihovom "izvođenju" iz rečenica, a gramatička struktura iskaza je ili može biti semantički relevantna. To je osobito jasno u slučaju sintaktičke "dvosmislenosti" (usp. § 6.1.3). Štoviše (s izuzetkom takvih "gotovih" izraza kao što je Kako radiš? "Zdravo!"), izgovore proizvode govornici, a slušatelji ih razumiju na temelju pravilnosti u konstrukciji i u transformacijama koje su dane rečenicama gramatičkim pravilima . U današnje vrijeme, ni lingvistika, niti bilo koja druga od znanosti koja se bavi "mehanizmima" koji su u osnovi proizvodnje iskaza, nije u poziciji dati bilo kakve jasne tvrdnje o tome kako točno znanje o apstraktnim odnosima koje se odvijaju između gramatičkih elemenata u rečenicama, stupa u interakciju s različitim svojstvima konteksta, što rezultira formiranjem i razumijevanjem iskaza u kojima se nalaze “korelati” tih gramatičkih elemenata. Sama činjenica da postoji određena interakcija između gramatičke strukture jezika i relevantnih kontekstualnih značajki čini se nedvojbenom i tu činjenicu moramo uzeti u obzir.

Budući da općenito ne možemo identificirati niti stvarne elemente koje govornik "odabire" u procesu formiranja iskaza, niti sve relevantne značajke konkretnih konteksta, možemo kao metodološku odluku uzeti načelo koje lingvisti obično slijede u praksi, a naime, razmotriti semantičke odnose među iskazima u smislu semantičkih odnosa koji se odvijaju između rečenica, na temelju kojih se često smatra da su iskazi „stvoreni“ kada ih proizvedu izvorni govornici u ograničenim kontekstima. (Pojam "ograničenog konteksta" još uvijek se mora zadržati, jer, kao što ćemo vidjeti u nastavku, ne možemo formulirati semantičke odnose koji se odvijaju između rečenica bez uzimanja u obzir, barem u maloj mjeri, "kontekstualizacije"; usp. § 10.1.2.) Svojstva pojedinih konteksta tada će biti pozvana (u onome što se, barem za sada, može okarakterizirati kao ad hoc opis) kako bi se objasnili "rezidualni" semantički relevantni aspekti iskaza. Ono što smo ovdje prikazali kao svjesno, metodološko rješenje, međutim, ne treba shvatiti kao da želimo naglasiti primat gramatičkog nad kontekstualnim u psihološkim procesima proizvodnje i razumijevanja iskaza.

9.3.10. ELEMENTI DUBOKE STRUKTURE IMAJU VRIJEDNOST U REČENICAMA

Sada možemo primijeniti pojam "imati značenje" na gramatičke elemente iz kojih se generiraju rečenice pomoću pravila koja reguliraju konstrukciju i transformaciju njihovih osnova (usp. § 6.6.1). Budući da posjedovanje značenja podrazumijeva "izbor", slijedi da nikakvi elementi koji se unose u rečenice pomoću obvezujućih pravila ne mogu imati značenje u našem smislu. (Takvi "fiktivni" elementi kao što su do (pomoćni glagol) u Želite li ići? "Želite li ići?" nemaju značenje; usp. § 7.6.3.) Štoviše, ako pretpostavimo da su svi "izbori" napravljeno u odnosu na odabir elemenata u "dubokoj" strukturi (ovi elementi su ili "kategorije" ili "obilježja"; usp. § 7.6.9), postat će jasno da koncept postojanja značenja nije vezan za jedinice bilo kojeg određenog ranga. Prvo, razgraničenje u jeziku takvih jedinica kao što su morfemi, riječi i skupine riječi (fraze) u određenoj se mjeri temelji na "površinskoj" strukturi (§ 6.6.1); i drugo, postoje mnoge "gramatičke kategorije" (vreme, raspoloženje, aspekt, rod, broj, itd.; usp. § 7.1.5) koje se mogu ili ne moraju realizirati u morfemima ili riječima, ali koje čine sustave "izbora "u rečenicama. Pitanje može li se ili ne može biti napravljena stroga razlika između "leksičkih" i "gramatičkih" značenja, uzimajući u obzir točno koja značenja elementi imaju, raspravljat će se u nastavku (usp. § 9.5.2). Ovdje je dovoljno primijetiti da se pojam posjedovanja značenja jednako primjenjuje na obje vrste elemenata u "dubokoj" strukturi rečenice. Štoviše, ovaj koncept se, eksplicitno ili implicitno, uzima u obzir u svim najnovijim lingvističkim teorijama. Klase elemenata (označene ili pomoćnim ili terminalnim simbolima - usp. § 6.2.2) uspostavljaju se na svakoj točki "izbora" u procesu generiranja rečenice.

Iz rečenog proizlazi da nijedan element u rečenici nema smisla osim ako nije član jedne od sintaktički definiranih klasa u "dubokoj" strukturi rečenice: i upravo ta činjenica opravdava pretpostavku, gotovo univerzalnu lingvisti, logičari i filozofi, da je skup elemenata, koji imaju značenje u nekom određenom jeziku, barem u vrlo visokoj mjeri, razmjeran skupovima krajnjih "sastavnica" i "obilježja" ovog jezika. Međutim, iz ovoga ne proizlazi da će svaka "komponenta" i svaki "znak" imati značenje u svakoj rečenici u kojoj se pojavljuju. Ovu važnu točku lingvisti ponekad zanemaruju i stoga zaslužuje detaljnije razmatranje.

Cijeli se problem svodi na razliku između gramatičke i semantičke prihvatljivosti. Kao što smo vidjeli u prethodnom poglavlju (usp. § 4.2.12 i dalje), gramatičnost je onaj aspekt prihvatljivosti prijedloga koji se može objasniti u smislu pravila konstrukcije i transformacije koja određuju dopuštene kombinacije distributivnih klasa elemenata (“kategorije” i “znakovi”) u rečenicama. Općenito se vjeruje da gramatika bilo kojeg jezika generira, posebice, beskonačan broj rečenica koje su neprihvatljive u različitim aspektima; i postalo je tradicionalno opisivati ​​barem jednu vrstu neprihvatljivosti karakterizirajući dotične prijedloge kao "besmislene" ili "bez sadržaja". Neka sljedeće rečenice budu generirane gramatikom engleskog jezika (i stoga budu gramatički točne):

(a) Ivan pije mlijeko (pivo, vino, vodu, itd.) "Ivan pije mlijeko (pivo, vino, vodu, itd.)"

(b) Ivan jede sir (ribu, meso, kruh, itd.) "Ivan jede sir (ribu, meso, kruh, itd.)"

(c) Ivan pije sir (ribu, meso, kruh, itd.)

(d) Ivan jede mlijeko (pivo, vino, vodu itd.) "Ivan jede mlijeko (pivo, vino, vodu, itd.)."

Pretpostavimo, nadalje, da su sve ove rečenice pri generiranju opskrbljene istim strukturnim opisom: da glagoli piti "piti" i jesti "jesti, jesti", kao i imenice mlijeko "mlijeko", pivo "pivo", vino " vino", voda "voda", sir "sir", riba "riba", meso "meso", kruh "kruh" itd. u leksikonu se ne razlikuju nikakvim relevantnim sintaktičkim obilježjima. Očito, uz određeno razumijevanje pojmova "prihvatljivo" i "neprihvatljivo", izjave izvedene iz rečenica grupiranih u klase (a) i (b) su prihvatljive, dok su izjave izvedene iz rečenica uključenih u skupine (c) i (d) neprihvatljivo (pod "prirodnim" okolnostima). Ako ovu vrstu prihvatljivosti i neprihvatljivosti opisujemo oslanjajući se na kriterij „smislenosti“ (u smislu ovog pojma, koji predlažemo izdvojiti pojmom „značajnost“), ovo ćemo pitanje razmotriti nešto kasnije. . Ovdje želimo naglasiti da su skupovi elemenata koji se mogu pojaviti i koji imaju značenje glagola i objekta u ovim rečenicama vrlo ograničeni podskupovi onih skupova elemenata koji su dopušteni pravilima gramatike. I ovdje je ekstremni slučaj kada je pojava elementa u potpunosti određena kontekstom koji se sastoji od ostalih elemenata rečenice. Primjer potpune predodređenosti na ovoj razini je pojava riječi zubi "zubi" u Ugrizao sam ga svojim umjetnim zubima "Ugrizao sam ga svojim umjetnim zubima." Kao što ćemo vidjeti u nastavku (usp. § 9.5.3), ova rečenica pokazuje semantički zanimljiv tip sintagmatske "pretpostavke" koja je obično implicitna, ali koja se može učiniti eksplicitnom kada se njezin "sintaktički odraz" pojavi u rečenici. ' kao 'definicija' (u ovom primjeru lažni 'umetnuti'). Ako se riječ zubi nikada ne pojavljuje u rečenicama osim u onima u kojima je u potpunosti određena svojim kontekstom, onda u engleskom jeziku ne bi imala značenje, a semantičar ne bi imao što reći o tome.

Svrha naše rasprave bila je pokazati kako se točno pojam smisla može i treba prenijeti s razine prilično “konkretnih” slučajeva, kada se radi, s jedne strane, o gramatički ispravnim, nestrukturiranim cjelovitim iskazima, a s jedne strane s druge strane, iskazi, koji se minimalno razlikuju u svojoj fonološkoj strukturi, na "apstraktniju" razinu, gdje se primjenjuje na važniju i mnogo veću klasu rečenica generiranih gramatičkim pravilima. U prilog pojmu posjedovanja značenja ide činjenica da odražava intuitivno jasan princip da "smislenost implicira izbor" u specifičnim kontekstima. Njegov prijenos na "apstraktniju" razinu temelji se na metodološkoj odluci, čija motivacija ima dva aspekta: prvo, ova odluka prepoznaje činjenicu da se specifične kontekstualne značajke koje utječu na proizvodnju i interpretaciju iskaza mogu opisati samo ad hoc; i drugo, ovaj pristup na zadovoljavajući način povezuje semantičku interpretaciju rečenica s njihovim sintaktičkim opisom. Ako se ustanovi da neki određeni element ima značenje unutar određene klase rečenica, onda se možemo zapitati kakvo značenje ima taj element; a na to se pitanje može odgovoriti na različite načine, kao što ćemo vidjeti u sljedećem odjeljku.

9.3.11. "ZNAČAJ"

Sada se moramo kratko zadržati na pojmu "značaja" (usp. § 9.3.1). Na prvi pogled čini se razumnim željeti izjednačiti valjanost s potpunom prihvatljivošću u odnosu na specifične kontekste u slučaju izjava i u odnosu na generaliziranije ograničene kontekste u slučaju rečenica. No, već smo vidjeli da postoje mnogi slojevi prihvatljivosti (koji se nalaze "iznad" gramatičkog sloja), koji se, iako se često bez kvalifikacije opisuju kao "semantički", ipak mogu razlikovati od onoga što se tradicionalno naziva "sadržaj" ili "značaj". . » (usp. § 4.2.3). Neke izjave mogu biti osuđene kao "blasfemične" ili "opscene"; drugi mogu biti prihvatljivi u određenim uporabama jezika (molitve, mitovi, bajke, znanstvena fantastika, itd.), ali nisu prihvatljivi u svakodnevnom razgovoru. Teško da je vrijedno pokušavati definirati "značaj" na način koji bi obuhvatio sve te razne "dimenzije" prihvatljivosti. Uzmimo za primjer slučaj iz engleskog, iako se glagol die "umrijeti" slobodno koristi u kombinaciji s živim imenicama, uključujući imena osoba, postoji općeprihvaćeni tabu na engleskom koji zabranjuje njegovu upotrebu u kombinaciji s mojim ocem " moj otac", moja majka "moja majka", moj brat "moj brat" i moja sestra "moja sestra" (odnosno u odnosu na najbliže članove govornikove obitelji); stoga bi se moj otac umro sinoć smatrao neprikladnim, ali ne i Njegov otac je sinoć umro "Njegov otac je umro sinoć". Tada bi, očito, ispravno objašnjenje neprihvatljivosti rečenice Moj otac je umro sinoć trebalo biti takvo da možemo reći, prvo, da je "značajna", jer će se, upotrijebljena protivno tabuu, razumjeti (u zapravo, moglo bi se tvrditi da sam tabu ovisi o mogućnosti razumijevanja ove rečenice), i, drugo, da je semantička relacija između Moj otac je sinoć umro i Njegov otac je umro sinoć identična odnosu između Moj otac je sinoć umro „Sinoć je došao moj otac“ i sinoć je došao njegov otac „Sinoć je došao njegov otac“ itd. Tradicionalno, značenje gramatički ispravnih rečenica objašnjava se u smislu određenih općih principa kompatibilnosti „značenja“ njihovih sastavnih elemenata . Moglo bi se, na primjer, reći da su rečenice Ivan jede mlijeko "Ivan jede mlijeko" i Ivan pije kruh "Ivan pije kruh" besmislene, jer je glagol jesti "jesti" kompatibilan samo s imenicama (u objektnoj funkciji) koje označavaju tvrde jestive tvari, te glagol piti "piti" - uz imenice koje označavaju tekuće tvari pogodne za ljudsku prehranu. (Imajte na umu da bi se s ove točke gledišta, rečenica Ivan jede juhu "John jede juhu" mogla smatrati semantički anomalnom, koja ima "društvenu prihvatljivost" samo zbog posebnog dogovora izvan općih pravila za tumačenje engleskih rečenica.) poteškoće ( mogli bismo tvrditi, na primjer, da je Ivan jede mlijeko "smislena" rečenica, iako su okolnosti pod kojima bi se mogla koristiti pomalo neobične). Ipak, čini se da je tradicionalno tumačenje ovog koncepta u smislu "kompatibilnosti" u osnovi razumno. Neke od najnovijih formulacija ovog koncepta bit će obrađene u sljedećem poglavlju (usp. § 10.5.4).

9.4.1. REFERENCA

Pojam "referenca" ("korelacija") uveden je ranije za odnos koji se odvija između riječi, s jedne strane, i stvari, događaja, radnji i kvaliteta koje one "zamjenjuju" - s druge strane (usp. §9.2 .2). Gore je spomenuto da, pod određenim uvjetima, na pitanje „Što je značenje riječi x? može se odgovoriti uz pomoć "ostenzivne" definicije - pokazivanjem ili na neki drugi način izravnim naznačavanjem referent(ili referenti) određene riječi (usp. § 9.2.7). Postoje određene filozofske poteškoće povezane s točnom definicijom pojma "referenca", koje se ovdje mogu zanemariti. Uzmimo u obzir da se odnos reference (ponekad nazvan "denotacija") nužno mora uzeti u obzir u izgradnji bilo koje zadovoljavajuće teorije semantike; drugim riječima, u određenom smislu može se reći da se barem neke jedinice vokabulara na svim jezicima mogu uskladiti s jednim ili drugim "vlasništvom" fizičkog svijeta.

Pretpostavka koju smo postavili ne znači da referencu smatramo semantičkom relacijom na koju se mogu svesti svi ostali odnosi; niti se misli na to da sve rječničke jedinice jezika imaju referencu. "Referenca", kako se razumije u ovom radu, nužno je povezana s početnim pretpostavkama o "postojanju" (ili "stvarnosti"), koje proizlaze iz naše izravne percepcije objekata u fizičkom svijetu. Kada se kaže da određena riječ (ili druga značenja) "odgovara nekom objektu", znači da je referent riječi predmet koji "postoji" (je "stvaran") u istom smislu u kojem kažemo da određeni ljudi, životinje i stvari "postoje"; također se podrazumijeva da bi u načelu bilo moguće dati opis fizikalnih svojstava predmeta koji se razmatra. Ovaj pojam "fizičkog postojanja" može se smatrati temeljnim za definiciju semantičkog odnosa reference. Korištenje pojmova "postojanje" i "referenca" može se tada proširiti na nekoliko načina. Na primjer, iako na svijetu ne postoje takvi objekti kao što su kolačići, jednorozi ili kentauri (takva će biti naša pretpostavka), bilo bi sasvim razumno pripisati im imaginarno ili mitsko "postojanje" u određenoj vrsti razmišljanja; i tako možemo reći da riječi goblin "brownie", unicorn "unicorn" ili centaur "centaur" imaju referencu na engleskom (unutar odgovarajućeg obrazloženja). Slično, možemo proširiti upotrebu pojmova "egzistencija" i "referenca" na takve teorijske konstrukcije znanosti kao što su atomi, geni itd., pa čak i na potpuno apstraktne objekte. Važno je, međutim, napomenuti da se izvor ovih "analognih" proširenja pojmova "postojanja" i "reference" može pronaći u njihovoj temeljnoj ili primarnoj primjeni na fizičke objekte tijekom "svakodnevne" upotrebe. Jezik.

Iz ovog tumačenja pojma reference proizlazi da u rječniku jezika može postojati mnogo jedinica koje nisu povezane odnosom reference s bilo kojim entitetima izvan jezika. Na primjer, netko bi mogao pomisliti da ne postoje stvari poput inteligencije ili ljubaznosti kojima odgovaraju riječi inteligentan i dobar, iako psiholog ili filozof uvijek može pretpostaviti postojanje takvih entiteta unutar neke određene teorije psihologije ili etike, pa čak i tvrditi da se njihova "stvarnost" može demonstrirati nekom vrstom "ostenzivne" definicije. Činjenica da na različitim razinama ovakvih sofističkih konstrukcija mogu nastati nesuglasice između njihovih autora oko "stvarnosti" određenih imaginarnih "predmeta", ne mijenja se. opći položaj ta referenca pretpostavlja postojanje. Uzalud bi bilo inzistirati da sve leksičke jedinice moraju nešto biti u korelaciji, ako imamo na umu da se u određenim slučajevima ne može iznijeti nikakav drugi dokaz postojanja tog “nečega”, osim same činjenice prisutnosti neke leksičke jedinice koja “korespondira” s tim “nešto”.

U vezi s konceptom reference mogu se uočiti još dvije točke. Slažući se da se određene leksičke jedinice odnose na objekte i svojstva objekata izvan jezika, nismo vezani logičkom neizbježnošću zaključiti da svi objekti označeni nekom određenom riječi tvore "prirodnu klasu" (bez obzira na "konvenciju", prešutno prihvaćenu od strane članova određene govorne skupine kako bi se ti objekti podveli "pod" neki opći pojam); drugim riječima, gore opisani položaj kompatibilan je s "nominalizmom" ili "realizmom" u filozofskoj semantici. Drugo, referenca određene leksičke jedinice ne mora biti precizna i potpuno definirana u smislu da je uvijek jasno da li određeni objekt ili svojstvo spada ili ne spada u opseg dane leksičke jedinice: već smo vidjeli da takva pretpostavka nije potrebna.kako bi se objasnilo "razumijevanje" izjava u normalnoj komunikaciji (usp. § 9.2.9). Često su "referentne granice" leksičkih jedinica neodređene. Na primjer, nemoguće je naznačiti dobro definiranu točku na kojoj moramo povući demarkacijsku crtu između referenci riječi brdo "brdo, brdo, brdo" i planina "planina", piletina "kokoš; kokoš; mladi pijetao; piletina; piletina" i kokoš "piletina" , zeleno "zeleno" i plavo "plavo; plavo, azurno; plavkasto" itd. Ali to ne znači da se koncept reference ne odnosi na takve riječi. karakteristično obilježje jezika je to što oni stvarnom svijetu nameću neku leksičku "kategorizaciju" i, takoreći, povlače "proizvoljne" granice na raznim mjestima. Kao što ćemo vidjeti, to je jedan od razloga zašto je često nemoguće uspostaviti leksičke ekvivalencije između različitih jezika. Činjenica da su "referentne granice" "proizvoljne" i neodređene obično ne dovodi do kršenja razumijevanja, budući da je "točno" podvođenje objekta "pod" jednu ili drugu leksičku jedinicu vrlo rijetko relevantno; a kada je to relevantno, okrećemo se drugim sustavima identifikacije ili specifikacije. Na primjer, ako želimo označiti jednu od dvije osobe, od kojih bi se svaka mogla nazvati ili riječju djevojka "djevojka" ili riječju žena "žena", možemo ih razlikovati jednu od druge po imenu, po relativnoj dobi, po kosi boja, način na koji su odjeveni i sl. Iako se referenti riječi djevojka "sijeku" s referentima riječi žena, te dvije riječi nisu sinonimi; njihov je relativni položaj na dobnoj ljestvici fiksan, a postoji mnogo slučajeva u kojima je samo jedna od njih prikladna riječ za korištenje. "Netočnost" reference koju smo ilustrirali, iako uopće nije nedostatak u jeziku (kako misle neki filozofi), čini jezik učinkovitijim sredstvom komunikacije. Apsolutna "točnost" je nedostižna, budući da nema ograničenja u broju i prirodi razlika koje se mogu povući između različitih objekata; i jedva da postoji ikakva zasluga u nasilnom povlačenju više razlika nego što je potrebno za sadašnje svrhe.

9.4.2. OSJEĆAJ

Sada moramo uvesti koncept "značenja". Pod, ispod značenje riječ se odnosi na svoje mjesto u sustavu odnosa u koji ulazi s drugim riječima u rječniku jezika. Jasno, budući da značenje mora biti definirano u smislu odnosa koji se odvijaju između rječničkih jedinica, ono ne nosi nikakve temeljne pretpostavke o postojanju objekata ili svojstava izvan rječnika dotičnog jezika.

Ako se dva elementa mogu pojaviti u istom kontekstu, onda oni imati značenje u ovom kontekstu; i dalje, možemo se zapitati da li Što je značenje oni imaju. Kao što smo vidjeli, jedan dio ili komponenta značenja određenih elemenata može se opisati u smislu njihove reference. Bez obzira imaju li dva elementa referencu ili ne, možemo se zapitati imaju li, u kontekstu ili kontekstima u kojima se oba pojavljuju, isto značenje ili ne. Budući da je ista vrijednost - sinonimija- postoji odnos koji se odvija između dvije (ili više) jedinica vokabulara, povezan je sa značenjem, a ne s referencom. Iz razloga koje ovdje ne moramo razmatrati, ponekad bi moglo biti zgodno reći da dvije jedinice imaju istu referencu, ali se razlikuju po značenju; i, naravno, prirodno je reći da jedinice mogu biti sinonimne čak i ako su nereferencijalne. Može se pretpostaviti da je (za jedinice koje imaju referencu) identitet reference nužan, ali ne i dovoljan uvjet za sinonimiju.

Teorijska obrada sinonimije često je neadekvatna zbog dviju neopravdanih pretpostavki. Prvi od njih je da dva elementa ne mogu biti "apsolutno sinonimna" u jednom kontekstu osim ako nisu sinonimna u svim kontekstima. Ovaj zaključak se ponekad opravdava upućivanjem na razliku između "konceptualnog" i "emocionalnog" značenja. Ali sama ova razlika treba opravdanje. Ne može se poreći da je izbor konkretnog govornika jedne cjeline, a ne nekog drugog, određen "emocionalnim asocijacijama". Međutim, to ne znači da su "emocionalne asocijacije" uvijek relevantne (čak i ako su zajedničke svim članovima govorne skupine). A među premise se ne može jednostavno uključiti tvrdnja da riječi uvijek nose "asocijacije" koje se izvode iz njihove upotrebe u drugim kontekstima. Stoga ćemo odbaciti pretpostavku da riječi ne mogu biti sinonimne u određenim kontekstima osim ako nisu sinonimne u svim kontekstima.

Druga pretpostavka koju često postavlja semantika je da je sinonimija odnos identiteta između dva (ili više) neovisno definiranih osjetila. Drugim riječima, pitanje jesu li dvije riječi - a i b - sinonimi, svodi se na pitanje označavaju li a i b istu bit, isto značenje. U okviru pristupa semantici koji ocrtavamo u ovoj knjizi, neće biti potrebno postulirati postojanje neovisno definiranih značenja. Sinonimija će se definirati na sljedeći način: dvije (ili više) jedinica su sinonimne ako rečenice nastale zamjenom jedne jedinice drugom imaju isto značenje. Ova se definicija eksplicitno temelji na apriornom pojmu "istog značenja" za rečenice (i iskaze). Kasnije ćemo se vratiti na ovo pitanje. Ovdje samo želimo naglasiti ideju da se odnos sinonimije definira kao odnos koji se odvija između leksičkih jedinica, a ne između njihovih značenja. Sinonimnost leksičkih jedinica dio je njihova značenja. Ista ideja može se formulirati u općenitijem obliku: ono što nazivamo značenjem leksičke jedinice je cijeli skup semantičkih odnosa(uključujući sinonimiju), u kojoj ulazi s drugim jedinicama u rječniku jezika.

9.4.3. PARADIGMATSKI I SINTAGMATSKI OSJETLJIV ODNOSI

Osim sinonimije, postoje i mnogi drugi semantički odnosi. Na primjer, muž "muž" i žena "žena" nisu sinonimi, ali su semantički povezani na način koji ne stoji između muža i sira "sira" ili vodika "vodika"; dobar "dobar" i loš "loš" različiti su po značenju, ali su bliži od dobrog i crvenog "crvenog" ili okruglog "okrugla"; knock "kuc; udari", bang "udari, kuc; pljesak; tutnjava", tap "lagano udari, kuc" i rap "lagano pogodi; kuc, kucni" povezani su odnosom koji ne vrijedi za riječi kucati i jesti "jesti, jesti, jesti "ili se diviti" diviti se. Ovdje ilustrirani odnosi su paradigmatičan(svi članovi skupova semantički povezanih pojmova mogu se pojaviti u istom kontekstu). Riječi se također mogu povezati jedna s drugom sintagmatski; usporedi: plavuša "plava" i kosa "dlaka", lavež "laj" i pas "pas", udarac nogom "udarac, udarac, udarac" i stopalo "noga" itd. (Opća načela za razlikovanje paradigmatskih i sintagmatskih odnosa, v. § 2.3.3.) Ovdje nećemo razmatrati pitanje mogu li se ti sintagmatski i paradigmatski odnosi (kako sugeriraju neki semantičari) definirati u smislu njihove "udaljenosti" od sinonimije na skali značenja sličnosti i razlike: alternativa pristup tome bit će opisan u sljedećem poglavlju. Ovdje jednostavno pretpostavljamo da su barem neka područja vokabulara podijeljena na leksičkim sustavima i što semantička struktura ovih sustava treba opisati u smislu semantičkih odnosa koji se odvijaju između leksičkih jedinica. Ovu izjavu smatramo rafiniranom formulacijom načela prema kojem je “vrijednost svake jedinice funkcija mjesta koje zauzima u odgovarajućem sustavu” (usp. § 2.2.1, gdje ruski i engleski pojmovi srodstva uspoređuju se).

Posljednjih godina dosta se radilo na proučavanju leksičkih sustava u rječniku raznih jezika, posebice u odnosu na takve polja(ili područja), kao što su srodstvo, boja, flora i fauna, težina i mjere, vojni činovi, moralne i estetske ocjene, kao i razne vrste znanja, vještina i razumijevanja. Rezultati su još jednom pokazali vrijednost strukturalnog pristupa semantici i potvrdili predviđanja znanstvenika poput Humboldta, Saussurea i Sapira da rječnici različitih jezika (barem u određenim područjima) nije izomorfna da postoje semantičke razlike u jednom jeziku, a ne u drugom; štoviše, kategorizacija određenih polja po različitim jezicima može se provesti na različite načine. Izražavajući ovu činjenicu u Saussureanskim terminima, kaže se da svaki jezik nameće specifičnost oblik do a priori nediferencirane tvar plan sadržaja (usp. § 2.2.2 i § 2.2.3). Da bismo ilustrirali ovaj koncept, možemo uzeti (kao supstanciju) polje boje i vidjeti kako se ovaj koncept tretira, ili "oblikuje", na engleskom jeziku.

Radi jednostavnosti, prvo ćemo razmotriti samo onaj dio polja koji je prekriven riječima crvena "crvena", narančasta "narančasta", žuta "žuta", zelena "zelena" i plava "plava; plava, azurna; plavkasto". Svaki od ovih pojmova referencijalno je neprecizan, ali je njihov relativni položaj u ovom leksičkom sustavu fiksan (i općenito pokrivaju većinu vidljivog spektra): narančasta je između crvene i žute, žuta je između narančaste i zelene, itd. e. Značenje svake od ovih riječi uključuje naznaku da pripadaju ovom određenom leksičkom sustavu engleskog jezika i da su u tom sustavu u međusobnom odnosu u odnosu (ili, možda točnije, "biti između "). Može se činiti da je pojam značenja ovdje suvišan i da bi za opisivanje njihovog značenja bilo sasvim dovoljno uzeti u obzir referencu svake od oznaka boja. Razmotrite, međutim, uvjete pod kojima osoba može znati (ili se može smatrati da zna) referencu ovih riječi. Dijete koje uči engleski ne može prvo steći referencu riječi zeleno, a zatim, redom, referencu riječi plavo ili žuto, kako bi se u određenom trenutku moglo reći da zna referencu jedne riječi, ali ne poznaje referencu drugog. (Naravno, korištenjem ostenzivne metode definicije mogao je znati da se riječ zeleno odnosi na boju trave ili lišća određenog stabla, ili na boju jedne od majčinih haljina: ali riječ zeleno ima šira referenca od bilo koje njegove posebne upotrebe, a poznavanje njegove reference također uključuje poznavanje granica te reference.) Mora se pretpostaviti da tijekom određenog vremenskog razdoblja dijete postupno uči položaj riječi zeleno u odnosu na riječi plavo i žuto, te riječ žuto u odnosu na riječi zeleno i narančasto i tako dalje, sve dok ne zna položaje svakog pojma u boji u odnosu na susjeda u datom leksičkom sustavu i približan prolaz granica tog područja u kontinuumu zadanog polja, koje pokriva svaka riječ. Njegovo znanje o značenju izraza u boji stoga nužno uključuje poznavanje i njihovog značenja i njihove reference.

Područje koje pokriva pet gore navedenih oznaka boja može se zamisliti kao nediferencirana (perceptivna ili fizička) tvar, kojoj engleski jezik nameće neki specifičan oblik povlačeći granice na određenim mjestima, te primjenjuje određenu leksičku klasifikaciju na pet područja tako dobiveni (nazivajući ih riječima crvena, narančasta, žuta, zelena i plava). Često se primjećuje da drugi jezici ovoj tvari nameću drugačiji oblik, odnosno prepoznaju u njoj različit broj regija i povlače granice na drugim mjestima. O gornjem primjeru možemo reći da su ruske riječi plava i plava zajedno pokrivaju približno isto područje kao engleska riječ blue; označavajući posebne, iako susjedne boje i zauzimajući ravnopravan položaj u sustavu s riječima zelena i žuta boja, ne treba ih smatrati riječima koje označavaju različite nijanse iste boje na isti način na koji grimizni "crimson" i grimizni "grimiz" zajedno s drugim riječima dijele područje koje pokriva riječ crveno na engleskom (usp. § 2.2 .3) .

Odnos između pojmova u boji i njihovog značenja ne može se prikazati tako jednostavno kao što smo to dosad činili. Razlika u referencama riječi crveno, narančasto, žuto, zeleno i plavo može se opisati u smislu varijacije tonovima(refleksije svjetlosti različitih valnih duljina). Fizičari razlikuju dvije druge varijable kada analiziraju boju: gospodstvo, ili svjetlina (reflektirajući više ili manje svjetla), i zasićenje(stupanj slobode od bijelih nečistoća). Područja boja koja se na engleskom označavaju riječima crna "crna", siva "siva" i bijela "bijela" razlikuju se uglavnom po svjetlini, ali upućivanje na neke druge najčešće korištene izraze u boji treba dati uzimajući u obzir sve tri dimenzije u kojoj je boja može varirati, na primjer: smeđa "smeđa" odnosi se na raspon boja, koji se nalazi u tonu između crvene "crvene" i žute "žute", ima relativno nisku svjetlost i zasićenost; ružičasta "ružičasta" se odnosi na boju koja je crvenkastog tona, ima prilično visoku lakoću i vrlo nisku zasićenost. Analiza ovih činjenica može sugerirati da je tvar boje lisne uši trodimenzionalni (fizički ili perceptualni) kontinuum.

Ali i ova se izjava čini previše pojednostavnjenom. Ne radi se samo o tome da se jezici razlikuju po relativnoj težini koju daju dimenzijama - tonu, svjetlini i zasićenosti - u organizaciji svojih sustava imenovanja boja (na primjer, za latinski i grčki, lakoća je očito bila važnija od tona); postoje jezici u kojima se razlikuju boje na temelju potpuno različitih principa. U svojoj klasičnoj studiji o toj temi, Conklin je pokazao da su četiri glavna "termina u boji" jezika Hanunoo (jezik koji se govori na Filipinima) povezana sa svjetlom (koji obično uključuje bijele i svijetle nijanse drugih "engleskih boja"), tamom (uključujući englesku crnu, ljubičastu, plavu, tamno zelenu i tamne nijanse druge boje), "vlažna" (obično povezana sa svijetlozelenom, žutom i svijetlosmeđom, itd.) i "suha" (obično povezana sa kestenjastom, crvenom, narančastom, itd.). Da razlika između "mokrog" i "suvog" nije samo stvar tona ("zeleno" protiv. "crveno": upravo ta razlika može biti evidentna, na temelju najčešćih engleskih prijevoda ova dva pojma), postaje jasno iz činjenice da je "briljantan, vlažan, smeđa komad svježe rezanog bambusa" opisuje se riječju koja se obično koristi za svijetlozelenu boju itd. Conklin zaključuje da "boja, u točnom smislu riječi, nije za zapadnoeuropske jezike univerzalni koncept»; da kontrasti u smislu kojih se u različitim jezicima definira supstancija boje mogu ovisiti prvenstveno o povezanosti leksičkih jedinica s onim svojstvima predmeta u prirodnom okruženju osobe koja su važna za danu kulturu. Što se tiče jezika Hanunbo, sustav njegovih definicija očito se odbija tipičan pogled svježe, mlade ("mokre", "sočne") biljke. S tim u vezi, vrijedi napomenuti da engleski rječnici često definiraju osnovne pojmove boja u odnosu na tipična svojstva ljudskog okoliša (na primjer, u rječniku se može reći da plava odgovara boji vedrog neba, crvena boji krvi , itd.).

9.4.6. SEMANTIČKA "RELATIVNOST"

Polje boja je detaljno obrađeno jer se često koristi kao primjer da se pokaže kako isti tvar može imati različitog oblika koje su joj nametnuli razni jezici. Sada znamo da i u slučaju imenovanja boja imamo sve razloge sumnjati u mogućnost apriorne postulacije identiteta "supstancije sadržaja". Kategorije "boje" koje je opisao Conklin u hanunoou bi nas prirodno trebale dovesti do ideje da definicije tvari boje koje su relevantne za jezik teško da su uvijek one dimenzije koje prirodne znanosti biraju kao glavne. To dovodi do općeg zaključka da je jezik određenog društva sastavni dio njegovu kulturu te da leksičke razlike koje povlači svaki jezik obično odražavaju važna (sa stajališta te kulture) svojstva objekata, institucija i djelatnosti društva u kojem jezik funkcionira. Ovaj zaključak nalazi potvrdu u brojnim novijim studijama različitih područja u rječniku različitih jezika. S obzirom na činjenicu da prirodno okruženje različitih društava može biti vrlo različito (da ne spominjemo njihove društvene institucije i obrasce ponašanja), čini se vrlo dvojbenim hoće li plodno razmatranje semantičke strukture kao rezultat nametanja oblika na temeljna (perceptivna, fizička ili konceptualna) supstanca vrlo je sumnjiva.zajednička svim jezicima. Kao što je Sapir rekao: "Svjetovi u kojima žive različita društva su odvojeni svjetovi, a ne isti svijet s različitim oznakama."

Čak i pod pretpostavkom da različita društva žive u "posebnim svjetovima" (a na to ćemo se uskoro vratiti), još uvijek se može tvrditi da svaki jezik nameće neki konkretan oblik tvari "svijeta" u kojem funkcionira. U određenoj mjeri to je točno (kao što smo vidjeli, na primjer, u slučaju izraza u boji). Važno je, međutim, biti svjestan činjenice da leksički sustavi uopće nisu obvezni biti izgrađeni na temelju unaprijed određene „temelje“ tvari. Neka, na primjer, riječi poštenje "poštenje, istinitost, iskrenost, izravnost, čednost, vrlina, pristojnost", iskrenost "iskrenost, iskrenost, izravnost, poštenje", čednost "čednost, djevičanstvo, čistoća, čistoća, vrlina, strogost, jednostavnost , skromnost , suzdržanost, suzdržanost, umjerenost", vjernost "vjernost, odanost, odanost, točnost, ispravnost" itd. spadaju u isti leksički sustav s riječju vrlina "vrlina, moral, čednost, dobra kvaliteta, pozitivna osobina, dostojanstvo" . Struktura ovog sustava može se opisati u smislu smislenih odnosa koji se odvijaju između njegovih članova. S ove točke gledišta, pitanje postoje li ikakve "značajne" korelacije između leksičkih jedinica i prepoznatljivih karakternih osobina ili ponašanja je irelevantno. Ako se promatraju takve korelacije, tada će biti opisane u smislu referenci, a ne značenja. Ukratko, primjenjivost koncepta supstancije u semantici određena je istim postulatom "postojanja" kao i koncept reference (usp. § 9.4.1).

Izjava da su "svjetovi u kojima žive različita društva odvojeni svjetovi" često se tumači kao proklamacija jezičnog "determinizma". Je li Sapir (ili Humboldt prije njega i Whorf nakon njega) vjerovao da je naša kategorizacija svijeta u potpunosti određena strukturom našeg materinjeg jezika, pitanje je o kojem ovdje nećemo raspravljati. Većina znanstvenika slaže se da je lingvistički determinizam, shvaćen u ovom snažnom smislu, neodrživa hipoteza. Međutim, gore usvojeno stajalište da jezici u svom rječniku odražavaju razlike koje su kulturno važne za društva u kojima djeluju djelomično nas naginje prema poziciji jezične i kulturne "relativnosti". Stoga moramo naglasiti neospornu činjenicu da je razumijevanje strukture leksičkih sustava u jezicima koji nisu naš materinji jezik nužno i sasvim moguće kako prilikom asimilacije u praktične svrhe, tako i prilikom proučavanja njihova rječnika. O tome, očito, ovisi mogućnost prijevoda s jednog jezika na drugi.

9.4.7. SLUČAJNOST KULTURA

Kulture (u smislu u kojemu taj izraz koriste antropolozi i sociolozi) nisu u korespondenciji jedan na jedan s jezicima. Primjerice, mnoge institucije, običaje, odjevne predmete, namještaj, hranu itd., koji se odvijaju u Francuskoj i Njemačkoj, promatramo i u Engleskoj; drugi se pokazuju kao karakteristični za pojedine zemlje ili za određena područja ili društvene slojeve jedne zemlje. (Odnos između jezika i kulture je, naravno, mnogo složeniji nego što ovo pojednostavljeno predstavljanje implicira: političke granice se ne poklapaju s jezične granice, čak i ako, bez dokaza, smatramo koncept jedinstvenog govornog kolektiva u određenoj mjeri legitimnim; mogu se pronaći kulturne sličnosti između različitih društvene skupine u različitim zemljama itd.). U općem slučaju, može se tvrditi da će između bilo koja dva društva postojati veći ili manji stupanj kulturna preklapanja; a može se pokazati da će određene osobine biti prisutne u kulturi svih društava. Praktično iskustvo učenja stranih jezika (u onim normalnim uvjetima u kojima se ti jezici koriste) sugerira da brzo identificiramo određene predmete, situacije i znakove kada se kulture podudaraju i lako naučimo riječi i izraze koji se na njih primjenjuju. Značenja drugih riječi i izraza asimiliraju se s manje lakoće, a njihova ispravna uporaba dolazi, ako uopće dođe, samo kao rezultat dugotrajne konverzacijske prakse. Teorijska interpretacija ovih činjenica našeg iskustva može biti sljedeća: ulaz u semantičku strukturu drugog jezika otvara se iz područja kulturološke koincidencije; a nakon što razbijemo ovaj krug značenja identificiranjem jedinica u ovom području (usp. § 9.4.7, o neizbježnoj "kružnoj" prirodi semantike), možemo postupno poboljšati i poboljšati svoje znanje o ostatku vokabulara iz iznutra, asimilirajući referencu leksičkih jedinica i semantičke odnose povezujući jedinice u kontekstima njihove uporabe. Prava dvojezičnost uključuje asimilaciju dviju kultura.

9.4.8. "PRIJAVA"

Ako se jedinice različitih jezika mogu međusobno povezati na temelju identifikacije zajedničkih obilježja i situacija dviju kultura, možemo reći da te jedinice imaju iste primjena. Razlog za korištenje ovog izraza umjesto izraza "referenca" povezan je s dva razmatranja. Prije svega, predloženi pojam označava odnos koji se odvija između situacija i izraza koji se javljaju u tim situacijama (npr. odnos između Oprostite "Oprostite", Hvala "Hvala" itd. i raznih karakterističnih situacija u kojima se te izjave javljaju). očito nije referentni odnos. Drugo, također je potrebno voditi računa o semantičkoj identifikaciji leksičkih jedinica koje nemaju referencu; poželjno je reći npr. da engleska riječ sin "sin" i francuska riječ peche imaju istu primjenu, iako bi moglo biti vrlo teško ili čak nemoguće utvrditi ovu činjenicu s referentnog stajališta. Može se dogoditi da će drugi od ovih razloga za uvođenje pojma "primjena" otpasti nakon izgradnje iscrpne i zadovoljavajuće teorije kulture. Trenutačno, tumačenje aplikacije, kao i proces prevođenja, vrlo temeljno ovisi o intuiciji dvojezičnih govornika. To ne znači da ovaj koncept nema objektivan sadržaj, jer se dvojezični govornici obično međusobno dogovaraju o upotrebi većine riječi i izraza u jezicima koje koriste.

U ovom odjeljku ništa nije rečeno o tome kako se uspostavljaju paradigmatski i sintagmatski semantički odnosi. Prije nego što prijeđemo na ovo pitanje, moramo razmotriti mogućnost proširenja pojmova reference i značenja i na gramatičke jedinice.

9.5. „LEKSIČKO“ ZNAČENJE I „GRAMATIČKO“ ZNAČENJE

9.5.1. "STRUKTURNE VRIJEDNOSTI"

Razmatrajući pitanje "gramatičkih kategorija", osvrnuli smo se na tradicionalno, "aristotelovsko" stajalište, prema kojem su samo glavni dijelovi govora (imenice, glagoli, "pridjevi" i prilozi) "značajni" u punom smislu. pojma (oni "označuju" "pojmove" koji čine "materiju" diskursa), a preostali dijelovi govora sudjeluju u formiranju ukupnog značenja rečenica, namećući određeni gramatički "oblik" "sadržaju" diskursa (usp. § 7.1.3). Iznenađujuće slična stajališta zastupaju mnogi protivnici tradicionalne gramatike.

Na primjer, Freese razlikuje "leksička" i "strukturalna" značenja, a ova opozicija točno odražava "aristotelovsku" razliku između "materijalnog" i "formalnog" značenja. Glavni dijelovi govora imaju "leksičko" značenje; a dan je u rječniku koji je povezan s određenom gramatikom. Naprotiv, razlika između subjekta i objekta u rečenici, suprotnosti u određenosti, vremenu i broju, te razlika između iskaza, pitanja i zahtjeva, sve te razlike odnose se na "strukturna značenja". (“Ukupno jezično značenje bilo kojeg iskaza sastoji se od leksičkih značenja pojedinih riječi plus takva strukturna značenja... Gramatika jezika se konstituira pomoću signaliziranja strukturnih značenja.”)

Freeseov koncept "strukturnog značenja" uključuje najmanje tri različite vrste semantičke funkcije; drugi lingvisti koriste izraz "gramatičko značenje" (za razliku od "leksičkog značenja") u istom smislu. Tri spomenute vrste "značenja" su: (1) "značenje" gramatičkih jedinica (obično pomoćnih dijelova govora i sekundarnih gramatičkih kategorija); (2) "značenje" takvih gramatičkih "funkcija" kao što su "subjekt", "objekt" ili "modifikator"; (3) "značenje" povezano s konceptima kao što su "narativni", "upitni" ili "imperativ" u klasificiranju različitih vrsta rečenica. Ove vrste "gramatičkog značenja" važno je razlikovati, a mi ćemo ih razmotriti u nastavku.

9.5.2. LEKSIČKE I GRAMATIČKE JEDINICE

Predloženi su različiti kriteriji za razlikovanje gramatičkih i leksičkih jedinica. Najzadovoljavajući od njih (i jedini koji ćemo ovdje spomenuti) formulirali su Martinet, Holliday i drugi u smislu paradigmatske opozicije unutar bilo kojeg zatvoreno, ili otvoren mnoge alternative. Zatvoreni skup jedinica je skup s fiksnim i obično malim brojem članova, kao što su skup osobnih zamjenica, vremena, rodova itd. Otvoreni skup je skup s neograničenim, neograničeno velikim brojem članova, kao npr. razred imenica ili glagola u jeziku. Koristeći ovu razliku, možemo reći da gramatičke jedinice pripadaju zatvorenim skupovima, a leksičke jedinice otvorenim skupovima. Ova definicija odgovara tradicionalnom razlikovanju značajnih dijelova govora, s jedne strane, i pomoćnih dijelova govora i sekundarnih gramatičkih kategorija, s druge strane. Za razliku od nekih drugih predloženih definicija, nije vezan za jezike istog morfološkog "tipa" (npr. "flektivni" jezici; usp. § 5.3.6). Zasad ćemo pretpostaviti da je ova definicija točna i da se (na temelju razlikovanja zatvorenih i otvorenih skupova) svi elementi koji se unose u dubinsku strukturu rečenice mogu razvrstati na "gramatičke" i "leksičke". Sada se postavlja pitanje postoji li načelno razlika između značenja gramatičkih i leksičkih jedinica.

Prvo, imajte na umu da leksičke jedinice, prema tradicionalnom gledištu, imaju i "leksičko" i "gramatičko" značenje (i "materijalno" i "formalno" značenje; usp. §9.5.1). Koristeći se terminologijom skolastičke, "spekulativne" gramatike, možemo reći da određena leksička jedinica, na primjer krava "krava", ne "označava" samo neki specifični "pojam" (to je "materijalno" ili "leksičko" značenje dotične jedinice), ali istovremeno provodi određeni „način označavanja“ fenomena u obliku, na primjer, „supstanci“, „kvaliteta“, „radnje“ itd. (usp. § 1.2.7. i § 7.1.1). Iako se jezikoslovci danas rijetko izražavaju u terminima ovih pojmova, ovaj opći koncept razlike između "leksičkog" i "gramatičkog" značenja leksičkih jedinica još je uvijek aktualan. Štoviše, čini se da je u određenoj mjeri opravdano.

Na primjer, Lermontov ima dobro poznatu pjesmu koja počinje riječima: Usamljeno jedro pobijeli se... Ovu frazu je teško (možda čak nemoguće) prevesti na engleski, jer njezin učinak ovisi o činjenici da se na ruskom "posjedovanje svojstva bijelog" može "izraziti" pomoću "glagola" (koji se također izražava riječima bijelim, koji se u rečenicama koje nisu obilježene vremenom, oblikom i modalitetom obično koristi bez “glagola biti”; usp. § 7.6.3). Kombinacija ploviti usamljeno može se prevesti na engleski kao "usamljeno jedro" ( ploviti je imenica, a usamljen je "pridjev"). S tradicionalnog stajališta, "glagol" predstavlja "imati svojstvo bijele boje" kao "proces" ili "aktivnost", "pridjev" kao "kvalitetu" ili "stanje". Specifičnost preferiranog izbora u ovom slučaju "glagola" umjesto "pridjeva" može se pokazati sredstvima engleskog samo uz pomoć prilično neadekvatne parafraze poput "There is a lonely jedro koje se ističe (ili čak sjaji) ) bijelo (na pozadini mora ili neba)..." Problemi ove vrste dobro su poznati onima koji se bave prevođenjem s jednog jezika na drugi. Ovdje nas zanima jedno teorijsko pitanje: možemo li reći da postoji određeno "gramatičko značenje" povezano sa svakim od glavnih dijelova govora?

Već smo vidjeli da je razlika između "glagola" i "pridjeva" u općoj sintaktičkoj teoriji težak problem: neki jezici uopće ne prave takvu razliku; u drugim jezicima, brojne sintaktičke značajke povezane su s ovom razlikom, au određenim slučajevima one mogu biti kontradiktorne (usp. § 7.6.4). Ali glavni kriterij, kriterij koji odražava tradicionalno razlikovanje između "aktivnosti" i "kvalitete", specifična je razlika između "dinamičkog" i "statičnog" (usp. § 8.4.7). Na ruskom, ova razlika u "gramatičkom značenju" je "superimirana" na "leksičko značenje", koje je zajedničko za oba "glagola" pobijeliti, a za "pridjev" bijelim. S ovim pristupom, tradicionalna teorija "načina notacije" mora se priznati kao ispravna: naravno, mora se preformulirati u okviru zadovoljavajuće teorije sintaktičke strukture.

Istodobno, ne smijemo izgubiti iz vida opće načelo da „posjedovanje smisla podrazumijeva izbor“. Ako jezik koji se opisuje dopušta izbor "verbalnog" ili "pridjevskog" izraza (ograničavamo se na razliku ilustriranu u našem primjeru), tada upotreba jedne ili druge od ovih metoda već spada u opseg semantička analiza jezika. Tada se možemo zapitati imaju li ova dva "načina" izražavanja isto značenje ili ne; a ako se razlikuju po značenju, onda se možemo zapitati koja je semantička razlika između njih. Ako se ta razlika može povezati s nekom gramatičkom razlikom u dubokoj strukturi (na primjer, "dinamički" protiv. "statičan"), onda je izraz "gramatičko značenje" sasvim prikladan za ovaj slučaj. Ali to ne znači da je izbor "glagola" u odnosu na "pridjev" uvijek povezan s razlikom u "gramatičkom značenju". U mnogim slučajevima, određeno "leksičko značenje" povezano je s jednim dijelom govora, ali ne i s drugim. Ukratko, po ovom pitanju, kao iu mnogim drugim, lingvistička teorija mora uspostaviti ravnotežu između "konceptualne" i "formalne" gramatike (usp. § 7.6.1). Ne treba tvrditi da je "oznaka djelatnosti" dio "značenja" svakog "glagola" ili da je "oznaka kvalitete" dio "značenja" svakog "pridjeva".

Tradicionalno se vjeruje da leksičke jedinice imaju i "leksičko" ("stvarno") i "gramatičko" ("formalno") značenje. S druge strane, obično se smatra da gramatičke jedinice imaju samo "gramatičko" značenje. U prethodnom smo poglavlju vidjeli da se određene jedinice, koje se pojavljuju u površinskoj strukturi rečenica kao "glagoli", mogu tumačiti kao "leksičke realizacije" aspektualnih, kauzativnih i drugih "gramatičkih" razlika. Ostavit ćemo po strani pitanje koliko su te hipoteze istinite. U sadašnjem stanju sintaktičke teorije, razlika između gramatičkih i leksičkih jedinica prilično je nejasna. Razlog je taj što se razlika između otvorenih i zatvorenih skupova alternativa može primijeniti samo na pozicije izbora u dubokoj strukturi rečenica; ali, kao što smo vidjeli, moguća su vrlo različita gledišta o tome gdje se te pozicije "izbora" nalaze.

Glavna točka koju ovdje treba naglasiti je ovo: čini se da ne postoji značajna razlika između "vrste značenja" povezane s leksičkim jedinicama i "vrste značenja" povezane s gramatičkim jedinicama kada se ove dvije klase struktura mogu jasno razlikovati. razgraničeno. Koncepti "značenja" i "reference" primjenjuju se na obje vrste elemenata. Ako postoji bilo kakva generalizacija koja se može napraviti o značenju gramatičkih elemenata (a, zapamtite, neki čisto gramatički elementi uopće nemaju značenje; usp. §8.4.1), čini se da su gramatički "izbori" povezani s općim pojmovima prostorne i vremenske korelacije, uzročnosti, procesa, individualizacije itd. - pojmovi tipa o kojima se govori u 7. i 8. poglavljima. No, ne možemo unaprijed reći da u strukturi nekog pojedinog jezika takvi pojmovi, čak i ako ih je lako razlikovati, nužno će biti “gramatikalizirane”, a ne “leksikalizirane”.

9.5.3. "ZNAČENJE" GRAMATIČKIH "FUNKCIJA"

Druga klasa fenomena u strukturi engleskog jezika, na koju su Freese (i drugi) primijenili izraz 'strukturno značenje' (ili 'gramatičko značenje'), može se ilustrirati konceptima kao što su 'subjekt', 'objekt' i 'definicija'. Freeseova knjiga nastala je prije stvaranja moderne teorije transformacijske sintakse, a bavio se isključivo površinskom strukturom (unutar prilično ograničenog koncepta). Stoga, velik dio onoga što on kaže o tim "funkcionalnim" konceptima, iako istinit, teško da je relevantan za semantičku analizu. Isto se može reći i za većinu modernih lingvističkih teorija.

Sasvim je jasno da su za semantičku analizu rečenica relevantni neki gramatički odnosi koji se odvijaju na razini dubinske strukture između leksičkih jedinica i kombinacija leksičkih jedinica. Prema Chomskyju, "funkcionalni" koncepti "subjekta", "izravnog objekta", "predikata" i "glavnog glagola" čine glavne duboke odnose između leksičkih jedinica; Katz, Fodor i Postal nedavno su pokušali formalizirati teoriju semantike skupom "pravila projekcije" koja djeluju na leksičke jedinice koje su povezane ovim odnosima unutar rečenica (usp. § 10.5.4). Koncepti kao što su "subjekt", "predikat" i "objekat" razmatrani su u prethodnom poglavlju; a vidjeli smo da njihova formalizacija u općoj sintaktičkoj teoriji uopće nije tako očita kao što je Chomsky pretpostavljao. Slijedi da se dvojbenim čini i status "pravila projekcije" koja tumače rečenice na temelju ovih pojmova.

Uzimajući u obzir "tranzitivnost" i "ergativnost", istaknuli smo da se mnogi "izravni objekti" engleskih rečenica mogu generirati umetanjem jednomjesnih konstrukcija kao "predikata" dvomjesnih konstrukcija i uvođenjem novog "agentnog" subjekta . Ali također smo vidjeli da postoje i druge konstrukcije prijelaza s dva mjesta koje se ne mogu na zadovoljavajući način generirati iz ove sheme. Sama ta činjenica sugerira da relacija "izravni objekt" ne može dobiti jedinstvenu interpretaciju u semantičkoj analizi rečenica. U tradicionalnoj gramatici razlikovalo se mnogo različitih vrsta "izravnog objekta". Ovdje se može spomenuti jedan od njih jer je (bez obzira na status u teoriji sintakse) nesumnjivo vrlo važan u semantici. Mislimo na "objekt rezultata" (ili "efekt").

"Objekt rezultata" može se ilustrirati primjerom sljedeće dvije rečenice:

(1) Nije čitanje knjige "On čita knjigu."

(1) Nije pisanje knjige "On piše knjigu."

Knjiga iz rečenice (1) postoji prije i neovisno o čitanju, ali knjiga iz rečenice (2) još ne postoji - nastaje nakon završetka aktivnosti opisane u toj rečenici. Zbog ove razlike, knjiga u (1) tradicionalno se tretira kao "obični" objekt glagola čitanje, dok se knjiga u (2) opisuje kao "objek rezultata". Sa semantičke točke gledišta, svaki glagol koji uz sebe ima "objekt rezultata" može se nazvati "egzistencijalnim uzročnikom". Najčešći "glagol" na engleskom koji spada u ovu klasu je make "do do", a već smo naznačili da je to i "pomoćni glagol" (usp. §8.3.6 i §8.4.7). Isti “glagol” djeluje, kao i glagol do “raditi”, kao “zamjenski glagol” u upitnim rečenicama. Pitanja poput Što radiš? "Što radiš?" nosi manje pretpostavki o "predikatu" rečenice koja odgovara na pitanje (glagol može biti prijelazni ili neprelazni, ali mora biti glagol "radnje"; usp. § 7.6.4). Pitanje Što radiš? "Što radiš?", naprotiv, pretpostavlja da je odgovarajuća "aktivnost" "rezultativna" i da ima za cilj ili ograničenje "postojanje" ("postojanje") nekog "objekta". U brojnim europskim jezicima ova se razlika pojavljuje, međutim, ne tako jasno kao u engleskom. (Na primjer, na francuskom se Qu "est-ce que tu fais? može prevesti na engleski ili kao "Što radiš?" ili kao "Što radiš?"). Ali to ne znači da za ove jezike razlika između "običnih" objekata i "objekta rezultata" je nevažna.

Važnost koncepta "egzistencijalnog kauzativa" proizlazi iz činjenice da u rečenicama koje sadrže konstrukciju s "objektom rezultata" često postoji visok stupanj međuovisnosti između određenog glagola ili klase glagola i određene imenice ili klase. od imenica. Na primjer, nemoguće je dati zadovoljavajuću semantičku analizu imenice slika "slika" bez otkrivanja njezinih sintagmatskih veza s glagolima kao što su slikati "slikati, crtati, pisati" i crtati "crtati, crtati"; obrnuto, činjenica da ti glagoli mogu imati imensku sliku kao svoj "predmet rezultata" mora se uzeti u obzir kao dio njihovog značenja.

Ovaj pojam sintagmatske međuovisnosti, ili pretpostavke, igra značajnu ulogu u analizi rječnika bilo kojeg jezika (usp. § 9.4.3). Ima mnogo širu primjenjivost nego što naši primjeri mogu pokazati. Postoje pretpostavke koje se javljaju između određenih klasa imenica i glagola kada je imenica subjekt glagola (na primjer, ptica "ptica" : letjeti "letjeti", riba "riba" : plivati ​​"plivati"); između "pridjeva" i imenica (plava "plava" : kosa "kosa", dodano "pokvareno" : jaje "jaje"); između glagola i "običnih" objekata (voziti "voziti" : sag "automobil"); između glagola i imenica koje s njima imaju "instrumentalne" odnose (ugristi "ugristi" : zube "zube", udariti "dati" : noga "noga, noga"), itd. Mnogi od ovih odnosa su između određenih klasa leksičkih jedinica ne mogu biti naveden drugačije nego u smislu nekog skupa "pravila projekcije" (ad hoc pravila) unutar okvira transformacijske sintakse koju je ocrtao Chomsky.

S obzirom na činjenicu da još uvijek ne postoji potpuno zadovoljavajuća sintaktička osnova unutar koje bi bilo moguće formulirati različite semantičke odnose koji služe kao sredstvo za strukturiranje rječnika jezika, nećemo pokušavati formulirati skupove „pravila projekcije” koji djeluju s dubokim gramatičkim odnosima. U sljedećem poglavlju razmotrit ćemo nekoliko posebno važnih paradigmatskih odnosa između klasa leksičkih jedinica; njihova će se analiza provoditi neformalno. Po našoj pretpostavci, ti bi se odnosi mogli formulirati na elegantniji način u smislu nekog zadovoljavajućeg opisa gramatičkih odnosa na razini Duboke strukture.

9.5.4. "ZNAČENJE" od "VRSTE PONUDE"

Treća klasa "značenja" koja se obično smatraju "gramatičkim" može se ilustrirati razlikom između "deklarativnih", "upitnih" i "imperativnih" rečenica. U novijim radovima na transformacijskoj teoriji postoji tendencija da se u duboke NS strukture rečenica uvedu gramatički elementi kao što su "upitni marker" i "imperativ", a zatim se formuliraju pravila transformacijske komponente na način da se prisutnost jednog od ovih "markera" "uključuje »odgovarajuće pravilo transformacije. Ovdje ne razmatramo sintaktičke prednosti ove formulacije razlike između različitih "vrsta rečenica", zanima nas njezina semantička bit.

Tvrdili su (od strane Katza i Postala) da su ti "markeri" semantički slični leksičkim i gramatičkim elementima koji se pojavljuju kao sastavni dijelovi u jezgri rečenica. Na primjer, "imperativna oznaka" je zabilježena u rječniku i popraćena je naznakom "što ga karakterizira sljedeće značenje: "govornik postavlja zahtjev (pita, zahtijeva, inzistira, itd.) da"". Ali ovo mišljenje temelji se na zbrci u korištenju pojma "značenje". Njime se zaobilaze proturječnosti koje nastaju u vezi s razlikama koje se prave u semantici između "značenja", "reference" i drugih vrsta "značenja". Ako nastavimo koristiti pojam "značenje" za sve vrste razlikovnih semantičkih funkcija, onda je sigurno reći da postoje razlike u "značenju" između odgovarajućih izjava, pitanja i naredbi (koje nisu nužno "izražene" izjavne, upitne i imperativne rečenice). , odnosno - ali zbog jednostavnosti zanemarujemo ovu činjenicu). Međutim, pitanje imaju li dvije leksičke jedinice „isto značenje“ ili ne obično se tumači u odnosu na pojam sinonimije – isto značenje. To je paradigmatski odnos, odnosno odnos koji se odvija ili ne odvija između jedinica koje se javljaju u istom kontekstu, u istoj "vrsti rečenice". U sljedećem poglavlju vidjet ćemo da je koncept "sinonimije" između x i na može se opisati u smislu mnoštva implikacija koje "slijede" iz dvije rečenice koje se razlikuju samo u onom mjestu gdje je u jednom slučaju x, u drugom - vrijedi na. Ali ova razmatranja jednostavno se ne odnose na odgovarajuće izjavne i upitne (imperativne) rečenice (na primjer: Pišete slovo "Pišete pismo" protiv. Pišete li pismo? "Pišeš li pismo?" ili napiši pismo! "Napisati pismo!"). Iako se odgovarajući članovi različitih "vrsta rečenica" mogu okarakterizirati kao različiti u "značenju", ne može se smatrati da se razlikuju po značenju. Nema potrebe pokušavati formalizirati teoriju semantike na način da se "značenje" "upitnog markera" ili "imperativnog biljega" može opisati istim pojmovima kao i "značenje" leksičkih jedinica,

SEMANTIČKO NAČELO KLASIFIKACIJE GOVORNIH DIJELOVA

Postoji nekoliko načela za podjelu smislenih riječi u kategorije. Jedno od tih načela je semantičko načelo. Posebno se razmatralo (Panov M. V. O dijelovima govora na ruskom jeziku // Znanstvena izvješća o visokom obrazovanju. Philol. science, 1960, br. 4). Prema ideji, dijelovi govora bi trebali imati određeno zajedništvo, a ta zajednička ne bi trebala biti korijenska, već afiksalna i odnositi se ne na zvuk afiksa (oblik), već na njihovo značenje (sadržaj). Doista, oblici riječi kukavica, kukavica,kukavički, iako dijele zajednički korijenski morfem, ne mogu se pripisati jednom dijelu govora. oblici riječi napisao i strašilo, pospano i guranje, sladoled i velik, iako sadrže formalno iste afiksalne elemente -l-, -n~, -th, očito pripadaju različitim dijelovima govora. Stoga je potrebno otkriti neku smislenu afiksalnu zajedništvo, koja bi trebala poslužiti kao osnova za podjelu riječi na dijelove govora.

Klasifikacija se temelji na iznimno općem značenju – sudjelovanju u funkciji imenovanja. Postoji nekoliko takvih funkcija. Jedan od njih - postupak- vidi se u bilo kojem glagolskom obliku riječi, bez obzira na značenje korijena, koji možda nema proceduralni značaj. Druga funkcija - znak. Nalazi se u hijerarhiji funkcija nakon proceduralnosti. Na temelju odsutnosti funkcije procesnosti i prisutnosti funkcije znaka izdvaja se pridjev kao dio govora. Pritom se particip kao dio govora ne izdvaja, budući da ima funkciju proceduralnosti. Ova okolnost je osnova za upućivanje participskih oblika na glagol kao dio govora. Treća funkcija je izravan ili neizravan odnos prema objektu. Po toj se osnovi pridjev i glagol suprotstavljaju prilogu. Prvi izravno karakteriziraju objekt: pridjev je neproceduralan, glagol (s participom!) je proceduralni. Prilog ne karakterizira neposredno objekt, on obavlja funkciju znaka samog znaka, odnosno glagola ili pridjeva. Istu funkciju znaka znaka obavlja i gerundij. Međutim, za razliku od priloga, prilozi imaju procesnost.

Oblici riječi koji nemaju niti jedno od naznačenih značenja u svom afiksalnom dijelu su imenice, gdje u takvoj formulaciji pitanja padaju kvantitativni i zbirni brojevi. Sve ostale gramatičke razlike među oblicima riječi ne utječu na odabir dijelova govora.

Sličan - funkcionalno-semantički - pristup dodjeli dijelova govora u ruskom jeziku ranije je proveden . Nastojao je razlikovati četiri nezavisna dijela govora u ruskom jeziku: imenicu, pridjev, glagol i prilog. No, na temelju razmatranja semantičko-funkcionalnih kategorija leksema koje je izdvojio, bilo je moguće pronaći napeto mjesto u sustavu tako izdvojenih ruskih dijelova govora. On razmatra fraze utrkivati ​​se i trkaće trčanje. Prvi izraz je prirodan i leksički i gramatički. Drugi izraz je također leksički prirodan. Ali gramatički je netočno: utrke- prilog, tj. znak znaka, ali trčanje- imenica, tj. gramatički nije znak i nije proces. fraza trči brzo- i leksički i gramatički. fraza brzo trčanje gramatički također regularan, ali leksički - ne, jer leksički trčanje nije nešto objektivno. Dakle, opozicija pridjeva i priloga u ovom aspektu je donekle zamagljena. Može se navesti mnogo primjera kada prilog djeluje kao znak u odnosu na

na imenicu izravno: kajgana,ježeva kosa, vijugav rep itd.

U usporedbi s tradicionalno istaknutim dijelovima govora, predložena shema razlikuje se u nekim značajkama. U ovoj shemi nema zamjenica ili brojeva. Međutim, ti su gubici logički neizbježan rezultat dosljedne primjene semantičko-funkcionalnog načela podjele. U skladu s tim načelom, sve tradicionalno dodijeljene zamjenice raspoređene su među imenicama, pridjevima i prilozima. Istu sudbinu dijele i brojevi. Redni se ubrajaju u pridjeve, kvantitativne i zbirne - u imenice, te oblike riječi poput dvaput, triput, iako su povezani s računom, kako su se tradicionalno odnosili prema prilozima, ostaju među prilozima i s naznačenim pristupom. Klasifikacija prema principu "funkcije imenovanja" samo u svojim najopćenitijim značenjima daje shemu koja podsjeća na tradicionalne dijelove govora. U načelu, klasifikacija prema ovom načelu može biti detaljna. Tada će to dovesti do odabira skupina leksema (ili oblika riječi) koji imaju funkcionalno-semantičku zajedništvo. Tako se npr. unutar glagola mogu razlikovati skupine osobnih i neosobnih glagola, unutar priloga skupina priloga koji označavaju znak znaka i skupina priloga koji označavaju stanje (hladno mi je, on nema vremena) itd.

Unatoč objektivnoj vrijednosti razmatrane klasifikacije i njezinoj posebnoj važnosti za semantiku i sintaksu, ona ne može u potpunosti zadovoljiti stručnjaka iz područja morfologije, jer ne uzima u dovoljnoj mjeri u obzir morfološke kategorije koje su ili nisu zastupljene u određenoj skupini leksemi ili oblici riječi. Ova posljednja okolnost - stvarne morfološke karakteristike riječi - može se uzeti kao osnova za drugačiju alokaciju dijelova govora.

MORFOLOŠKO NAČELO KLASIFIKACIJE GOVORNIH DIJELOVA

ISTI SKUP MORFOLOŠKIH KATEGORIJA. Klasifikacija leksema može se temeljiti na izražavanju istih morfoloških kategorija. U ovom slučaju leksemi kuća, životinja, zimačine jednu grupu, jer svi njihovi oblici riječi izražavaju morfološke kategorije broja, padeža i samo te kategorije. S druge strane, svi će ti leksemi biti suprotstavljeni leksemima ljubazni, stari, veliki, budući da svi oblici riječi potonjeg izražavaju takve morfološke kategorije kao što su rod, broj, padež, sažetost-potpunost.

Međutim, klasifikacija prema načelu “izraz istog skupa morfoloških kategorija” ne dovodi uvijek do tako jasnih rezultata kao u slučaju gore opisane suprotnosti imenica i pridjeva. Glavni

Druge poteškoće nastaju kada različiti oblici riječi istog leksema izražavaju različite skupove morfoloških kategorija.

S tim u vezi, oblici riječi koji su tradicionalno uključeni u glagol su raspoređeni na najteži način u ruskom jeziku. Čak se i oblici sadašnjeg i prošlog vremena razlikuju po skupu izraženih morfoloških kategorija. U sadašnjosti se izražava kategorija osobe koja je odsutna u prošlosti. I u prošlosti dolazi do izražaja kategorija roda, koja je odsutna u sadašnjosti. Morfološke kategorije glagola u indikativu, konjunktivu i imperativu se ne podudaraju. Još su upečatljivije razlike u skupovima morfoloških kategorija osobnih oblika glagola i infinitiva, osobnih oblika glagola i participa, infinitiva i participa. Uz sve to, i infinitivne i osobne oblike svih načina, te participe i participe treba smatrati oblicima riječi jednog leksema, budući da se značenja koja razlikuju ove oblike riječi mogu smatrati obveznim i pravilnim (više o tome vidi u odjeljak "Glagol"). Iz te okolnosti proizlazi da se klasifikacija prema načelu "izražavanje istog skupa morfoloških kategorija" može dosljedno provoditi samo za oblike riječi. Za lekseme je takva klasifikacija načelno nemoguća.

Još jedna okolnost otežava primjenu ovog kriterija. Ona leži u činjenici da među ruskim leksemima ima mnogo takvih koji se sastoje od jednog oblika riječi i stoga ne izražavaju niti jednu morfološku kategoriju. Tokeni kao što su kaput, taksi, hidro, prema načelu “izražavanja morfoloških kategorija” oštro se suprotstavljaju većini ruskih imenica koje izražavaju morfološke kategorije i brojeve i padeže u svojim oblicima riječi. Upišite tokeni bež, kaki, semantički identični pridjevima, nemaju nikakve morfološke kategorije svojstvene pridjevima. Stoga je klasifikacija prema načelu "izražavanja morfoloških kategorija" moguća samo za gramatički oblikovane oblike riječi.

U ovom slučaju bit će predstavljene sljedeće vrste oblika riječi:

1) imenice (izričiti padež i broj); ovdje padaju i kvantitativni i zbirni brojevi;

2) pridjevi (izričiti padež, broj, rod i kratkoća/punina);

3) infinitivi (izričiti oblik i glas);

4) gerundi (izraziti izgled);

5) participi (izričiti padež, broj, rod, kratkoća/potpunost, vrsta, glas, vrijeme);

6) glagoli indikativnog raspoloženja sadašnjeg / budućeg vremena (izraziti broj, vrsta, zalog, vrijeme, osoba, raspoloženje);

7) glagoli indikativnog načina prošlog vremena (izraziti broj, rod, vrstu, zalog, vrijeme, raspoloženje);

8) konjunktivni glagoli (izraziti broj, rod, vrstu, zalog, raspoloženje);

9) imperativni glagoli (izraziti broj, vrstu, glas, osobu, raspoloženje);

10) gramatički neokarakterizirani oblici riječi: indeklinabilne imenice i pridjevi, komparativni stupanj i prilozi.

Upravo su tako trebali izgledati samostalni dijelovi govora u ruskom jeziku da se osnova za njihov odabir temeljila na jednoj osobini - prisutnosti zajedničkih morfoloških obilježja izraženih u samom obliku riječi.

U usporedbi s tradicionalnim dijelovima govora, ova je klasifikacija kompaktnija za naziv (nema različitih kategorija zamjenica, kardinalnih i rednih brojeva) i mnogo manje kompaktna za glagol.

ISTI SKUP ČLANOVA PARADIGME. Unutar morfološkog pristupa izdvajanju dijelova govora moguća je i druga klasifikacija. Može se temeljiti na strukturnim značajkama paradigme. Jasno je da bi u ovom slučaju imenice, na primjer, bile suprotstavljene pridjevima. Uostalom, paradigma potonjeg uključuje suprotstavljanje oblika riječi prema rodu, koje nema u imenicama. Istina, u ovom slučaju ni imenica ni pridjevi ne bi mogli održati svoje jedinstvo. Štoviše, do takve fragmentacije ne bi došlo samo zbog nepromjenjivih imenica i pridjeva. Među imenicama, veliku skupinu leksema koji imaju oblike riječi samo jednog broja (jednine ili množine, nisu bitni) trebalo bi suprotstaviti leksemama koji imaju oblike oba broja. (kuća-kuća i mladost, mlijeko). Zatim u kategoriji leksema poput mladost, mlijeko bilo bi potrebno uključiti i brojeve – zbirne i kvantitativne, te osobne i upitne zamjenice. Uostalom, svi ti leksemi imaju oblike riječi samo jednog broja.

Leksemi pridjeva podijelili bi se na tri dijela: lekseme s kratkim i punim oblicima riječi (bijeli), leksemi samo s punim oblicima riječi (veliki), leksemi sa samo kratkim oblicima riječi (radostan).

Za razliku od imenica i pridjeva po samoj prirodi skupa oblika riječi, glagol bi se u ovom slučaju morao razdvojiti u nekoliko skupina ovisno o prisutnosti ili odsutnosti aspektnog para, osobnom obliku pasiva, određenim participima. i participi itd.

SINTAKSIČKO NAČELO KLASIFIKACIJE GOVORNIH DIJELOVA

Ne treba zaboraviti da ispravan morfološki pristup odabiru dijelova govora ostaje potpuno nemoćan u odnosu na nepromjenjive riječi. Ovdje su mogući samo semantički i sintaktički pristupi.

Što se tiče nepromjenjivih riječi, tj. leksema koji se sastoje od jednog oblika riječi, sintaktički princip se pokazao vrlo učinkovitim. Bit ovog principa je odrediti one vrste leksema koji se mogu, ali i ne moraju kombinirati s riječima koje nas zanimaju, kao i razjasniti funkcije koje te riječi obavljaju u rečenici. Dakle, među nepromjenjivim riječima, imenice se kombiniraju s imenicama, pridjevima i glagolima. (HE Sibira, Krasnojarskhidroelektrana, izgraditi hidroelektranu), su subjekt, predikat, dodatak, definicija, okolnost; pridjevi se kombiniraju s imenicama (bež odijelo), su definicija ili predikat; prilozi se kombiniraju s glagolima i pridjevima (ljeti obučen, ljeti toplo), su različite vrste okolnosti.

Osim toga, ovo načelo podjele zahtijeva priznanje među nepromjenjivim riječima kao posebnu klasu tzv. oblika komparativnog stupnja, komparativna. Ove riječi, za razliku od imenica, pridjeva i priloga, kombiniraju se samo s glagolima i imenicama. (jedna stotinapostati stariji, brat je stariji od sestre). Osim toga, primjena sintaktičkog kriterija zahtijeva odabir skupine riječi koje se odnose samo na rečenicu u cjelini. (moguće, vjerojatnone, naravno, što dobro itd.). Te se riječi obično nazivaju modalnim riječima. Dakle, korištenje sintaktičkog kriterija omogućuje razlikovanje dijelova govora od nepromjenjivih riječi. Bitno je napomenuti da bi se odabir imenica i pridjeva među nepromjenjivim riječima mogao provesti i na temelju semantičkog kriterija. Semantički kriterij lako izdvaja među nepromjenjivim riječima i prilozima. Međutim, samo korištenje sintaktičkog kriterija uvodi različite gradacije među prilozima.

U ruskom gramatičkom piscu naširoko se raspravljalo o pokušaju izdvajanja posebnog dijela govora na temelju sintaktičkog načela razvrstavanja oblika riječi. Riječ je o oblicima riječi koji nisu glagolski, već se koriste u funkciji predikata. (hladan je, drago nam je, moraš, lijen za posao, prezauzet razgovorom itd.). Ovi oblici riječi dobili su status posebnog dijela govora, tzv. kategorije stanja. Kombiniranjem svih ovih oblika riječi u jedan dio govora uzima se u obzir zajedništvo njihove sintaktičke funkcije i određena semantička homogenost koja je povezana s tom zajedništvom, što je navedeno u samom nazivu "kategorija stanja". Morfološki se svi ovi oblici riječi različito karakteriziraju: hladnom ne izražava morfološke kategorije, sretan, trebao bi imati broj lijenost, nedostatak vremena- broj, slučaj.

Dosljedna primjena sintaktičkog načela na sve oblike riječi dovodi do paradoksalnih zaključaka. Dakle, kratke pridjeve, na primjer, treba suprotstaviti punim. Prvi može djelovati i u funkciji definicije i u funkciji predikata, drugi - samo u funkciji predikata. Sintaktičke funkcije raznih glagolskih oblika – osobnih, participalnih, participskih – bit će različito definirane. Istina, na temelju sintaktičkih funkcija oblici riječi kvantitativnih i zbirnih brojeva mogu se suprotstaviti oblicima riječi vlastitih imenica: poznato je da se kvantitativni i zbirni brojevi ne mogu kombinirati s pridjevima.

Možda definicija sintaktičkih funkcija u odnosu na lekseme može dati poznatije rezultate? Ovo nije istina. Unutar jednog leksema morfološki koegzistiraju različito oblikovani oblici riječi. Na potpuno isti način različiti oblici riječi istog leksema mogu obavljati različite sintaktičke funkcije. Stoga je klasifikacija po principu „sintaktičke funkcije“ za lekseme načelno nemoguća, kao što je lekseme nemoguće klasificirati na temelju homogenog morfološkog rasporeda.

REZULTATI ZA RAZLIČITE KLASIFIKACIJE

Možemo izvući neke zaključke. Problem identificiranja dijelova govora je problem klasifikacije oblika riječi.

Semantički kriterij u svojim najopćenitijim značenjima razlikuje četiri razreda punovrijedni oblici riječi - imenica, pridjev, glagol i prilog.

Morfološki kriterij ističe devet razreda oblikovani oblici riječi i neobličeni oblici riječi.

Sintaktički kriterij primijenjen na morfološki neokarakteriziranu skupinu omogućuje razlikovanje između potonjih imenica, pridjeva, priloga, komparativa (komparativnog stupnja), kategorije stanja i modalnih riječi. U načelu je moguće primijeniti sintaktički kriterij na oblike riječi, ali će njegovi rezultati biti u suprotnosti s rezultatima morfološke i semantičke analize.

NAČELA KLASIFIKACIJE I TRADICIONALNI DIJELOVI GOVORA

Iz navedenog je jasno da je tradicionalna doktrina o dijelovima govora a priori klasifikacija, čiji su logički temelji vrlo heterogeni. Međutim, ova klasifikacija omogućuje da se bilo koji oblik riječi ili leksem smjesti u prikladnu rubriku. Ima mjesta i za imenice, i za pridjeve, i za brojeve, i za glagole, i za priloge. Istodobno, zbog logičke nesavršenosti, tradicionalna klasifikacija razdvaja ono što bi, iz nekih logičnih razloga, trebalo biti zajedno.

Školski brojevi, primjerice, kombinirajući kvantitativne zbirne i redne brojeve na semantičkoj osnovi, odvajaju potonje od pridjeva, unatoč njihovoj morfološkoj i sintaktičkoj općenitosti. Želja za izdvajanjem kategorije stanja među ruskim dijelovima govora objašnjava se činjenicom da jedinice s istim sintaktičkim funkcijama postoje i u naslovu "imenice". (nedostatak vremena, lijenost) i u naslovu "pridjevi" (sretan, puno) i u naslovu "prilozi" (dosadno, zabavno).

Upravo je u “a priori” snaga tradicionalne doktrine o dijelovima govora - sposobnost karakterizacije bilo kojeg predmeta provjerenog stoljećima - i njegova slabost, otvorenost za kritiku logičkih temelja na kojima se klasifikacija nalazi.

Nemoguće je ne primijetiti još jednu prednost tradicionalne klasifikacije dijelova govora. Neke jedinice, iako su sasvim logične, mogu se istovremeno smjestiti u jednu i drugu rubriku. To je vrlo zgodno, budući da u brojnim dijelovima sustava dijelova govora postoje stalni prijelazi (pridjevi na imenice, participi na pridjeve itd.).

Sve te okolnosti unaprijed određuju održivost tradicionalne doktrine o dijelovima govora.

Kao što je već spomenuto, doktrina o dijelovima govora važna je ne samo za morfologiju, već i za druge dijelove opisa ruskog jezika. Tradicionalna doktrina o dijelovima govora ne odražava rezultate nijedne od ovih klasifikacija (usp. s kriterijima za definiranje riječi), ali je svojevrsni kompromis između svih ovih principa. Bitnu ulogu u postizanju takvog kompromisa igra činjenica da dijelovi govora koji su dodijeljeni iz različitih razloga čine vrlo raznolike skupine. Usporedite, na primjer, imenice i takozvanu kategoriju stanja, glagola i modalne riječi.

LITERATURA NA TEMU

"DIJELOVI GOVORA KAO LEKSIČKO-GRAMATIČKE KATEGORIJE RIJEČI"

Zhirmunskiy V. M. O prirodi dijelova govora i njihovoj klasifikaciji. - U knjizi: Pitanja teorije dijelova govora na materijalu jezika raznih vrsta. L., 1965.

Panov M. V. O dijelovima govora u ruskom jeziku - Znanstvena izvješća o visokom obrazovanju. Philol. Nauki, 1960, br.4.

Steblin - Kamensky M.I. O pitanju dijelova govora. - Bilten Lenjingradskog državnog sveučilišta, 1954, br. 6.

Shcherba L.V. O dijelovima govora na ruskom jeziku. - U knjizi: Izabrana djela o ruskom jeziku. M., 1957. .-

napomena

Članak je posvećen problemima semantičke analize tekstova. Razmatrano razne metode: konceptualni dijagrami ovisnosti i semantičke mreže; pristupi temeljeni na leksičkim funkcijama i tematskoj nastavi; okvirni i ontološki modeli; logički modeli predstavljanja znanja. Svaki od njih ima svoje prednosti i nedostatke.

Stvaranje novih metoda za semantičku analizu tekstova relevantno je za rješavanje mnogih problema računalne lingvistike, kao što su strojno prevođenje, autoapstraktno, klasifikacija teksta i dr. Jednako je važan razvoj novih alata za automatizaciju semantičke analize.

Metode i sustavi semantičke analize teksta

Semantika je grana lingvistike koja proučava semantičko značenje jezičnih jedinica. Osim znanja o strukturi jezika, semantika je usko povezana s filozofijom, psihologijom i drugim znanostima, jer neizbježno postavlja pitanja o podrijetlu značenja riječi, njihovom odnosu prema biću i mišljenju. U semantičkoj analizi potrebno je uzeti u obzir društvene i kulturne karakteristike izvornog govornika. Proces ljudskog mišljenja, kao i jezik, koji je alat za izražavanje misli, vrlo je fleksibilan i teško ga je formalizirati. Stoga se semantička analiza s pravom smatra najtežom fazom automatske obrade teksta.

Stvaranje novih metoda semantičke analize tekstova otvorit će nove mogućnosti i omogućiti
napraviti značajan napredak u rješavanju mnogih problema računalne lingvistike, kao što su strojno prevođenje, autoapstrakcija, klasifikacija teksta i drugi. Ništa manje relevantan nije razvoj novih alata za automatizaciju semantičke analize.

Trenutno postoji nekoliko metoda za predstavljanje značenja izjava, ali niti jedna nije univerzalna. Mnogi istraživači su radili na povezivanju značenja teksta. Dakle, I.A. Melchuk je uveo pojam leksičke funkcije, razvio pojmove sintaktičkih i semantičkih valencija i razmatrao ih u kontekstu eksplanatorno-kombinatornog rječnika, koji je jezični model. Pokazao je da značenja riječi nisu izravno povezana
s okolnom stvarnošću, ali s idejama izvornog govornika o ovoj stvarnosti.

Većina istraživača sklona je mišljenju da semantičku analizu treba izvesti nakon sintaktičke analize. V.Sh. Rubaškin i D.G. Lahuti je uveo hijerarhiju sintaktičkih veza za više učinkovit rad semantički analizator. Najvažnije su obvezne veze uloga, zatim koreferentne veze, zatim fakultativne veze uloga, pa tek onda subjekt-asocijativne.

Poznati lingvist E.V. Paducheva predlaže razmatranje tematskih klasa riječi, posebno glagola, budući da oni nose glavno semantičko opterećenje: glagoli percepcije, glagoli znanja, glagoli emocija, glagoli odlučivanja, govorne radnje, pokreti, glasovni glagoli, egzistencijalni glagoli, itd. Bitna je u ovom pristupu ideja podjele pojmova jezika u neke semantičke skupine, uzimajući u obzir činjenicu da ti koncepti imaju neku netrivijalnu zajedničku semantičku komponentu. Elementi takvih skupina imaju tendenciju da imaju isti skup ovisnih pojmova. No, glavni je problem ovakvog pristupa što je odabir tematske nastave i sastavljanje semantičkih rječnika izuzetno dugotrajan proces, koji uvelike ovisi o individualnoj percepciji i interpretaciji pojmova od strane određene osobe.

Univerzalni jezik predstavljanja znanja trebao bi biti zgodan alat za izvlačenje novih znanja iz postojećih, što znači da je potrebno izraditi aparat za provjeru ispravnosti iskaza. Ovdje su korisni logički modeli predstavljanja znanja. Na primjer, semantički jezik koji je predložio V.A. Tuzova, sadrži formalizme logike predikata, sadrži "atomske" koncepte, "funkcije" nad tim konceptima i pravila zaključivanja koja se mogu koristiti za opisivanje novih pojmova. Moguće je da će se znanstvena misao u budućnosti razvijati u smjeru stvaranja takvih semantičkih jezika.

Unatoč činjenici da se neke znanstvene i tehničke ideje u području obrade teksta razvijaju prilično brzo, mnogi problemi u semantičkoj analizi ostaju neriješeni. Većina istraživača došla je do zaključka da rječnik koji podržava semantičku analizu mora operirati značenjima i stoga opisivati ​​svojstva i odnose pojmova, a ne riječi. No, postavlja se pitanje kako pravilno strukturirati i prezentirati informacije u takvim rječnicima kako bi pretraživanje po njima bilo zgodno i brzo, a osim toga, bilo bi moguće uzeti u obzir promjene u prirodnom jeziku (nestanak starih i nastanak novih). koncepti). Ovaj članak pokušava sistematizirati poznata dostignuća na području semantičke analize i donekle pronaći odgovor na to i druga pitanja.

Proučavanje semantike u okviru teorije "Značenje ↔ Tekst"

Prilikom stvaranja teorije "Značenje ↔ Tekst" I.A. Melchuk je uveo pojam leksičke funkcije.
S formalne točke gledišta, leksička funkcija je funkcija čiji su argumenti neke riječi ili fraze određenog jezika, a čije su vrijednosti skupovi riječi i izraza istog jezika. Pritom su od značajnog interesa i razmatraju se samo one leksičke funkcije koje imaju frazeološki srodna značenja – značenja koja su s nekim argumentima moguća, a s drugima nemoguća.

Drugim riječima, leksička funkcija je određeni semantički odnos, na primjer, "jednakost u značenju" (Syn), "suprotno u značenju" (Anti) itd. Neka postoji određeni broj leksičkih jedinica - riječi i izraza; tada ova leksička funkcija svakoj od tih jedinica dodjeljuje skup leksičkih jedinica koje su u odgovarajućem semantičkom odnosu s izvornom jedinicom.

Vrijednosti iste leksičke funkcije iz različitih argumenata mogu se potpuno ili djelomično podudarati; vrijednosti različitih funkcija iz jednog argumenta također se mogu podudarati. Alternativni korelati uključeni u vrijednost dane leksičke funkcije danog argumenta ne moraju biti zamjenjivi uvijek i u bilo kojem kontekstu. Mogu se razlikovati po stilskim karakteristikama, u svim vrstama kompatibilnosti, u gramatičkim uvjetima upotrebe i, konačno, čak i po značenju. Potonje je posebno važno naglasiti: različiti korelati ne moraju uvijek biti potpuno istoznačni; dovoljno je da njihova značenja imaju zajednički dio koji odgovara zadanoj leksičkoj funkciji, a razlike ne prelaze neke granice, odnosno nisu “previše značajne”.

U općem slučaju, leksička funkcija nije definirana za sve riječi i izraze. Prvo, neke su funkcije definirane samo za jedan ili drugi dio govora: tako su Oper, Func i Labor zamislivi samo za imenice. Drugo, ova ili ona funkcija može se definirati samo za riječi određene semantike: Magn - za riječi čije značenje dopušta stupnjevanje („više - manje”); Opera, Func i Labor definirani su samo za nazive situacija.

Treba imati na umu da čak i uz potpuno prikladan (u smislu njegovih sintaktičkih i semantičkih svojstava) argument, leksička funkcija možda neće imati značenje (u danom jeziku). Na primjer, sinonimi su u principu mogući za bilo koju riječ, ali samo neke ih imaju. To je zbog frazeološke prirode leksičkih funkcija.

Mora se još jednom naglasiti da su inicijalno leksičke funkcije uvedene izričito da opisuju leksičku kompatibilnost, a ne da predstavljaju značenje u općem smislu, pa ih ne treba sve tumačiti kao semantičke jedinice. Odnos između leksičkih funkcija i značenja daleko je od jednoznačnog. Neke leksičke funkcije mogu zahtijevati status semantičkih elemenata, druge mogu imati nikakvo značenje, a treće mogu pokrivati ​​vrlo složeno značenje.

S naše točke gledišta, nije sasvim ispravno i zgodno govoriti o leksičkim funkcijama kao o "viševrijednim" funkcijama. Prikladnije je govoriti o leksičkim predikatima. Slijedi popis jednostavnih standardnih leksičkih "funkcija" (ovdje će biti predstavljene u obliku predikata).

1. Syn (x, y), x, y su sinonimi.

2. Conv (x, y), x, y su konverzivni.

3. Anti (x, y), x, y su antonimi.

4. Der (x, y), y je sintaktička izvedenica od x, odnosno y je isto što i x po značenju, ali pripada drugom dijelu govora:

S0 (x, y), y je imenica izvedena od x (x nije imenica);

A0 (x, y), y je pridjev izveden od x (x nije pridjev);

Adv0 (x, y), y je prilog izveden od x (x nije prilog);

V0 (x, y), y je glagol izveden od x (x nije glagol).

Drugim riječima, "x"y (Der (x, y) « S0 (x, y) Ú A0 (x, y) Ú Adv0 (x, y) Ú V0 (x, y)).

5. Gener (x, y), y je generalizirajući pojam u odnosu na pojam označen s x (x = jagoda, y = bobica). Ovaj predikat ovisi o leksičkoj kompatibilnosti riječi u danom jeziku: ako su x i m riječi dvaju različitih jezika koje imaju isto značenje, tada za Gener (x, y) i Gener (m, n), respektivno, y i n možda nemaju isto značenje.

Situacija je određena leksička refleksija (na danom jeziku) nekog dijela stvarnosti. Situacije koje se označavaju pojedinim leksičkim jedinicama prirodnih jezika (leksemi) obično imaju od jedne do četiri semantičke komponente, odnosno semantičke aktante, označene velikim latinskim slovima A, B, C, D. Pri tome je svaki takav leksem povezan s duboko-sintaktičkim aktantima su njegovi zavisnici, koji odgovaraju subjektu i jakim objektima (ako je ovaj leksem ostvaren glagolskim predikatom). Duboki sintaktički aktanti numerirani su arapskim brojevima: 1, 2, 3, 4.

6. Si (x, y), i = 1, …, 4, y je tipično ime i-tog aktanta za x.

7. Sc (x, y), y je kružna konstanta, odnosno tipičan naziv za sporednu komponentu dane situacije x:

Sloc (x, y), y – tipičan naziv mjesta gdje se ova situacija x događa; “gdje…” (x = bitka, y = polje (bitka));

Sinstr (x, y), y – tipičan naziv instrumenta koji se koristi u datoj situaciji x; “ono čime / pomoću čega...” (x = borba, x = instrument (borbe));

Smod (x, y), y - tipičan naziv načina (načina, karaktera) provedbe ove situacije x; “kako…” (x = život, y = slika (života));

Sres (x, y), y – tipičan naziv rezultata ove situacije; "ono što dobijete" (x = kopija, y = kopija).

Drugim riječima, "x"y (Sc (x, y) « Sloc (x, y) Ú Sinstr (x, y) Ú Smod (x, y) Ú Sres (x, y)).

8. Relativni predikati Znak (x, y), y je tipično ime jedne “stvari”, jednog “kvanta” nekog x; Mult (x, y), y je tipičan naziv zbirke, skupa.

9. Sigur (x, y), y je metafora za x (x = san, y = zagrljaj (san)).

10. Centr (x, y), y - oznaka tipa “središnjeg” dijela objekta ili procesa.

11. Ai (x, y), i = 1, …, 4, y – tipična definicija i-tog aktanta po njegovoj stvarnoj ulozi; "jedan koji..."; "onaj koji..."

12. Ablei (x, y), i = 1, …, 4, y – tipična definicija i-tog aktanta prema njegovoj potencijalnoj ulozi u situaciji; "onaj koji može..."; "onaj koji može biti..."

13. Magn0 (x, y) i Magni (x, y), i = 1, …, 4, y označava “visok stupanj”, “intenzitet” same situacije x (Magn0) ili njezin i-ti aktant (Magni ).

14. Ver (x, y), y - “ispravno”, “odgovara namjeni”, “ono što slijedi” u odnosu na x.

15. Bon (x, y), y - "dobro" u odnosu na x.

16. Advix (z, y), i = 1, …, 4, x = A, B, C, D, y - naziv situacije kao definicija s glagolom koji imenuje drugu situaciju:

AdviA (z, y), i = 1, …, 4, y je riječ nastala od z, koja, zamjenjujući z u tekstu, zahtijeva pretvaranje u vrh (umjesto z) prvog aktanta ovog z (x = pratiti, y = zajedno s).

AdviB (z, y), i = 1, …, 4, y zahtijeva da drugi aktant z postane vrh (x = pogrešan, y = pogrešan).

17. Loc (x, y), y - prijedlog tipične lokalizacije (prostorne, vremenske ili apstraktne):

Locin (x, y), y – “statična” lokalizacija (x = Moskva, y = in);

Locad (x, y), y - prijedlog smjera (x = Moskva, y = do);

Locab (x, y), y je prijedlog uklanjanja (x = Moskva, zatim y = iz).

Drugim riječima, "x" y (Loc (x, y) « Locin (x, y) Ú Locad (x, y) Ú Locab (x, y)).

Ponekad se Loc(x, y) ne može jednoznačno odrediti (x=snijeg, y=on i y=in).

18. Copul (x, y), y – vezni glagol “biti”, “biti” (x = napadnut, y = napadnut).

19. Oper1 (x, y), Oper2 (x, y), y – glagol koji povezuje ime prvog (odnosno drugog) aktanta kao subjekta s nazivom situacije kao prvog objekta (ako je x = potpora , tada y = render za Oper1 (x, y) i y = pronađi ili susret za Oper2 (x, y)).

20. Func0 (x, y), Func1 (x, y), Func2 (x, y), y je glagol koji ima naziv situacije kao subjekt x s imenima aktera (ako ih ima) kao objekt (x = kiša, y = ići).

21. Rad12 (x, y), y je glagol koji povezuje ime prvog aktanta kao subjekta, s imenom drugog aktanta kao prvog objekta i s nazivom situacije kao drugog objekta (x = red, y = nagrada; x = kazna, y = razotkrivanje).

22. Causij (x, y), y – djelovanje aktanata “učiniti da…”, “uzrok”. U slučaju bez aktantnih indeksa Caus (x, y), x je ime nesudionika u situaciji (x = zločin, y = guranje). Zasebno se pojavljuje samo s glagolima, u drugim slučajevima je dio složenih parametara.

23. Incep (x, y), y - “početak”. Svojstva su ista kao i za Causij (x, y).

24. Perf (x, y), y - “savršeno”, y nosi završetak radnje, postizanje njezine prirodne granice. Perf (x, y) nema zaseban nezavisni izraz na ruskom; tipično, ovaj predikat vrijedi ako je y savršen (x = čitanje, y = čitanje).

25. Rezultat (x, y), y - "rezultat", odnosno y - "stanje kao rezultat ..."; koristi se za nesavršene oblike (x = leći, y = leći za Perf (x, y), y = ležati za Rezultat (x, y)).

26. Činjenica j (x, y), y - “ostvariti”, “ispuniti”. Nadskript (rimski brojevi) predstavlja, ako je prikladno, stupanj ispunjenja podrazumijevanog zahtjeva, s nižim indeksom koji je dodijeljen nižem stupnju (ako je x = zamka i j = I, onda y = okidač; ako je j = II, tada y = uhvatiti).

27. Real j1,2(x, y), y – “implementirati”, “ispuniti zahtjev” sadržan u x. Indeks j ima isto značenje kao i gore - stupanj dovršenosti; indeks označava duboko sintaktički aktant koji ispunjava zahtjev (x = dug (gotovina), y = prepoznati za Real I1,2(x, y), y = otplatiti za Real II1,2(x, y)).

28. Destr (x, y), y je tipičan naziv za “agresivnu” akciju (x = osa, y = ubod).

29. Kapa (x, y), y - “glava” (x = fakultet, y = dekan).

30. Oprema (x, y), y - “osoblje” (x = stanovništvo, y = države).

31. Dokument (x, y), y - "dokument":

Docres (x, y), y - "dokument koji je rezultat"; "utjelovljeno" (x = izvješće, y = izvješće);

Docperm (x, y), y - “dokument za pravo ...” (x = vlak, y = (putna) karta za Docperm Oper2 (x, y));

Doccert (x, y), y - "dokument koji potvrđuje ..." (x = visoko obrazovanje, y = diploma).

Drugim riječima, "x" y (Doc (x, y) « Docres (x, y) Ú Docperm (x, y) Ú Doccert (x, y)).

Osim gore navedenih jednostavnih leksičkih predikata, njihove se kombinacije mogu koristiti i za opisivanje leksičke kompatibilnosti – složeni predikati:

AntiReal2 (x, y): pao na ispitu / pao na ispitu;

IncepOper2 (x, y): steći popularnost, pasti u očaj;

IncepOper2 (x, y): ići u prodaju, biti pod vatrom;

CausOper2 (x, y): stavljen pod kontrolu, stavljen u promet.

Kao što je ranije navedeno, u općem slučaju, leksička funkcija nije definirana za sve riječi i izraze. Funkcija se može definirati samo za riječi s određenom semantikom. Na primjer, Cap and Equip - za riječi čije značenje podrazumijeva prisutnost "šefa" i "stožera", odnosno za nazive institucija i organizacija u najširem smislu; Stvarni - za riječi čije značenje uključuje komponentu "zahtjevati" ("potreba") itd.

Ako su leksičke funkcije predstavljene kao predikati, nema poteškoća.
U slučajevima kada leksičke funkcije nisu definirane, njihovi će odgovarajući predikati biti lažni.

Posebna uloga u proučavanju semantike u pristupu I.A. Melchuka igra valencija riječi, odnosno sposobnost riječi da stupe u vezu s drugim riječima. Riječi koje definiraju situaciju imaju valencije. To su sve glagoli, neke imenice (glagolske), pridjevi (koji označavaju usporedbu: više, manje, više, niže), neki prijedlozi i prilozi.

Postoje dvije vrste valencija riječi: sintaktičke i semantičke. Iako je ova podjela ponekad prilično proizvoljna. Semantičke valencije određuju se leksičkom analizom situacije koju daje određena riječ. Uzmimo primjer s riječju najam ili najam. A daje u zakup C znači da, za određenu naknadu D, osoba A stječe od druge osobe B pravo upravljanja imovinom C tijekom vremena T. Stoga je bitno za situaciju najma
su sljedeći "sudionici" ili semantički aktanti: subjekt zakupa (onaj koji iznajmljuje), prvi objekt zakupa (ono što se iznajmljuje), protustranka (onaj od koga je zakupnina), drugi objekt (naknada) i rok.

Ti su aktanti nužni jer eliminacija bilo kojeg od njih mijenja smisao situacije. Na primjer, ako uklonite pojam, tada se situacija zakupa transformira u situaciju kupnje i prodaje. S druge strane, ovi akti su dovoljni, jer u situaciji rente nije potrebno naznačiti iz kojeg razloga, gdje, kada i u koju svrhu je izvršena. Iako su odgovarajući oblici riječi gramatički vezani uz glagolsku rentu.

Drugim riječima, semantička valencija određena je brojem semantičkih aktanata. Dakle, glagol renta ima semantičku valenciju 5, budući da ima 5 semantičkih aktanata. Formalno, ova se situacija može zapisati kao predikat P (x1, x2, x3, x4, x5), gdje je x1 "tko", x2 je "što", x3 je "od koga", x4 je "naknada", x5 je "pojam".

Ne mogu se svi semantički aktanti definirati u rečenici, neki se jednostavno ne spominju ili uopće nemaju sintaktički izraz. Sintaktičke valencije određene su brojem sintaktičkih aktanata koji su izravno predstavljeni u tekstu (odnosno subjekata i objekata pridruženih glagolu) i ovise o kontekstu.

Primjerice, semantička valencija glagola propustiti je 4, budući da ima 4 aktanta: tko (činitelj), u što / za što (meta), iz čega (oružje - izborno) i što (organ, sredstvo). No u većini konteksta sintaktički je izražena samo jedna valentnost, na primjer, u rečenici "Dugo je ciljao, ali je promašio". Ipak, fraza "Promašio je prozor s bocom" nije sasvim točna.

S formalne točke gledišta, imamo konstrukciju opisanu u nastavku. Kako ne bismo uz svaki glagol (i druge riječi) povezali poseban predikat, razmotrit ćemo predikat čija je dimenzija veća za 1: P val(y, x1, x2, …, xn), dok će y biti sama riječ , i x1, x2, …, xn su njegove valencije. Da biste razlikovali sintaktičke i semantičke aktante, možete koristiti više indeksa za označavanje aktanata danih u tekstu. Oznaka znači da su dati aktanti i1, i2, …, ik.
Konkretno, ako su dati svi aktanti, onda dobivamo. Neke varijante (skupovi više indeksa) možda nisu dopuštene u jeziku. Ako je skup i1, i2, …, ik dopušten, onda je implikacija

Štoviše, ako postoje dva skupa valjanih multi-indeksa i , tako da (i1, i2, …, ik) Ê (i1", i2", ..., je"), onda postoji slična implikacija

Eksplanatorno-kombinatorni rječnik jedan je od glavnih teorijskih izuma I.A. Melchuk.
U određenom smislu, jezični model koji je predložio I.A. Melchuk, predstavlja jezik kao zbirku rječničkih natuknica s ogromnom količinom raznih informacija; gramatička pravila u takvom rječniku igraju prilično sporednu ulogu. Eksplanatorno-kombinatorni rječnik odražava, prije svega, netrivijalnu kompatibilnost leksema. O jeziku možemo razmišljati kao o vrlo velikom modelu u kojem su definirani leksički predikati koji djeluju na gore opisani način.

Članak eksplanatorno-kombinatornog rječnika nosi podatke o valencijama pojedine riječi, što je istinito ne samo u njezinim okvirima, već iu okviru cijelog jezika u cjelini. Valencija odgovara predikatu, gdje su semantički aktanti riječi cx, n je valencija riječi cx. Na primjer, u rečenici Petya čita knjigu, cx = čitaj, n = 2: y1 = Petya, y2 = knjiga, odnosno, uvjetno, možete napisati P val (cx , y1, y2) = 1.

Skup članaka u eksplanatorno-kombinatornom rječniku može se smatrati nekim podmodelom izvornog modela, a to je jezik. Leksički predikati koji su sada definirani na užem skupu djelovat će slično.

Neka F označava skup dobro oblikovanih izraza prirodnog jezika L i j n F je izraz iz ovog skupa; – riječ cx je uključena u sintagmu j, a cx n L. Neka je cx imenica ili pridjev. Označimo s Predikatom skup predikata definiranih na L. Jedan od elemenata ovog skupa je predikat valencije P val (cx , y1, …, yn) koji je uveden ranije.

Slično, možemo pretpostaviti da postoje i drugi predikati:

je rodni predikat Rod , gdje je n (g1, g2, g3), g1 = žensko; g2 = muško; g3 = usp.;

je prijedlog prijedloga Prijedlog , gdje je O (pr1, …, prk) skup prijedloga koji se mogu kombinirati s danom riječju;

je padežni predikat Padeži , gdje je padež riječi cx; za različite jezike broj padeža je različit: na primjer, u ruskom postoji šest padeža, dakle Î (case1, case2, case3, case4, case5, case6), case1 = im.p.; slučaj2 = rod; slučaj3 = skup podataka; slučaj4 = pobjeda.p.; padež5 = stvaralački str.; slučaj6 = prijedlog; Njemački ima četiri padeža, tako da Î (slučaj 1, slučaj 2, slučaj 3, slučaj 4), gdje je slučaj 1 = Nom; slučaj2 = Gen; slučaj3 = Dat; slučaj4 = Suk.

Rječnička natuknica eksplanatorno-kombinatornog rječnika sadrži glavnu riječ, leksičke predikate povezane s njom i podatke o valentnosti te riječi. Informacija o valentnosti uključuje broj koji označava broj aktanata, a za svaki aktant naznaku u kojim se padežima i s kojim prijedlozima koriste riječi koje odgovaraju tom aktantu. U nekim slučajevima može biti naznačen i rod riječi.

Gore navedeno može se predstaviti skupom predikata oblika

gdje je xi slobodna varijabla koja odgovara i-tom aktantu.

Teorija "Značenje Û teksta" kreirana je od samog početka za primjenu u primijenjenim problemima automatskog prevođenja. Prema I.A. Melchuk je uz njegovu pomoć, za razliku od tradicionalnih nerigoroznih teorija, trebalo osigurati izgradnju "radnog" modela jezika. Teorija "Značenje Û teksta" doista je korištena u nekim sustavima strojnog prevođenja razvijenim u Rusiji, prvenstveno u englesko-ruskom sustavu automatskog prevođenja ETAP, koji je stvorila grupa predvođena Yu.D. Apresyan. Svi ti sustavi su eksperimentalni, odnosno njihova industrijska uporaba nije moguća. Iako sadrže mnogo jezično korisnih informacija, općenito niti jedna od njih još nije donijela napredak u kvaliteti prijevoda.

Prema autorovom mišljenju, glavna vrijedna ideja ove teorije je da značenja riječi nisu u izravnoj korelaciji s okolnom stvarnošću, već s idejama izvornog govornika o ovoj stvarnosti (ponekad se nazivaju konceptima). Priroda pojmova ovisi o specifičnoj kulturi; sustav pojmova svakog jezika tvori takozvanu "naivnu sliku svijeta", koja se u mnogim detaljima može razlikovati od "znanstvene" slike svijeta, koja je univerzalna. Zadaća semantičke analize vokabulara u teoriji "Značenje Û teksta" je upravo otkriti "naivnu sliku svijeta" i opisati njezine glavne kategorije. Drugim riječima, važna uloga ove teorije je da opiše ne samo objektivnu, već i subjektivnu sliku svijeta.

Unatoč činjenici da je interes za teoriju I.A. Melchuk nestaje, označavanje sintaktičkog korpusa "Nacionalni korpus ruskog jezika" izvodi jezični procesor ETAP-3, na temelju principa teorije "Značenje Û Tekst".

Kao što je gore spomenuto, Yu.D. Apresyan. Njegove su ideje donekle drugačije od onih I.A. Melchuk. Središnje mjesto u Yu.D. Apresyan zauzima novu vrstu sinonimnog rječnika. Za ovaj rječnik razvijena je detaljna shema za opisivanje sinonimskih nizova, gdje je svaki element niza okarakteriziran u smislu semantike, sintakse, kompatibilnosti i drugih svojstava. Rječnik sadrži i sažima maksimalnu količinu informacija o jezičnom ponašanju ruskih sinonima.

Konceptualni dijagrami ovisnosti

Konceptualna i analiza slučaja

U fazi morfološke i semantičko-sintaktičke analize tekstova glavne jedinice koje označavaju pojmove su riječi. U pravilu se vjeruje da se značenje fraza i fraza može izraziti kroz značenja riječi koje su u njima sastavljene. Kao iznimke, razmatra se samo ograničen broj stabilnih fraza - idioma. Ovaj pristup temelji se na pretpostavci da se fraze koje se nalaze u jeziku mogu podijeliti na "slobodne" i "neslobodne".

Drugi pristup temelji se na činjenici da su najstabilnije (nedjeljive) jedinice značenja kategorije i pojmovi, koji se ne sastoje od neovisnih riječi, već od fraza. Takve kategorije i pojmovi nazivaju se pojmovima. Ovakvim pristupom „neslobodne“ fraze nisu samo idiomatski izrazi, već i sve stabilne frazeološke jedinice jezika i govora (u razvijenim jezicima ih ima na stotine milijuna).

Ideja konceptualne analize kao sastavnog dijela semantičke analize nalazi se i u studijama V.Sh. Rubaškin i D.G. Lahuti. U ovom se dijelu ukratko izlažu pogledi na pitanje koje zadaće treba rješavati pomoću konceptualne semantičke analize.

Unos semantičke komponente mora primiti sintaktički označeni tekst. Označeni tekst treba sadržavati različite informacije: identifikatore pojmova koji odgovaraju riječi (pojam); naznaka sintaktičkog hosta (svi alternativni hostovi) i vrste sintaktičke veze itd.

Prije prelaska na semantičku komponentu moraju se prepoznati i pojmovi-fraze, objediniti prikaz brojčanih informacija, prepoznati vlastita imena itd. U stvarnim projektima svi se ovi zadaci rješavaju s različitim stupnjevima aproksimacije. Možemo pretpostaviti da se stručna zajednica složila barem oko sljedećih pitanja.

Semantička analiza, u smislu korištenih metoda i sredstava, treba sadržavati dvije faze: a) fazu tumačenja gramatički izraženih (sintaktičkih i anaforičnih) poveznica i b) fazu prepoznavanja poveznica koje nemaju gramatički izraz.

Dvosmislenosti treba rješavati samim postupkom analize – prema kriteriju stupnja semantičkog zadovoljstva dobivenog rezultata u svakoj verziji.

Ključna točka sustava semantičke analize je učinkovita rječnička podrška.
U tom je smislu svaki sustav semantičke analize orijentiran na tezaurus. Postupci semantičke analize u svim slučajevima bez iznimke temelje se na funkcionalnosti pojmovnog rječnika. Kako bi podržao semantičku analizu, rječnik mora operirati sa značenjima i stoga opisivati ​​svojstva i odnose pojmova, a ne riječi. Ovo je konceptualni rječnik. U određenom smislu, ulogu konceptualnog rječnika mogu odigrati semantičke mreže, koje su opisane u sljedećem odjeljku.

U semantičkom interpretatoru, prije svega, potrebno je navesti koje se razlikuju tipove semantičkih odnosa u tekstu: igranje uloga (veze prema valentnosti predikata), subjekt-asocijativni (odnosi između objekata, procesa, značajni u predmetno područje - biti dio, imati mjesto, biti namijenjen, biti glavni grad itd.) itd.

Prihvaćaju se sljedeći glavni postulati tumačenja sintaktičkih odnosa.

1. Tip uspostavljene semantičke relacije određen je semantičkim klasama i
u pojedinim slučajevima detaljnije semantičke karakteristike sintaktičkih "gospodar" i "sluga".

2. Prijedlozi se ne smatraju samostalnim objektom tumačenja, već dodatnom (semantičko-gramatičkom) obilježjem veze između sintaktičkog "vlasnika" prijedloga i značajne riječi koju on kontrolira.

3. Da bi razriješio leksičku i sintaktičku homonimiju koju je fiksirao parser, semantički tumač koristi sustav empirijski utvrđenih preferencija. Radi lakše usporedbe preferencija opcija tumačenja, dodijeljeni su im brojčani rangovi. Na razini tipova semantičkih odnosa uspostavlja se sljedeći redoslijed preferencija (redoslijed nabrajanja odgovara smanjenju prioriteta odnosa):

- funkcionalne veze i veze koje utvrđuju činjenicu semantičke redundancije;

– veze uloga, definirane kao obvezne, uz prisutnost semantički dosljednog aktanta;

– koreferentne veze;

– odnosi uloga definirani kao izborni;

- navedene subjekt-asocijativne veze;

- subjekt-asocijativne veze nisu specificirane.

Specificirane sintaktičke veze su one koje je tumač sposoban leksikalizirati s određenim odnosom u predmetnom području (lučki objekti ® objekti smješteni u luci); prema tome, nespecificirane veze su one za koje tumač ne uspijeva ponuditi takvu specifikaciju i koje se tumače općim konceptom povezanog.

U slučaju otkrivanja sintaktičke homonimije koordinativnih poveznica, preferencije se određuju stupnjem konzistentnosti semantičkih karakteristika sudionika u sintaktičkoj poveznici.

Leksičke i lokalne sintaktičke nejasnoće (prisutnost alternativnih domaćina u riječi) obrađuju se u jednom mehanizmu nabrajanja. Globalne opcije za raščlanjivanje rečenice razmatraju se u mehanizmu nabrajanja sljedeće razine. U ovom slučaju uspoređuju se ukupne težine interpretacije svih rečeničnih veza.

Kod uspostavljanja različitih vrsta odnosa tumačenje je određeno sljedećim odredbama.

Prilikom uspostavljanja odnosa uloga značajne su sljedeće gramatičke karakteristike sudionika sintaktičke veze i treba ih uzeti u obzir (u odnosu na ruski jezik):

– semantičko-sintaktički tip predikata (rječnička karakteristika);

je gramatički oblik predikata;

– padež aktanta, mogućnost pridjevskog oblika za aktant prema zadanoj valentnosti;

- mogućnost predloške kontrole aktanta i sposobnost prijedloga koji tvori sintaktičku vezu da izrazi odnos prema zadanoj valentnosti; informacija o sposobnosti prijedloga da služi kao indikator uloge za danu valenciju pohranjena je u rječničkom opisu prijedloga.

Operativno, postupak određivanja moguće uloge aktanta određen je gramatikom odnosa uloga, čime se uspostavlja korespondencija oblika

(Rf, GFP, TSEMU) ® VAL,

gdje je Rf naziv sintaktičke veze; GFP je gramatički oblik predikata; TSEMU – semantičko-sintaktički tip predikata; VAL je naziv moguće valencije ili referenca na ulogu uloge prijedloga.

Zatim se provjerava korespondencija semantičkih karakteristika aktanta sa semantičkim uvjetom za popunjavanje valentnosti predikata (provjerava se kompatibilnost odgovarajućeg para pojmova volumena).

Za uspostavljanje korelacijske relacije potrebni su i dovoljni sljedeći uvjeti:

– “gospodar” i “sluga” pripadaju semantičkoj kategoriji Objekt;

– koncepti koji odgovaraju pojmovima „gospodar” i „sluga” u vezi su s kompatibilnošću volumena;

- kod prijedložne veze provjerava se sposobnost ovog prijedloga da izrazi odnos koreferencije.

Za uspostavljanje navedenih subjekt-asocijacijskih odnosa potrebni su i dovoljni sljedeći uvjeti:

- pojmovi koji odgovaraju pojmovima "gospodar" i "sluga" su u odnosu na volumensku nespojivost, ili su (u slučaju njihove kompatibilnosti) ovi pojmovi sintaktički povezani preko prijedloga koji nije u stanju izraziti odnos koreferencije;

- uz par pojmova "gospodar - sluga" rječnički se povezuje neka predmetna relacija
(<автомобиль, кузов>® imaju dio) i/ili (ako je veza prijedložna) odnos subjekta povezan je s prijedlogom i padežom.

Za uspostavljanje nespecificiranih subjekt-asocijativnih odnosa nužni su i dovoljni istinitost prvog i netočnost drugog uvjeta.

Analiza "po modelu" (analiza slučaja), temeljena na korištenju korpusa unaprijed označenih tekstova, postaje sve važnija. Razumno izgrađen sustav analize trebao bi osigurati ne samo izvlačenje znanja iz određenog teksta, već i akumulaciju rezultata na sintaktičkoj i semantičkoj razini – za daljnju upotrebu kao presedan.

Jedan od najvećih i najznačajnijih projekata koji se trenutno provode je stvaranje Nacionalnog korpusa ruskog jezika. U njemu sudjeluje velika skupina jezikoslovaca iz Moskve, Sankt Peterburga, Kazana, Voronježa, Saratova i drugih znanstvenih središta Rusije.

Nacionalni korpus ruskog jezika zbirka je elektroničkih tekstova s ​​opsežnim lingvističkim i metatekstualnim informacijama. Korpus predstavlja čitavu raznolikost stilova, žanrova i varijanti ruskog jezika 19.–20. stoljeća. Nacionalni korpus ruskog jezika trenutno koristi pet vrsta označavanja: metatekstualno, morfološko (flektivno), sintaktičko, naglasno i semantičko. Nećemo detaljno razmatrati sve dostupne vrste oznaka, usredotočit ćemo se samo na semantičko označavanje.

Uz semantičko označavanje, većini riječi u tekstu je dodijeljena jedna ili više semantičkih značajki i značajki za tvorbu riječi, na primjer, "lice", "supstancija", "prostor", "brzina", "kretanje" itd. Označavanje teksta se prenosi automatski se izlaže pomoću programa Semmarkup (autor A.E. Polyakov) u skladu sa semantičkim rječnikom korpusa. Budući da je ručna obrada semantički obilježenih tekstova vrlo naporna, semantička homonimija u korpusu nije uklonjena: polisemantičkim riječima se pripisuje nekoliko alternativnih skupova semantičkih značajki.

Semantička oznaka temelji se na klasifikacijskom sustavu ruskog rječnika usvojenom u bazi podataka Lexicograph, koja se razvija od 1992. na Odjelu za lingvističke studije VINITI RAS pod nadzorom E.V. Paducheva i E.V. Rakhilina. Za korpus je značajno povećan vokabular, proširen sastav i poboljšana struktura semantičkih klasa, dodane su riječi tvorbene značajke.

Rječnik semantičkog rječnika temelji se na morfološkom rječniku sustava "Biranje" (ukupnog volumena od oko 120 tisuća riječi), koji je proširenje gramatičkog rječnika ruskog jezika A.A. Zalizniak. Trenutna verzija semantičkog rječnika uključuje riječi značajnih dijelova govora: imenice, pridjeve, brojeve, zamjenice, glagole i priloge.

Leksičko-semantički podatak koji se pripisuje proizvoljnoj riječi u tekstu sastoji se od tri skupine oznaka:

- kategorija (na primjer, vlastito ime, povratna zamjenica);

- odgovarajuće leksičko-semantičke karakteristike (npr. tematski razred leksema, znakovi uzročnosti, ocjene);

- derivacijske (rječotvorne) karakteristike (na primjer, "deminutiv", "pridjevski prilog").

Leksičko-semantička informacija ima različitu strukturu za različite dijelove govora. Osim toga, svaka od kategorija imenica – subjekt, nesubjekat i vlastita imena – ima svoju strukturu oznake.

Leksičko-semantičke oznake zapravo su grupirane u sljedeća polja:

– taksonomija (tematski razred leksema) – za imenice, pridjeve, glagole i priloge;

- mereologija (oznaka odnosa "dio - cjelina", "element - skup") - za nazive predmeta i nesubjekata;

– topologija (topološki status označenog objekta) – za nazive predmeta;

– uzročnost – za glagole;

– status službe – za glagole;

- ocjenjivanje - za nazive subjekata i izvanpredmeta, pridjeve i priloge.

Tematski razredi glagola

Kao poseban smjer u proučavanju semantike ruskog jezika, studije E.V. Padučeva. Najzanimljiviji su radovi na tematskoj nastavi ruskih glagola. Tematski razred objedinjuje riječi sa zajedničkom semantičkom komponentom koja zauzima središnje mjesto u njihovoj semantičkoj strukturi. Tu su, na primjer, fazni glagoli, glagoli opažanja, glagoli znanja, glagoli emocija, glagoli odlučivanja, govornih radnji, pokreta, glasovni glagoli, egzistencijalni glagoli itd.

Riječi iste tematske klase imaju neku netrivijalnu zajedničku komponentu u svom tumačenju. Tematski sat je važan iz nekoliko razloga. Prvo, tematska klasa često ima karakterističan izgled u sintaksi - na primjer, klasa obično ima karakterističan član.
Drugo, članovi iste tematske klase obično imaju isti skup semantičkih izvedenica, odnosno pojmova ovisnih o njemu.

Članak daje najcjelovitiji popis pojedinih aspektnih značenja nesvršenih glagola. Razlikuju se sljedeća specifična značenja: stvarno-dugotrajno (proces ili stanje traje u trenutku promatranja); proces (odnosno samo trajan); konstantno-kontinuirano (vrijednost konstantnog svojstva ili omjera); uobičajeno (značenje uobičajene, odnosno općeprihvaćene, ponavljajuće radnje ili događaja); potencijal; višestruki (ali ne uobičajeni i ne potencijalni); opće činjenično neograničeno (vrijednost prestalog stanja ili neograničenog procesa); opće činjenično djelotvorno (radnja je dosegla granicu); općenito stvarno dvosmjerno (rezultat je postignut, ali poništen suprotno usmjerenim djelovanjem); opće činjenično nedjelotvorno (ne zna se je li radnja dosegla granicu).

U radu se analiziraju predikatska imena, odnosno imenice nastale od glagola i pridjeva, kao što su borba, dolazak, očaj, škrtost. Kao rezultat, mogu se razlikovati procesi, događaji, stanja i svojstva.

Na primjer, nazivi procesa dopušteni su u kontekstu glagola sa značenjem "teći", "ići", odnosno "odvijati se" (postoji razgovor, štrajk, ažuriranje). Posebna vrsta procesa su trajne radnje, odnosno svrhovi procesi s aktivnim subjektom, poput tučnjave, provjere, ali ne kao što su kupanje, trčanje, pobuna, hodanje, spavanje, pušenje. Nazivi radnji dopušteni su u kontekstu glagola sa značenjem "proizvesti", "voditi": nadzor je vršila skupina agenata; vrše prijem (zamjena, odabir); mi istražujemo.

Svi nazivi procesa koriste se u kontekstu faznih glagola sa značenjem "početi", "kraj", "nastaviti": borba je počela (kiša, bitka); prestao je progon neistomišljenika; desant (opsada) se nastavlja. Nazivi radnji dopušteni su u kontekstu faznih glagola sa značenjem "početi", "kraj", "nastaviti": ušao u pregovore; završio provjeru bilježnica; prekinuto čitanje; postavljeno na, počelo, zaustavljeno (izdavanje). Kontekst faznog glagola je dijagnostički za nazive procesa, za razliku od naziva događaja.

Nazivi događaja koriste se u kontekstu glagola sa značenjem "dogodilo", "dogodilo": dogodio se potres. Događaji se razlikuju od procesa po tome što imaju retrospektivnog promatrača. Promatrač procesa je sinkroni, dakle, ako imamo proces, onda je glagol nesvršen, a ako je događaj, onda je perfekt.

Izostavit ćemo mnoge druge pojedinosti u vezi s razlikama između procesa, događaja, stanja i svojstava, uz napomenu da potencijal primjene ovih studija tek treba biti otkriven.

Slijedi popis perceptivnih glagola, koje je označio E.V. Padučeva kao jedan od najviše proučavanih tematskih razreda. Čini se da je za utvrđivanje pripadnosti glagola tematskoj klasi percepcija dovoljno osigurati da njegova semantička formula uključuje komponentu "percepcija". Međutim, nije sve tako jednostavno. Činjenica je da se perceptivna komponenta lako uključuje u semantiku glagola različitih klasa. Stvarna percepcija se ulijeva u mentalnu percepciju.

1. Glagoli kretanja i stanja, koji sugeriraju promatrača:

a) glagoli promatranog kretanja: treperiti, bljeskati, gaziti, skliznuti;

b) glagoli promatranog stanja: pobijeliti, stršiti, razbojiti; raširiti se, stršiti, izbiti, raširiti se, otvoriti, progovoriti;

c) glagoli emitiranja svjetlosti, mirisa, zvuka: sjaj, svjetlucanje, sjaj, miris, smrad, zvuk.

2. Promatrača se pretpostavlja glagolom čuti (kao u zvono zvono), ali perceptivnu komponentu imaju i sljedeći glagoli: zastati, utopiti se, pomračiti, šutjeti, šutjeti, stišati. , da se spoje (kao u tunici i sive hlače gotovo spojene sa zemljom).

3. Subjekt percepcije (ili promatrač) je obvezni sudionik u situacijama izraženim uzročnim glagolima: izraziti, pokazati (pokazao mi je svoje raspoloženje); istaknuti, otkriti, zasjeniti, istaknuti, uhvatiti, nejasno, izložiti, označiti (granice), otvoriti, označiti, prikazati; i njihovi dekauzativi (izraziti, otkriti, istaknuti, utisnuti, izložiti, identificirati, otvoriti).

4. Mnogo je glagola koji opisuju identifikaciju koja zahtijeva sudjelovanje osjetila: identificirati, razlikovati, prepoznati, razlikovati, identificirati, razlikovati (ocrtati), prepoznati, raščlaniti (kao u Ne razaznajem drugo slovo).

5. Mnogi glagoli uključuju perceptivnu komponentu, ali označavaju vrlo specifičnu radnju ili aktivnost kojoj je glavni cilj, a ne sudjelovanje percepcije u njegovom postizanju: pregledati ("pregledati"), registrirati, pretražiti, pretražiti, pronaći, pretražiti, istražiti, prikazati, opisati, ući u trag, pratiti, ući u trag, čuvati, paziti, problistati, sakriti (sya), sakriti, špijunirati.

6. Svaki glagol odašiljanja i primanja informacija, na primjer, pisati ili čitati, podrazumijeva prisutnost signala koji se mora percipirati osjetilima.

7. Glagoli show and hide, budući da njihovo tumačenje uključuje perceptivnu komponentu, također se mogu pripisati glagolima percepcije.

8. Glagoli percepcije, između ostalog, uključuju oslijepiti – oslijepiti (i oslijepiti u jednom od značenja). Oni opisuju gubitak organa vida, uslijed čega se sposobnost vida zauvijek gubi. Međutim, to ne uključuje glagol probuditi se, koji označava privremeni gubitak sposobnosti percepcije s njezinim naknadnim vraćanjem.

9. Neki stilski obojeni glagoli percepcije: buljiti, buljiti, izleći, buljiti, buljiti, vidjeti, uhvatiti, zasvijetliti.

10. Tematska klasifikacija usredotočuje se na izvorna značenja riječi. U međuvremenu, mnogi glagoli imaju perceptivno značenje kao izvedenicu; osobito, gledati, suočiti se (s problemom), prodrijeti (u tajnu), govoriti. Na primjer, Bijele zgrade su iznenada izašle iz mraka.

11. Druge slične riječi u kojima je značenje percepcije izvedeno ili kontekstualno određeno, poput baciti (pogledati, pogledati), jurnuti (u oči), platiti (pogled, pozornost), trčati (očima), blještati (s pogledati), slajd (pogledom ).

12. Glagoli označenih načina radnje:

a) uvodni: križ, pobijeli, zvuk;

b) finitiv: gledati, slušati i viriti, prisluškivati;

c) saturativ: dovoljno vidjeti, diviti se, dovoljno čuti;

d) glagoli potpune apsorpcije u radnji: buljiti - buljiti, buljiti - buljiti;

e) posebno produktivan: paziti - paziti, ući u trag - ući u trag, pratiti - pratiti;

e) isprekidani emolijent: gledati, pratiti; samoaktivan: pogledaj.

Glagoli percepcije, kao i drugi tematski razredi, imaju svoje modele semantičke derivacije svojstvene ovom razredu.

13. Karakterističan je semantički prijelaz – od percepcije do mentalnog značenja. Izvedeno mentalno značenje razvija se npr. kod glagola vidjeti, pogledati, primijetiti, razmotriti (kao nagovještaj; i razmatramo vaš prijedlog), osjetiti, činiti se, otkriti, čuti, zamisliti, susresti, slijediti, činiti se; predstaviti se, vidjeti (ista dvoznačnost za imenicu look):

a) S pulta je imao dobar pogled na trijem kluba (vizualno značenje);

b) Ja to vidim ovako (mentalno značenje).

14. Glagol svjedočiti etimološki sugerira viziju, ali u kontekstu Ovo ukazuje na njegov izvanredni talent, ima mentalno značenje; rasvijetliti znači "učiniti razumljivijim", iako je svjetlost potrebna da bi se vidjelo. Glagol anticipirati potpuno je izgubio komponentu povezanu s percepcijom okusa i postao je mentalni.

15. Izvedeno mentalno značenje javlja se i u kauzativnim glagolima. Dakle, pokazati je glagol percepcije, ali može imati i značenje “dokazati”, mentalno. Zanimljivo je da među izvedenicama od vidjeti postoje i glagoli znanja i glagoli mišljenja:

a) Vidim da šutiš (znanje);

b) on to vidi kao prepreku (mišljenje).

16. Glagol biti kombinira perceptivno značenje (Nije ga bilo) s mentalnim (Ispostavilo se da je zdrav).

17. Izvedeno značenje govora razvija glagol primijetiti; očituje se u kombinaciji s prilozima: ispravno si to primijetio (“pravo si rekao”).

18. Glagole slušati, slušati, poslušati, paziti karakterizira višeznačnost “perceive” - “obey”.

19. Redoviti, odnosno repetitivni, je i semantički prijelaz look ® odnositi se: Gledam jednostavno (ja jednostavno odnosim); gledati kroz prste (prepustiti se); usprkos (bez obzira na).

20. Polisemija look ® odnositi je karakteristična za glagol gledati postrance: a) (pogledati postrance, postrance); b) (pogledati iskosa, biti sumnjičav, izraziti sumnjičav stav pogledom).

21. Prijelaz vidjeti ® imati predstavljen je primjerima naći, izgubiti.

22. Prijelaz iz percepcije u međuljudski kontakt bilježi se kod glagola susresti se, gledati (na svjetlo), vidjeti.

23. Značenje viđenja može izblijediti do ideje jednostavnog kontakta s objektom, odnosno ostanka na istom mjestu (Ovi zidovi su vidjeli mnogo; Krim će vas uvijek rado vidjeti).

24. Glagole nastati i nestati karakterizira višeznačnost biti vidljiv – postojati. Slična dvosmislenost u biti naznačen - biti označen; izgubiti se: na primjer, Put se izgubio u grmlju (prestao biti vidljiv) a Živost pokreta postupno se izgubila (prestala postojati); savršen pogled ima ponor (iako nesavršen pogled nestati znači samo ne biti vidljiv: gdje si bio?). Matematičkim jezikom, ako X postoji, onda X postoji.

25. Semantički koncept percepcije često koegzistira s pokretom: sudariti se, spotaknuti, naletjeti, naletjeti; biti uhvaćen (dobio sam vrganj).

Posljedica kretanja može biti, naprotiv, izlazak iz vidnog polja, kao kod skrivanja, bijega, ozljeđivanja.

Zanimljivo je da je za glagole koji izražavaju glavne vrste percepcije - vid, sluh, miris, dodir, okus - moguće identificirati jednu paradigmu semantičkih izvedenica izvornog leksema, a bit će ista za mnoge jezike, što ukazuje starina ovog rječnika i podataka.strukture.

Bitna je u ovom pristupu ideja podjele jezičnih koncepata u neke semantičke skupine, uzimajući u obzir činjenicu da ti koncepti imaju neku netrivijalnu zajedničku semantičku komponentu. Elementi takvih skupina imaju tendenciju da imaju isti skup ovisnih pojmova. Kako bi podržao semantičku analizu, rječnik mora operirati sa značenjima i stoga opisivati ​​svojstva i odnose pojmova, a ne riječi. Ostaje pitanje kako pravilno strukturirati i prezentirati informacije u takvim rječnicima kako bi pretraživanje po njima bilo zgodno i brzo, a uz to je moguće uzeti u obzir promjene u prirodnom jeziku (nestanak starih i nastanak novih pojmova) .

Kada se raspravlja o problemima semantike, često se spominje načelo kompozicije. On tvrdi da je značenje složenog izraza određeno značenjima njegovih sastavnih dijelova i pravilima koja se primjenjuju na njihovu kombinaciju. Budući da se rečenica sastoji od riječi, ispada da se njezino značenje može predstaviti skupom značenja riječi uključenih u nju. Ali nije sve tako jednostavno. Značenje rečenice također se oslanja na red riječi, frazu i odnose između riječi u rečenici, odnosno uzima u obzir sintaksu.

Kao što možete vidjeti, konceptualni dijagrami ovisnosti omogućuju nam da konstatujemo da je u nekim slučajevima narušeno načelo kompozicije. Pogrešno je tvrditi da se značenje fraza i fraza može izraziti kroz značenja njihovih sastavnih riječi. To nije uvijek istina. No, glavni je problem ovakvog pristupa što je odabir tematske nastave i sastavljanje semantičkih rječnika izuzetno dugotrajan proces, koji uvelike ovisi o individualnoj percepciji i interpretaciji pojmova od strane određene osobe.

Mrežni modeli predstavljanja znanja

Tezauri, semantičke mreže, okvirni i ontološki modeli

Tezaurus je svojevrsni rječnik općeg ili posebnog rječnika, koji ukazuje na semantičke odnose među leksičkim jedinicama. Za razliku od eksplanatornog rječnika, tezaurus omogućuje otkrivanje značenja ne samo uz pomoć definicije, već i korelacijom riječi s drugim pojmovima i njihovim skupinama, zbog čega se može koristiti za popunjavanje baza znanja. sustava umjetne inteligencije.

Tezaurusi obično koriste sljedeće glavne semantičke odnose: sinonimi, antonimi, hiponimi, hipernimi, meronimi, holonimi i paronimi.

Sinonimi - riječi istog dijela govora, različite po zvuku i pravopisu, ali imaju slično leksičko značenje (hrabar - hrabar, neustrašiv).

Antonimi su riječi jednog dijela govora, različite po zvuku i pravopisu, koje imaju izravno suprotna leksička značenja (dobro - zlo).

Hiponim je pojam koji izražava određeni entitet u odnosu na drugi, općenitiji pojam (životinja - pas - buldog).

Hipernim - riječ sa širim značenjem, koja izražava opći, generički pojam, naziv klase predmeta, svojstava ili obilježja (buldog - pas - životinja).

Hipernim je rezultat operacije logičke generalizacije, dok je hiponim ograničenje.

Meronim - koncept koji je sastavni dio drugog (auto - motor, kotač, hauba).

Holonim je pojam koji je cijeli iznad ostalih pojmova (motor, kotač, hauba - automobil).

Meronimija i holonimija kao semantičke relacije međusobno su inverzne jedna drugoj, baš kao i hiponimija i hiperonimija.

Paronimi su riječi koje su slične po obliku, ali se razlikuju po značenju (indijski - indijski).

Primjer tezaurusa je WordNet. Osnovna jedinica vokabulara WordNeta je sinonimski niz (synset) koji kombinira riječi sa sličnim značenjem. Sinsetovi se sastoje od riječi koje pripadaju istom dijelu govora kao i izvorna riječ. Svaki sinset popraćen je kratkim tekstom (definicijom) koji objašnjava njegovo značenje. Sinsetovi su međusobno povezani raznim semantičkim odnosima, na primjer hiponimija, hipernimija itd. Primjer s riječju pero (olovka) prikazan je na slici 1. Vidi se da u rječniku postoji pet različitih značenja za ovu riječ, tj. pripada kategoriji pribora za pisanje i ima sedam povezanih riječi: olovka, marker, kreda za ploču, voštana bojica itd.

WordNet sadrži približno 155.000 različitih leksema i fraza, organiziranih u 117.000 sinsetova. Cijela baza podataka podijeljena je u tri dijela: imenice, glagoli i pridjevi/prilozi. Riječ ili izraz može biti u više od jednog sinseta i pripadati više od jedne kategorije dijela govora. Detaljnije informacije o broju jedinstvenih riječi, sinsetova i parova riječ-sinset u bazi podataka WordNet dane su u tablici 1.

Prednosti WordNeta u odnosu na druge slične resurse su njegova otvorenost, pristupačnost, prisutnost velikog broja različitih semantičke veze između sinseta. WordNetu se pristupa izravno pomoću preglednika (lokalno ili putem interneta) ili C knjižnica.

Postoje implementacije WordNeta za druge jezike (oko 16). Primjerice, za europske jezike stvoren je EuroWordNet, čija se veza između različitih jezičnih inačica provodi putem posebnog međujezičnog indeksa. WordNet se također razvija za ruski jezik. Treba napomenuti da postoje metode za predmetnu klasifikaciju WordNet sinsetova, odnosno definiranje područja znanja u kojima se koriste. Takve informacije mogu naknadno poslužiti za smanjenje broja mogućih značenja riječi, ako je poznat predmet dokumenta koji se obrađuje, čime se omogućuje smanjenje vrijednosti pogreške kada se uzme netočno značenje riječi.

Semantička mreža je model domene koji izgleda kao usmjereni graf, čiji vrhovi odgovaraju objektima domene, a lukovi (brdovi) definiraju odnos između njih. Objekti mogu biti pojmovi, događaji, svojstva, procesi. Dakle, semantička mreža odražava semantiku predmetnog područja u obliku pojmova i odnosa. Štoviše, kao koncepti mogu postojati i instance objekata i njihovi skupovi.

Semantičke mreže nastale su kao pokušaj vizualizacije matematičkih formula. Iza vizualnog prikaza semantičke mreže u obliku grafa nalazi se matematički model u kojem svaki vrh odgovara elementu predmetnog skupa, a luk odgovara predikatu. Slika 2 prikazuje primjer semantičkog weba preuzet s Wikipedije.

Terminologija koja se koristi u ovom području je raznolika. Da bi se postigla neka homogenost, čvorovi povezani lukovima obično se nazivaju grafovi, a struktura u kojoj postoji cijelo gnijezdo čvorova ili gdje postoje odnosi različitog reda između grafova naziva se mreža. Osim terminologije koja se koristi za objašnjenje, razlikuju se i načini prikaza. Neki koriste krugove umjesto pravokutnika; neki pišu tipove odnosa iznad ili ispod lukova, zatvarajući ih ili ne zatvarajući ih u ovale; neki koriste kratice poput O ili A za označavanje agenta ili objekta; neki koriste različite vrste strelica.

Prve semantičke mreže razvijene su kao posrednički jezik za sustave strojnog prevođenja. Najnovije verzije semantičkih mreža postaju moćnije i fleksibilnije i natječu se s okvirnim sustavima, logičkim programiranjem i drugim jezicima za predstavljanje znanja.

Unatoč različitoj terminologiji, raznolikosti metoda za predstavljanje kvantifikatora općenitosti i postojanja i logičkih operatora, različitim načinima manipuliranja mrežama i pravilima zaključivanja, mogu se razlikovati značajne sličnosti svojstvene gotovo svim semantičkim mrežama:

– čvorovi semantičkih mreža su koncepti objekata, događaja, stanja;

– različiti čvorovi istog pojma odnose se na različite vrijednosti, osim ako su označeni da pripadaju istom konceptu;

– lukovi semantičkih mreža stvaraju odnose između konceptnih čvorova, oznake iznad lukova označavaju vrstu odnosa;

- neki odnosi između pojmova su semantičke uloge, kao što su "agent", "objekt", "primatelj" i "instrument"; drugi znače vremenske, prostorne, logičke odnose i odnose između pojedinih rečenica;

– koncepti su organizirani po razinama prema stupnju generalizacije, slično hijerarhiji hipernima u WordNetu, na primjer, entitet ® živo biće ® životinja ® mesožder.

Imajte na umu da među semantičkim odnosima koji se koriste za opisivanje mreža mogu postojati ne samo semantički odnosi koji se koriste u tezaurusima, već i druge vrste odnosa: funkcionalni (obično definirani glagolima proizvodi, utječe, ...), kvantitativni (veći od, manje od, jednako, ... ), prostorno (daleko od, blizu, ispod, preko, ...), vremensko (ranije, kasnije, tijekom, ...), atributivno (imati svojstvo, imati vrijednost), logička (I, ILI, NE) itd.

Na primjer, semantika rečenice Ivanov ima crni BMW može se predstaviti kao semantička mreža prikazana na slici 3.

Unatoč nekim razlikama, mreže su prikladne za čitanje i obradu pomoću računala, one su vizualno i prilično univerzalno sredstvo za predstavljanje semantike prirodnog jezika. Međutim, njihova formalizacija u specifičnim modelima predstavljanja, korištenja i modifikacije znanja pokazuje se prilično mukotrpnom, posebice u prisutnosti višestrukih odnosa između njegovih elemenata.

Zamislite, na primjer, neku mrežu koja opisuje izjavu Nastya je od Dashe tražila knjigu. Recimo da zadanim objektima možete pripisati svojstva: Nastya - "marljiva", Dasha - "radoznala". Postoji veza između ovih objekata (kroz knjigu). No, osim nje, postoje mnoge druge veze koje postoje u stvarnom svijetu: društveni status (učenici, djevojke - ne nužno među sobom), obiteljski odnosi (svako ima roditelje i/ili drugu rodbinu) itd. Ispada da čak i za tako jednostavan primjer mreža može narasti do velike veličine i, kao rezultat, potraga za izlazom u njoj bit će preteška.

U složenim semantičkim mrežama koje uključuju mnoge koncepte, proces ažuriranja čvorova i kontrola veza između njih, kao što vidimo, komplicira postupak obrade informacija. Želja za otklanjanjem ovih nedostataka dovela je do pojave posebnih tipova semantičkih mreža, kao što su modeli okvira.

Okvirne modele predstavljanja znanja predložio je M. Minsky.

Okvir je struktura za opisivanje koncepta ili situacije, koja se sastoji od karakteristika ove situacije i njihovih vrijednosti. Okvir se može promatrati kao fragment semantičke mreže dizajnirane da opiše koncepte s ukupnošću njihovih svojstava. Značajka modela okvira za predstavljanje znanja je da su svi koncepti opisani u svakom od čvorova modela određeni skupom atributa i njihovih vrijednosti, koji su sadržani u slotovima okvira.< имя фрейма, слот 1, слот 2, …, слот N >. Grafički, ovo izgleda slično semantičkoj mreži, ali temeljna razlika je u tome što svaki čvor u modelu okvira ima generaliziranu strukturu koja se sastoji od mnogo utora, od kojih svaki ima ime, indikator nasljeđivanja, indikator vrste podataka i vrijednost .

Utor je atribut povezan s čvorom u modelu koji se temelji na okviru i dio je okvira. Naziv mjesta mora biti jedinstven unutar okvira. Pokazivač nasljeđivanja pokazuje koje informacije o atributu mjesta u okviru najviše razine nasljeđuju utori s istim imenom u okviru niže razine. Pokazivač vrste podataka sadrži informacije o vrsti podataka uključenih u utor. Obično se koriste sljedeće vrste podataka: pokazivač na naziv okvira najviše razine, pravi broj, cijeli broj, tekst, popis, tablica, priložena procedura itd. Vrijednost utora može biti instanca atributa, drugi okvir ili faseta i mora odgovarati navedenom tipu podataka i nasljeđivanju uvjeta. Osim određene vrijednosti, utor može pohraniti procedure i pravila koja se pozivaju kada je potrebno izračunati ovu vrijednost. Dakle, utor može sadržavati ne samo određenu vrijednost, već i naziv postupka koji omogućuje njegovo izračunavanje prema zadanom algoritmu, kao i jednu ili više produkcija kojima se ta vrijednost određuje. Utor može sadržavati više od jedne vrijednosti. Ponekad ovaj utor uključuje komponentu zvanu faset koja specificira raspon ili popis mogućih vrijednosti. Faset također specificira granične vrijednosti rezerviranog mjesta utora. Najčešće su procedure za dodavanje i uklanjanje informacija povezane s utorima, mogu pratiti dodjelu informacija danom čvoru i provjeriti poduzimaju li se odgovarajuće radnje kada se vrijednost promijeni.

Postoje okviri uzoraka (prototipovi) pohranjeni u bazi znanja i okviri instanci koji su kreirani za prikaz stvarnih situacija na temelju dolaznih podataka. Modeli okvira prilično su univerzalni, budući da omogućuju odražavanje sve raznolikosti znanja o svijetu kroz strukturne okvire (za označavanje objekata i pojmova: zajam, zalog, mjenica), okvire uloga (menadžer, blagajnik, klijent), okvire scenarija (stečaj , sastanak dioničara, proslave imendana), situacijski okviri (alarm, nezgoda, način rada uređaja) itd. Za predstavljanje znanja u obliku mreže okvira, postoje posebni jezici i softverski alati: FRL (Frame Representation Language ), KRL (Knowledge Representation Language), okvir ljuske Kappa, PILOT/2 i drugi.

Najvažnije svojstvo teorije okvira je nasljeđivanje svojstava posuđenih iz teorije semantičkih mreža. I u okvirima i u semantičkim mrežama, nasljeđivanje se događa prema ISA. ISA slot ukazuje na okvir više razine hijerarhije, odakle se vrijednosti sličnih slotova implicitno nasljeđuju, odnosno prenose.

Glavna prednost okvira kao modela za predstavljanje znanja je njegova usklađenost sa suvremenim idejama o organizaciji dugotrajnog pamćenja osobe, kao i njegova fleksibilnost i vidljivost. Prednosti okvirnih modela predstavljanja znanja očituju se ako se generički odnosi rijetko mijenjaju, a predmetno područje ima nekoliko iznimaka.

Nedostaci okvirnih modela uključuju njihovu relativno visoku složenost, koja se očituje u smanjenju brzine mehanizma zaključivanja i povećanju složenosti unošenja promjena u generiranu hijerarhiju. Stoga se pri razvoju sustava okvira velika pozornost posvećuje metodama vizualnog prikaza i učinkovitim sredstvima za uređivanje struktura okvira.

Može se vidjeti da je objektno orijentirani pristup evolucija okvirne reprezentacije. U ovom slučaju, predložak okvira može se smatrati klasom, a instanca okvira objektom. Objektno orijentirani programski jezici pružaju alate za kreiranje klasa i objekata, kao i alate za opisivanje postupaka (metoda) obrade objekata. Međutim, modeli okvira ne dopuštaju organiziranje fleksibilnog mehanizma zaključivanja, tako da su sustavi okvira ili objektno orijentirane baze podataka ili zahtijevaju integraciju s drugim alatima za obradu znanja, kao što su logički modeli.

U inženjerstvu znanja, ontološki model se shvaća kao detaljan opis nekog predmeta ili problematičnog područja, koji se koristi za formuliranje općih izjava. Ontologije omogućuju predstavljanje koncepata u obliku prikladnom za strojnu obradu.

U središtu većine ontologija su klase koje opisuju koncepte predmetnog područja. Atributi opisuju svojstva klasa i instanci. Postoje analogije s okvirnim pristupom formalizaciji znanja. Mnogi koncepti i principi implementacije, kao i grafički oblik prikaza u početnoj fazi strukturiranja, slični su ontologijama semantičkim mrežama. Glavna razlika je orijentacija ontologija za izravno korištenje od strane računala, odnosno, strukture podataka nisu opisane prirodnim jezikom (kao što je uobičajeno u semantičkim mrežama i tezaurusima), već posebnim formalnim jezikom. Ontologije također imaju mnogo zajedničkog s tezaurusima. Ali za razliku od njih, za ontološke modele nužni zahtjevi su unutarnja cjelovitost, logička povezanost i dosljednost korištenih koncepata. U tezaurusima ti zahtjevi možda neće biti ispunjeni. Ontologije se opisuju korištenjem formalnih jezika kao što su RDF, OWL, KIF, CycL, OCML i drugi.

Obično se razlikuju sljedeći glavni elementi ontologija:

- instance;

– klase objekata (pojmova);

– atributi (opisuju svojstva klasa i instanci);

– funkcije (opisuju ovisnosti između klasa i instanci);

– aksiomi (dodatna ograničenja).

Specijalizirane (predmetno orijentirane) ontologije su prikaz nekog područja znanja ili dijela stvarnog svijeta. Takva ontologija sadrži posebna značenja pojmova za ovo područje. Na primjer, polje riječi u poljoprivreda znači komad zemlje, u fizici - jedna od vrsta materije, u matematici - klasa algebarskih sustava.

Opće ontologije koriste se za predstavljanje koncepata koji su zajednički velikom broju domena. Takve ontologije sadrže osnovni skup pojmova, glosar ili tezaurus koji se koristi za opisivanje pojmova domene.

Suvremeni ontološki modeli su modularni, odnosno sastoje se od skupa međusobno povezanih ontologija, od kojih svaka opisuje zasebno predmetno područje ili zadatak. Ontološki modeli nisu statični, oni se neprestano mijenjaju.

Ako se sustav koji koristi specijalizirane ontologije razvija, onda će ontologije možda morati biti spojene. Glavni nedostatak ontoloških modela je složenost njihove kombinacije. Ontologije čak i bliskih domena mogu biti nekompatibilne jedna s drugom. Razlika se može pojaviti zbog posebnosti lokalne kulture, ideologije ili zbog korištenja drugačijeg jezika opisa. Ontologije se spajaju i ručno i poluautomatski. Općenito, ovo je naporan, spor i skup proces.

Ontološki modeli se široko koriste u sustavima temeljenim na znanju: ekspertnim sustavima i sustavima za podršku odlučivanju. Zanimljiv način predstavljanja znanja o vremenu, uzimajući u obzir nesigurnost u ontologijama, opisan je u radu A.F. Tuzovski.

Trenutno su tehnologije semantičkog weba prilično obećavajuće i široko se koriste u praksi tehnologije predstavljanja znanja. Središnji koncept semantičkog weba je ontologija - model domene koji se sastoji od skupa koncepata, skupa instanci koncepata i skupa odnosa (svojstava). Skup koncepata i odnosa između njih određuje opću shemu za pohranjivanje podataka, predstavljenu kao skup iskaza o instancama koncepata ili ontološkim aksiomima. Takve jednostavne izjave, nazvane trojke, imaju oblik "subjekt-predikat-objekt". Skup pravila koje je odredio korisnik učitava se u sustav zaključivanja, koji na temelju iskaza sadržanih u ontologiji stvara nove instance ontoloških koncepata i odnosa prema tim pravilima.

Jedan od najznačajnijih problema kako za reprezentaciju znanja u kontekstu vremena, tako i za reprezentaciju znanja općenito je reprezentacija znanja o vremenu i promjenama znanja tijekom vremena. Međutim, većina jezika opisa znanja koji se koriste u praksi temelji se na logici predikata prvog reda i koristi unarne ili binarne odnose. Primjeri takvih jezika uključuju OWL i RDF. U ovom slučaju, za opisivanje binarnih relacija uzimajući u obzir vrijeme, potrebno je u relacije uvesti dodatni parametar koji odgovara vremenu. Pritom se binarni odnosi pretvaraju u ternarne i nadilaze deskriptivne mogućnosti jezika.

Drugi važan zadatak je opisati znanje o vremenu, uzimajući u obzir moguću nepotpunost tog znanja. Na primjer, opis izjava poput: "događaj A dogodit će se negdje u budućnosti". Taj se zadatak obično rješava u okviru modalnih vremenskih logika, kao što je LTL, korištenjem određenih modalnih operatora. No, budući da se jezik opisa znanja OWL temelji na deskriptivnoj logici, postaje nemoguće koristiti takvo rješenje za OWL ontologije.

U svom radu A.F. Tuzovski predlaže da se model za opisivanje znanja o vremenu predstavi u sljedećem obliku:

< TU, VU, TP, F, Rul >, gdje

1) TU je skup vremena TU = (T È (tØ)), gdje je T linearno uređen skup s kardinalnošću kontinuuma na kojem je dana binarna operacija oduzimanja T ´ T ® R+, a tØ je posebna element koji odgovara "neodređenom trenutku vremena";

2) VU - skup varijabli koje označavaju elemente skupa TU, kao i posebna varijabla tN koja odgovara trenutnom trenutku u vremenu; vrijednost varijable tN se stalno mijenja, odražavajući tijek vremena u nekom sustavu, kako bi se opisao vremenski kontekst čiji se predloženi pristup koristi;

3) TP je skup vremenskih intervala; vremenski interval odgovara uređenom paru t =< ti1, ti2 >, gdje su ti1 i ti2 elementi VU takvi da ((ti1 £ ti2) u (ti1 ¹ tØ) u (ti2 ¹ tØ)) Ú (ti1 = tØ) Ú
(ti2 = tØ); dakle, vremenski interval odgovara određenom odsječku na vremenskoj skali, a njegova granica može biti određeni trenutak vremena, trenutni trenutak vremena (varijabla tN) ili neodređeni trenutak vremena tØ, dok vremenski interval s podudarnim granicama (ti1 = ti2) odgovara određenom trenutku vremena;

4) F je skup predikata koji opisuju svojstva vremenskih intervala, kao i kvalitativne odnose među njima;

5) Rul - skup pravila oblika (G ® H) i (G « H), koji opisuju osnovne mehanizme logičkog zaključivanja, uključujući ograničenja na vrijednosti predikata F, kao i određenost granice vremenskih intervala.

Koncept vremenskog intervala potreban je za opisivanje nekih vremenskih intervala čije su točne granice nepoznate sve dok se ne pojavi određeno stanje modela. Možemo reći da svaki vremenski interval opisuje određeni vremenski interval čije su točne granice još uvijek nepoznate. U tom slučaju mogu biti dostupne informacije o granicama unutar kojih se ovaj interval zajamčeno nalazi na vremenskoj skali, a točne granice intervala opisanog vremenskim intervalom mogu postati poznate u budućnosti. Stoga se uvode dvije vrste granica vremenskih intervala: točne i zajamčene. Za definiranje dvije vrste granica koriste se predikati EL (točno lijevo), ER (točno desno), GL (zajamčeno lijevo) i GR (zajamčeno desno) koji definiraju točne lijeve/desne i zajamčene lijeve/desne granice vremenskog intervala, redom . Na primjer, predikat EL (ti , ti1) odgovara izjavi "točna lijeva granica intervala ti je vrijeme ti1". Radi jednostavnosti, tip granice vremenskog intervala može se označiti različitim zagradama: interval je potpuno definiran (obje njegove granice su točne); interval .

Agent je pokretač animiranja i kontrolor radnje.

Primatelj - primatelj poruke (može se kombinirati s Korisnikom).

Korisnik (Primatelj, Posjednik) - sudionik čiji su interesi neizravno zahvaćeni u procesu situacije (prime korist ili štetu).

Instrument je emocionalni poticaj ili sudionik s kojim se neka radnja provodi.

Izvor – mjesto s kojeg se odvija pokret.

Protusredstvo - sila ili otporna okolina protiv koje se provodi akcija.

Objekt je sudionik koji se pomiče ili mijenja tijekom događaja.

Pacijent je sudionik koji prolazi kroz značajne promjene.

Rezultat - sudionik koji se pojavljuje kao rezultat događaja.

Podražaj - vanjski uzrok ili objekt koji uzrokuje ovo stanje.

Cilj je mjesto do kojeg se izvodi pokret.

Iskustvenik – sudionik koji doživljava unutarnje stanje koje ne dovodi do vanjskih promjena (nositelj osjećaja i percepcija).

Efektor je neživi sudionik, često prirodna sila, koja uzrokuje promjenu u pacijentovom stanju.

Prema broju argumenata i njihovim semantičkim svojstvima, skup verbalnih leksema može se podijeliti na klase. Na primjer, razmotrite sljedeće vrste glagola uloga: glagole fizičkog utjecaja (sjeckati, piliti, rezati); glagoli percepcije (vidjeti, čuti, osjetiti); glagoli načina govora (vikati, šaptati, mrmljati). Unutar svakog razreda postoji preciznija podjela. Među glagolima fizičkog utjecaja, glagoli oblika glagola (Agens, Tool, Object) imaju sličnu semantičku predikatsko-argumentsku strukturu: break - break, bend - savijati, fold - savijati, razbiti - razbiti u komadiće, crack - rascijepiti, itd. Još jedna predikatsko-argumentna struktura tipična za glagole glagolskog tipa (Agent, Alat, Svrha): udariti - udariti, pljusnuti - pljusnuti, udariti - udariti, udariti - udariti (o nečemu), udariti - udariti itd.

Vidi se da postoje korelacije između morfoloških padeža, prijedloga, sintaktičkih uloga, s jedne strane, i semantičkih uloga, s druge strane, na primjer, rezati nožem, raditi s Ivanom, prskati bojom. Osim toga, treba uzeti u obzir da jedna predikatska riječ ne može imati dva aktanta s istom semantičkom ulogom. Razlike u skupovima uloga utječu uglavnom na periferne semantičke uloge (izvođač, poticaj, izvor) ili se svode na spajanje/fragmentaciju temeljnih uloga (agent naspram agenta i efektora; primatelj naspram primatelja, primatelja i korisnika; pacijent/tema/objekt naspram pacijenta, subjekta i rezultata).

C. Fillmore je u svom radu čak predložio pravilo za neizravno preslikavanje semantičkih uloga u sintaktičke: ako među argumentima postoji Agent, on postaje subjekt; u odsutnosti agenta, ako postoji instrument, on postaje predmet; u odsutnosti agenta i instrumenta, objekt postaje subjekt. Iz toga prirodno proizlazi hijerarhija semantičkih uloga. Najpoznatije hijerarhije semantičkih uloga su: Agent > Instrument > Pacijent; Agent > Izvor > Cilj > Alat > Tema > Mjesto; Agent > Korisnik > Experiencer > Instrument > Tema > Mjesto i neke druge Hijerarhija semantičkih uloga izgrađena je na način da je moguće odražavati stupanj tematske pripadnosti argumenata (aktualnost) tako da pragmatički najvažnija semantička uloge se nalaze na lijevom kraju hijerarhije, a na desnom – semantičke uloge koje ne karakterizira visoka aktualnost.

U početku su se semantičke uloge trebale smatrati primitivnima, ne podliježu daljnjoj analizi koja bi mogla otkriti njihovu unutarnju strukturu. Međutim, u ovom slučaju nastaje niz problema. Prvo, kao rezultat sve pažljivije semantičke i sintaktičke analize, dolazi do neograničenog povećanja popisa uloga. Drugo, nestrukturirani popisi uloga ne dopuštaju predviđanja o mogućim vrstama uloga glagola i objašnjavaju odsutnost nepotvrđenih tipova. Stoga je u teoriji semantičkih uloga predloženo definiranje uloga u terminima distinktivnih obilježja ili proto-uloga. Na primjer, D. Doughty predlaže izdvojiti sljedeća svojstva protorole agenata: voljno uključena u događaj ili stanje; je svjestan i/ili percipirajući sudionik; pokreće promjene događaja ili stanja drugog sudionika; kreće (u odnosu na točku u prostoru ili na drugog sudionika); postoji neovisno o događaju označenom glagolom.

Nažalost, trenutno nije moguće uspostaviti korespondenciju jedan-na-jedan između semantičkih uloga i padeža, odnosno, s funkcionalnog stajališta, kategorija padeža je heterogena. Situacija je dodatno komplicirana činjenicom da su same uloge netrivijalno međusobno povezane, a u prirodnim jezicima uobičajene su generativne tehnike poput metafore i metonimije, koje daju mnoga nova značenja i, u principu, ne mogu se odraziti na statički leksikon.

Logički modeli predstavljanja znanja

Osnovna ideja pristupa u izgradnji logičkih modela predstavljanja znanja je da se sve informacije potrebne za rješavanje primijenjenih problema smatraju skupom činjenica i iskaza, koji se u nekoj logici prezentiraju u obliku formula. Znanje se prikazuje skupom takvih formula, a stjecanje novih znanja svodi se na provedbu postupaka zaključivanja. Logički modeli predstavljanja znanja temelje se na pojmu formalne teorije definirane torkom S =< B, F, A, R>, gdje je B prebrojiv skup osnovnih simbola (abeceda); F je skup koji se zove formule; A je istaknuti podskup apriornih istinitih formula (aksioma); R je konačan skup odnosa između formula, koji se nazivaju pravila zaključivanja.

Glavni pristup predstavljanju značenja u računskoj lingvistici uključuje stvaranje reprezentacije značenja na formalan način. Ova reprezentacija se može nazvati jezikom predstavljanja značenja. Jezik predstavljanja je neophodan kako bi se premostio jaz između prirodnog jezika i zdravorazumskog znanja o svijetu. A budući da bi se ovaj jezik trebao koristiti za automatsku obradu teksta i u stvaranju sustava umjetne inteligencije, potrebno je uzeti u obzir računske zahtjeve semantičke obrade, kao što je potreba za utvrđivanjem istinitosti iskaza, održavanjem nedvosmislenog prikaza , predstavljaju izjave u kanonskom obliku, daju logičan zaključak i biti izražajan.

U prirodnim jezicima postoji širok izbor sredstava koja se koriste za prenošenje značenja. Među najvažnijima je sposobnost prenošenja strukture predikat-argument. Uzimajući u obzir gore navedeno, zaključujemo da je logika predikata prvog reda dobro prikladna kao alat za predstavljanje značenja iskaza. S jedne strane, relativno je lako razumjeti od strane osobe, s druge strane, dobro je podložan (računalskoj) obradi. Koristeći logiku prvog reda, mogu se opisati važne semantičke klase, uključujući događaje, vrijeme i druge kategorije. Međutim, treba imati na umu da izjave koje odgovaraju konceptima kao što su uvjerenja i želje zahtijevaju izraze koji uključuju modalne operatore.

Semantičke mreže i okviri o kojima se raspravljalo u prethodnom odjeljku mogu se razmatrati u smislu predikatske logike prvog reda. Na primjer, značenje rečenice Imam knjigu može se napisati na četiri različita načina, koristeći četiri različita jezika za predstavljanje značenja (vidi sliku 4, numeriranje odgovara redoslijedu na slici): 1) konceptualni dijagram ovisnosti; 2) pogled na temelju okvira; 3) semantička mreža; 4) račun predikata prvoga reda.

Iako su sva četiri ova pristupa različita, na apstraktnoj razini predstavljaju općeprihvaćenu temeljnu oznaku da se reprezentacija značenja sastoji od struktura sastavljenih od mnogih simbola. Te simboličke strukture odgovaraju objektima i odnosima između objekata. Sva četiri prikaza sastoje se od simbola koji odgovaraju "govorniku", "knjigi" i skupa odnosa koji označavaju posjedovanje jednog od drugog. Ovdje je važno da sva ta četiri prikaza omogućuju povezivanje, s jedne strane, izražajnih značajki prirodnog jezika, a s druge strane stvarnog stanja stvari u svijetu.

Logički modeli predstavljanja znanja imaju niz prednosti. Prvo, ovdje se kao "temelj" koristi klasični aparat matematičke logike čije su metode dobro proučene i formalno potkrijepljene. Drugo, postoje dovoljno učinkoviti postupci za izvođenje sintaktički ispravnih izjava. Treće, takav pristup omogućuje pohranjivanje samo skupa aksioma u baze znanja, a sva ostala znanja (uključujući činjenice i informacije o ljudima, objektima, događajima i procesima) mogu se dobiti iz tih aksioma prema pravilima zaključivanja.

Jezik predstavljanja značenja, kao i svaki jezik, ima svoju sintaksu i semantiku. Slika 5 daje opis gramatike bez konteksta za predikatski račun prvog reda predložen u .

Razmotrite prikaz značenja kategorija, događaja, vremena, aspekata i uvjerenja u knjizi.

Zastupljenost kategorije. Pod kategorijom se podrazumijeva skupina riječi ujedinjenih zajedničkim obilježjem, slično kao što je organizirana u tezaurusima. Riječi sa semantikom nalik na predikate često sadrže ograničenja izbora, koja se obično izražavaju u obliku semantičkih kategorija, gdje svaki predstavnik kategorije ima skup prikladnih značajki.

Najjednostavniji način predstavljanja kategorija je stvaranje predikata na jednom mjestu za svaku kategoriju. Međutim, tada bi bilo teško davati izjave o samim kategorijama. Razmotrimo sljedeći primjer. Pretpostavimo da je, koristeći jezik predikatske logike prvog reda, potrebno predstaviti značenje izjave: “Harry Potter” je najpopularnija knjiga za djecu. Odnosno, trebate pronaći objekt kategorije koji se najčešće pojavljuje u obliku MostPopular (HarryPotter, ChildrensBook). Ova formula nije prava logička formula prvog reda, budući da argumenti u predikatima, po definiciji, moraju biti pojmovi, a ne drugi predikati. Da bi se riješio ovaj problem, svi koncepti koji su uključeni u izjavu mogu se predstaviti kao punopravni objekti, odnosno kategorija ChildrensBook može biti predstavljena kao objekt u rangu s HarryPotterom. Pripadnost takvoj kategoriji bit će naznačena odnosom ISA (HarryPotter, ChildrensBook). ISA relacija (is a) označava odnos između objekata i kategorija kojima ti objekti pripadaju. Ova tehnika se može primijeniti za stvaranje hijerarhije kategorija. Na primjer, koristimo relaciju AKO (Dječja knjiga, knjiga). Ovdje relacija AKO (vrsta) označava uključivanje jedne kategorije u drugu. Naravno, radi veće pouzdanosti, kategorije moraju biti okarakterizirane velikim skupom činjenica, odnosno kategorije se moraju definirati kao skupovi.

Prezentacija događaja. Da bismo predstavili značenje događaja, dovoljno ga je razmotriti kao predikat iz skupa argumenata koji obavljaju određene uloge i potrebni su za opisivanje situacije. Primjeri takvih predikata dati su u prvom odjeljku (tamo su dobiveni iz leksičkih funkcija koje je predložio I. A. Melchuk). Drugi primjer: Rezervacija (Hearer, Danas, 20:00, 2). Ovdje su argumenti objekti kao što su osoba, restoran, dan, vrijeme i broj mjesta za rezerviranje u restoranu. Za glagole se takav prikaz može dobiti uz pretpostavku da argumenti odgovaraju sintaktičkim aktantima. Postoje četiri problema s ovim pristupom:

– određivanje točnog broja uloga za svaki događaj;

– predstavljanje činjenica o ulogama povezanim s događajem;

– potreba da se osigura da se svi ispravni zaključci mogu izvući izravno iz takvog prikaza događaja;

– potrebu da se osigura da se iz prikaza događaja ne može dobiti netočan rezultat.

Primjerice, glagol "jesti" može imati od jednog do četiri aktanta, ovisno o situaciji opisanoj rečenicom. Stoga nije unaprijed jasno kakav bi trebao biti lokalitet predikata. Doista, u predikatskom računu prvog reda, broj argumenata mora biti fiksan.

Jedno rješenje je pretpostaviti da se takve situacije rješavaju na sintaktičkoj razini. Možete razmotriti zasebne potkategorije za svaku od konfiguracija argumenata. Semantički analog ove metode je stvoriti što više predikata, od kojih će svaki odgovarati zasebnim situacijama. Ime predikata je isto, ali je broj argumenata različit:
Eating1 (w) - jeo sam; Eating2 (w, x) – pojeo sam sendvič; Eating3 (w, x, y) – Pojeo sam sendvič za ručak; Eating4 (w, x, y, z) – Pojeo sam sendvič za ručak kod kuće. Stoga se smatraju različitim. Ovaj pristup će zaobići problem broja argumenata, ali je neučinkovit. Osim predloženih predikatnih naziva, ništa ih ne spaja u jedan događaj, iako je njihov logički odnos očit. Ispada da se neke logičke veze ne mogu dobiti na temelju predloženih predikata. Štoviše, morat ćete potražiti te logične veze u bazi znanja.

Ovaj se problem može riješiti korištenjem semantičkih postulata. Oni eksplicitno vežu semantiku predikata. Na primjer, " w, x, y, z Eating4 (w, x, y, z) Þ Eating3 (w, x, y).

Predikati mogu odražavati morfološke, sintaktičke i semantičke informacije. Primjeri takvih semantičkih postulata su formule koje sadrže neke leksičke predikate iz prvog odjeljka. Dani su semantički postulati koji sadrže morfološke i sintaktičke značajke građenja riječi i rečenica u ruskom jeziku. Primjeri semantičkih postulata koji nose semantičko opterećenje nalaze se u prethodnom odjeljku.

Imajte na umu da ne treba brkati semantiku iskaza u prirodnom jeziku sa semantikom predikata koji uvodimo kako bismo odražavali semantiku iskaza. Semantički postulati odražavaju semantiku predikata, odnosno semantičke veze između predikata koje smo uveli.

Jasno je da je ovaj pristup za otkrivanje semantičkih odnosa između predikata prikladan za male domene i ima problema s skalabilnosti. Bilo bi zgodnije reći da se ti predikati odnose na jedan predikat s nedostatkom argumenata na nekim pozicijama. U ovom slučaju možete bez semantičkih postulata. Ali ova metoda ima i nedostatak. Na primjer, ako uzmemo u obzir predikat Eating (w, x, y, z) i uzmemo u obzir da jedna od riječi iz skupa (doručak, ručak, večera) treba biti prisutna kao treći argument, tada kvantifikator postojanja vezan uz drugi varijabla će značiti postojanje specifične hrane povezane sa svakim obrokom, što nije točno.

Razmotrimo prikladan primjer. Napišimo tri tvrdnje (pojeo sam ručak, jeo sam kod kuće i pojeo sam sendvič za ručak kod kuće) koristeći logiku prvog reda:

$ w, x jelo (govornik, w, ručak, x)

$ w, x jelo (zvučnik, w, x, dom)

$ w Prehrana (zvučnik, w, ručak, dom).

Pretpostavimo da je potrebno dobiti treću formulu iz prve dvije formule vezane za jedan događaj. Samostalni događaji Ručao sam i jeo sam kod kuće ne dopuštaju da zaključimo da sam ručao kod kuće. Kao i kod reprezentacije kategorije, ovaj se problem može riješiti tretiranjem događaja kao jednakih objektima, tako da se mogu kvantificirati i povezati s drugim objektima skupovima zadanih odnosa. Sada će se prema ovom pristupu dobiti sljedeći pogled.

Za prosidbu sam ručala

$ w ISA (w, Eating) Ù Eater (w, Speaker) Ù Eater (w, Runch).

Za rečenicu koju sam jeo kod kuće

$ w ISA (w, Eating) Ù Eater (w, zvučnik) Ù Mjesto (w, Dom).

Za prosidbu sam kod kuće pojeo sendvič za ručak

$ w ISA (w, Eating) Ù Eater (w, govornik) Ù Jeo (w, sendvič) Ù MealEaten (w, Runch) Ù Mjesto (w, Home)

Prikazani pristup omogućuje da se riješimo potrebe za specificiranjem fiksnog broja argumenata u predikatu, bez obzira na uloge i druge aktere. Nema drugih uloga koje nisu spomenute u rečenici, a logičke veze između semantički povezanih predikata ne zahtijevaju korištenje semantičkih postulata.

Reprezentacija vremena. Vremenska logika se koristi za opisivanje slijeda događaja i njihovog odnosa u vremenskoj skali. U prirodnim jezicima takav alat je glagolsko vrijeme. Možemo smatrati da jedan događaj prethodi drugom ako protok vremena vodi od prvog događaja do drugog. Iz toga proizlaze poznati koncepti prošlosti, sadašnjosti i budućnosti.

Vremenska logika koristi dvije vrste operatora: logičke i modalne. Kao logički operatori koriste se uobičajeni operatori logike propozicijskog računa: konjunkcija, disjunkcija, negacija i implikacija. Modalni operatori definirani su kako slijedi.

N j - Sljedeće: j mora biti istinit u stanju neposredno nakon podataka.

F j - Budućnost: j mora postati istinito u barem jednom stanju u budućnosti.

G j - Globalno: j mora biti istinit u svim budućim stanjima.

A j - Sve: j se mora izvoditi na svim granama počevši od ove.

E j - postoji: postoji barem jedna grana na kojoj radi j.

j U y - Do (jako): y se mora izvršiti u nekom stanju u budućnosti (moguće u trenutnom stanju), svojstvo j se mora izvršiti u svim stanjima do (ne uključujući) određenog.

j R y - Otpuštanje: j oslobađa y ako je y istinit do trenutka kada j postane istinit prvi put (ili uvijek, ako nije). Inače, j mora postati istinit barem jednom prije nego što y postane istinit prvi put.

Zastupljenost aspekata. Glagoli se koriste za opisivanje radnji u prirodnim jezicima. Američki filozof Z. Vendler je 1957. godine predložio model podjele glagola prema leksičkim aspektima. Identificirao je četiri klase:

- stanja (stanja) - glagoli koji opisuju statična stanja koja nemaju krajnju točku (npr. "znati", "voliti");

- aktivnosti (aktivnosti) - glagoli koji opisuju stanja koja su dinamična i nemaju krajnju točku (npr. "trčati", "voziti");

- postignuća (postignuća) - glagoli koji opisuju događaje koji imaju krajnju točku i postupni su (na primjer, "naslikati sliku", "izgraditi kuću");

- postignuća (postignuća) - glagoli koji opisuju događaje koji imaju krajnju točku i događaju se trenutno (na primjer, "učiti", "obavijestiti").

Tablica 2 prikazuje usporednu tablicu Vendlerovih klasa za engleski glagoli uzeti s posla.

Kao što vidite, kontinuitet djelovanja karakterističan je za aktivnosti i postignuća i izostaje iz stanja i postignuća. Možete reći da je ključalo (aktivnost) i pisao sam pismo (obaveza), ali ne možete reći da je postojao (stajao) i pronalazio sam knjigu (postignuće). Postignuća se ne podudaraju s okolnostima trajanja. Možete reći da je postojao dva sata (stajanje), ali ne možete ja sam ga našao dva sata (postignuće).

Postignuća i postignuća opisuju svrhovito djelovanje, kombiniraju se s okolnostima datuma završetka, za razliku od članaka i aktivnosti. Možete reći da sam napisao pismo za dva sata (postignuće), ali ne možete reći da sam hodao za dva sata (aktivnost).

Predstavljanje uvjerenja, želja i namjera. Kako bi izrazili govornikov stav prema informacijama koje se saopćavaju, izgovori na prirodnom jeziku koriste riječi kao što su vjerujem, želim, vjerujem, predstavljam itd. Takve izjave ne opisuju objektivnu sliku svijeta, već osobitosti govornikove osobne percepcije, njegove "unutarnje" predodžbe o svijetu. Uzmite u obzir izjavu za koju vjerujem da je John pročitao "Harryja Pottera". Pogrešno je pokušati predstaviti njegovo značenje korištenjem predikatne logike: Vjerovanje (Govornik, Čitanje (John, HarryPotter). Ovdje drugi argument mora biti pojam, a ne formula. Ova sintaktička pogreška uključuje semantičku. U logici prvog reda , predikati vežu objekte, a ne odnos između njih. Standardni način za prevladavanje ovog problema je dodavanje operatora koji nam omogućuju da napravimo tvrdnje koje su nam potrebne. Ako unesemo operator Believes, koji uzima formule kao argumente, dobivamo sljedeće zastupanje:

Vjeruje (Speaker, $ x ISA (x, Reading) Ù Reader (x, John) Ù Read (x, HarryPotter)).

Ne može se reći da je takav prikaz napisan u terminima predikatskog računa prvoga reda, ali je potvrda da u jeziku postoji skupina glagola koja ima posebnu ulogu u semantičkoj analizi. U sustavima automatske analize ponekad je potrebno pratiti uvjerenja i namjere korisnika. Situacija je komplicirana činjenicom da se uvjerenja, želje i namjere mogu promijeniti u procesu dijaloga.

Uvedeni operator naziva se modalni. Postoje različiti modalni operatori. Temporalni modalitet je već spomenut nešto ranije kada se govorilo o reprezentaciji vremena u iskazima. Osim temporalnog, postoji prostorni modalitet, logika znanja (“zna se da”), logika dokazivosti (“da se može dokazati”) i druge. Logika proširena modalnim operatorima naziva se modalna logika. Trenutno postoji mnogo složenih neistraženih pitanja u ovom području. Kako zaključivanje funkcionira u prisutnosti specifičnih modalnih operatora? Koje se vrste formula mogu primijeniti na određene operatore? Kako modalni operatori komuniciraju s kvantifikatorima i logičkim spojevima? Ova i druga pitanja tek treba istražiti. Nećemo se ovdje zadržavati na njima.

Izvođenje sintaktički ispravnih iskaza u logičkim modelima reprezentacije znanja temelji se na pravilu razlučivanja koje je razvio J. Robinson 1965. godine. Kaže da ako je skupina izraza koji tvore premisu istinita, onda se primjenom pravila zaključivanja jamči da će proizvesti istinit izraz kao zaključak. Rezultat primjene pravila razrješenja naziva se razrješenje.

Metoda razrješenja (ili pravilo otklanjanja proturječnosti) omogućuje dokazivanje istinitosti ili netočnosti iznesene pretpostavke metodom proturječnosti. U metodi razlučivanja skup rečenica obično se smatra složenim predikata koji sadrži nekoliko predikata povezanih logičkim funkcijama te egzistencijalnim i univerzalnim kvantifikatorima. Budući da predikati koji su identični po značenju mogu imati različite oblike, rečenice se prvo moraju svesti na jedinstveni oblik (disjunktivni ili konjunktivni normalni oblik), u kojem se uklanjaju kvantifikatori postojanja, univerzalnosti, simboli implikacije, ekvivalencije itd. pravilo rezolucije sadrži konjunkciju disjunkata na lijevoj strani. Stoga je dovođenje premisa korištenih za dokaz u oblik koji je konjunkcija disjunkti nužan korak u gotovo svakom algoritmu koji implementira logički zaključak na temelju metode razlučivanja.
Sljedeći koraci izvode se tijekom procesa zaključivanja pomoću pravila razrješenja.

1. Operacije ekvivalencije i implikacije su eliminirane:

A « B = (A ® B) Ù (B ® A);

A ® B = Ø A Ú B.

2. Operacija negacije kreće se unutar formula uz pomoć de Morganovih zakona:

Ø (A Ù B) = Ø A Ú Ø B;

Ø (A Ú B) = Ø A Ù Ø B.

3. Logičke formule svode se na disjunktivni oblik:

A Ú (B Ú C) = (A Ú B) Ù (A Ú C).

U predikatskoj logici, da bi se primijenilo pravilo razlučivanja, potrebno je provesti složeniju transformaciju logičkih formula kako bi se dovele u sustav disjunkti. To je zbog prisutnosti dodatnih elemenata sintakse, uglavnom kvantifikatora, varijabli, predikata i funkcija.
Algoritam objedinjavanja predikatnih logičkih formula sastoji se od sljedećih koraka.

1. Uklanjanje operacija ekvivalencije.

2. Uklanjanje implikacijskih operacija.

3. Uvođenje operacija negacije u formule.

4. Isključivanje egzistencijalnih kvantifikatora. To se može dogoditi u trećem koraku zbog primjene de Morganovih zakona, naime, negacija $ se mijenja u ", ali može doći i do obrnute zamjene. Zatim, da biste eliminirali $, postupite na sljedeći način: sve pojave neke varijable vezani egzistencijalnim kvantifikatorom, na primjer ($ x) zamjenjuju se u formuli novom konstantom, na primjer a. Ova konstanta je neka (nepoznata) vrijednost varijable x za koju je izjava napisana ovom formulom istinita. zamjenjuje se ista vrijednost a, čak i ako je u ovom trenutku nepoznata.

5. Kvantifikatori općenitosti uzimaju se na prva mjesta u formulama. Ovo također nije uvijek jednostavna operacija, ponekad morate napraviti preimenovanje varijabli.

6. Razotkrivanje veznika koji su pali unutar disjunkcija.

Nakon dovršetka svih koraka opisanog algoritma objedinjavanja, možete primijeniti pravilo razlučivanja.

Bilo je to pravilo razlučivanja koje je poslužilo kao osnova za stvaranje programskog jezika Prolog.
U Prologu su činjenice opisane u obliku logičkih predikata s konkretnim vrijednostima. Pravila zaključivanja su opisana logičkim predikatima s definicijom pravila zaključivanja u obliku liste predikata nad bazama znanja i postupcima obrade informacija. Sam interpreter Prolog implementira izlaz sličan onom gore opisanom. Kako bi se započeli izračuni, postavlja se poseban zahtjev bazi znanja, na koju logički programski sustav generira istinite i lažne odgovore.

Metoda razlučivanja je jednostavna za programiranje, to je jedna od njezinih najvažnijih prednosti, ali je primjenjiva samo u ograničenom broju slučajeva, jer za njezinu primjenu dokaz ne bi trebao imati veliku dubinu, a broj potencijalnih rezolucija ne bi trebao biti velik.

Kako bi predikatski račun prvog reda bio fleksibilniji, može se proširiti lambda računom. Lambda račun je jezik višeg reda od predikatskog računa prvog reda. U njemu, kao argumenti, lambda funkcija može raditi ne samo s varijablama, već i s predikatima. Međutim, upotreba lambda izraza formalno ne povećava izražajnu moć logike prvog reda, budući da se bilo koji konstrukt koji sadrži lambda izraz može pretvoriti u ekvivalentan oblik bez njega.

Nakon što je Prolog jezik stekao veliku popularnost, početkom 80-ih godina prošlog stoljeća pojavio se pojam "računala pete generacije". Tada se očekivalo stvaranje sljedeće generacije računala usmjerenih na distribuirano računalstvo. Uz to, vjerovalo se da će peta generacija postati temelj za stvaranje uređaja sposobnih imitirati proces ljudskog razmišljanja. Istodobno se pojavila ideja za stvaranje hardverske podrške za paralelne relacijske baze podataka Grace i Delta te paralelno zaključivanje (Parallel Inference Engine, PIE), temeljeno na principima Prolog jezika. Svaki blok zaključivanja signalizirao je svoje trenutno radno opterećenje kako bi se rad mogao prenijeti na najmanje opterećeni blok zaključivanja. Ali, kao što znate, takvi pokušaji nisu dopustili stvaranje umjetne inteligencije, već su samo poslužili kao još jedna potvrda da ljudsko razmišljanje još nije dovoljno proučeno.

Logički modeli predstavljanja znanja omogućuju provjeru sintaktičke ispravnosti iskaza. Međutim, uz pomoć pravila koja definiraju sintaksu jezika nemoguće je utvrditi istinitost ili netočnost ove ili one izjave. Izjava može biti sintaktički točna, ali potpuno besmislena. Osim toga, logičke modele je teško koristiti u dokazivanju obrazloženja koje odražava specifičnosti određenog predmetnog problema, zbog visokog stupnja ujednačenosti.

Sustavi s komponentama semantičke analize

U sklopu projekta Open Cognition razvija se Link Grammar Parser, koji je odgovoran za obradu prirodnog jezika. Link Grammar Parser počeo se razvijati 1990-ih. na Sveučilištu Carnegie Mellon. Ovaj pristup se razlikuje od klasične teorije sintakse. Sustav rečenici dodjeljuje sintaktičku strukturu koja se sastoji od skupa označenih poveznica (konektora) koji povezuju parove riječi. Parser gramatike veza koristi informacije o vrstama veza između riječi.

Analizator ima rječnike koji uključuju oko 60.000 rječničkih oblika. Omogućuje vam raščlanjivanje velikog broja sintaktičkih konstrukcija, uključujući brojne rijetke izraze i idiome. Link Grammar Parser je prilično robustan, može preskočiti dio rečenice koji ne razumije i odrediti strukturu za ostatak rečenice. Analizator može raditi s nepoznatim vokabularom i razumno nagađati (na temelju konteksta i pravopisa) o sintaktičkoj kategoriji nepoznatih riječi. Ima podatke o vlastitim imenima, brojčanim izrazima i raznim interpunkcijskim znakovima.

Analiza u sustavu odvija se u dvije faze.

1. Izgradnja skupa sintaktičkih prikaza jedne rečenice. U ovoj fazi razmatraju se sve varijante poveznica između riječi, a među njima i one koje zadovoljavaju kriterij projektivnosti (veze se ne smiju sijeku) i kriterij minimalne povezanosti (rezultirajući graf treba sadržavati najmanji broj komponenta povezivanja; povezana komponenta grafa je skup vrhova grafa tako da za bilo koja dva vrha iz ovog skupa postoji put od jednog do drugog i ne postoji put od vrha ovog skupa do vrha koji nije iz ovog skupa) .

2. Naknadna obrada. Dizajniran za rad s već izgrađenim alternativnim rečeničnim strukturama.

Rezultirajući dijagrami su u biti analogni stablima subordinacije. U stablima subordinacije, od glavne riječi u rečenici, možete postaviti pitanje do sporednog. Dakle, riječi su raspoređene u strukturu stabla. Parser može proizvesti dva ili više uzoraka raščlanjivanja za istu rečenicu. Ta se pojava naziva sintaktičkom sinonimijom.

Glavni razlog zašto se analizator naziva semantičkim sustavom može se smatrati skupom poveznica koji je jedinstven po svojoj potpunosti (oko 100 glavnih, a neke od njih imaju 3-4 varijante).
U nekim slučajevima, pažljiv rad na različitim kontekstima doveo je autore sustava do prelaska na gotovo semantičke klasifikacije izgrađene isključivo na sintaktičkim principima. Tako se razlikuju sljedeće klase engleskih priloga: situacijski prilozi koji se odnose na cijelu rečenicu u cjelini (klauzalni prilog); prilozi vremena (vremenski prilozi); uvodni prilozi na početku rečenice i odvojeni zarezom (otvarači); prilozi koji modificiraju pridjeve itd.

Od prednosti sustava valja istaknuti da je organizacija postupka pronalaženja varijanti sintaktičkog prikaza vrlo učinkovita. Konstrukcija ne ide odozgo prema dolje (top-down), a ne odozdo prema gore (bottom-up), već se sve hipoteze odnosa razmatraju paralelno: prvo se grade sve moguće veze prema formulama rječnika, a zatim razlikuju se mogući podskupovi ovih veza. To, prvo, dovodi do algoritamske neprozirnosti sustava, jer je vrlo teško ući u trag svim relacijama odjednom, a kao drugo, dovodi ne do linearne ovisnosti brzine algoritma o broju riječi, već do eksponencijalni, budući da je skup svih varijanti sintaktičkih struktura na rečenici riječi u najgorem slučaju, ekvivalentan skupu svih osnovnih stabala cjelovitog grafa s vrhovima.

Posljednja značajka algoritma prisiljava programere da koriste mjerač vremena kako bi zaustavili postupak na vrijeme, koji traje predugo. No, svi ti nedostaci više su nego nadoknađeni jezičnom transparentnošću sustava, u kojem su valencije riječi upisane jednakom lakoćom, a redoslijed prikupljanja valencija unutar algoritma nije temeljno postavljen, veze su izgrađene, takoreći paralelno, što u potpunosti odgovara našoj jezičnoj intuiciji.

Za svaku riječ u rječniku bilježi se kojim se veznicima može povezati s drugim riječima u rečenici. Konektor se sastoji od naziva tipa odnosa kojem se predmetna jedinica analize može pridružiti. Postoji više od 100 glavnih, najvažnijih priključaka. Za označavanje smjera veze, na konektoru je s desne strane pričvršćen znak "+", a lijevo znak "-". Lijevi i desni konektori istog tipa čine vezu. Jednoj riječi može se dodijeliti formula spojnika, sastavljena uz pomoć određenih veziva.

Također bilježimo nedostatke Link Grammar Parser.

1. Praktično testiranje sustava pokazuje da je pri analizi složenih rečenica, čija duljina prelazi 25–30 riječi, moguća kombinatorna eksplozija. U tom slučaju rezultat rada analizatora postaje "panični" graf, u pravilu, slučajna verzija sintaktičke strukture, koja je s lingvističkog stajališta neadekvatna.

2. Primjena gore opisanih ideja je teška za flektivne jezike kao što je ruski zbog značajnog povećanja volumena rječnika koji nastaju zbog morfološkog razvoja flekcijskih jezika. Svaki morfološki oblik mora biti opisan posebnom formulom, pri čemu indeks spojnika koji je u njemu uključen mora osigurati postupak podudaranja. To dovodi do komplikacije skupa konektora i do povećanja njihovog broja.

Projekt Open Cognition u sklopu kojeg se razvija Link Grammar Parser otvoren je i besplatan, što je velika prednost za istraživanje. Prilično detaljan opis i izvorni kod mogu se pronaći na stranici. Open Cognition nastavlja se razvijati u današnje vrijeme, što je također važno jer je moguća interakcija s programerima. Uz Link Grammar razvija se i RelEx analizator koji vam omogućuje izdvajanje semantičkih odnosa ovisnosti u izjavama prirodnog jezika, a kao rezultat toga, rečenice su predstavljene u obliku stabala ovisnosti. Koristi nekoliko skupova pravila za ponovnu izgradnju grafa na temelju sintaktičkih odnosa između riječi. Nakon svakog koraka, prema skupu pravila podudaranja, u rezultirajući graf dodaju se oznake strukturnih karakteristika i odnosa između riječi. Međutim, neka pravila, naprotiv, mogu smanjiti graf. Ovako se graf transformira. Ovaj proces primjene niza pravila nalikuje metodi koja se koristi u restriktivnim gramatikama. Glavna razlika je u tome što RelEx radi s prikazom grafa, a ne s jednostavnim skupom oznaka (koji označavaju odnose). Ova vam značajka omogućuje primjenu apstraktnijih transformacija prilikom analize tekstova. Drugim riječima, glavna ideja je koristiti prepoznavanje uzoraka za transformaciju grafova. Za razliku od drugih parsera koji se u potpunosti oslanjaju na sintaktičku strukturu rečenice, RelEx je više fokusiran na predstavljanje semantike, posebice se tiče entiteta, usporedbi, pitanja, razrješenja anafora i leksičke polisemije riječi.

Sustav biranja

Biranje je automatski rusko-engleski sustav prevođenja koji je razvijen od 1999. do 2002. godine. u okviru projekta Automatska obrada teksta (AOT). NA drugačije vrijeme U radu na sustavu sudjelovalo je 22 stručnjaka, od kojih su većina poznati lingvisti.
Sustav francusko-ruskog automatskog prevođenja (FRAP) uzet je kao osnova sustava "Biranje", razvijenog u VCP-u zajedno s Moskovskim državnim institutom za međunarodne jezike. M. Toreza 1976.-1986., te sustav za analizu političkih tekstova na ruskom "Polytext", razvijen u Centru za informacijska istraživanja 1991.-1997.

Sustav "Polytext" bio je usmjeren na analizu službenih dokumenata na ruskom jeziku i sadržavao je kompletan lanac analizatora teksta: grafematski, morfološki, sintaktički i djelomično semantički. U sustavu "Biranje" djelomično je posuđena grafematska analiza, ali prilagođena novim programskim standardima. Program morfološke analize je prepisan, jer je brzina rada bila mala, ali se sam morfološki aparat nije mijenjao.

Na grafičkoj razini, grafematski deskriptori su konstante. Na primjer, LE (leksem) se dodjeljuje nizovima koji se sastoje od ćiriličnih znakova; ILE (strani leksem) - dodjeljuje se nizovima latiničnih znakova; CC (digitalni kompleks) - dodjeljuje se nizovima koji se sastoje od brojeva; PPM (alfanumerički kompleks) - dodjeljuje se nizovima koji se sastoje od brojeva i slova itd.

Na morfološkoj razini za notaciju se koriste gramame – gramatičke karakteristike koje oblik riječi upućuju na određeni morfološki razred. Različiti grami iste kategorije međusobno se isključuju i ne mogu se izraziti jednom riječju. Na primjer, zhr je ženskog roda, tv je instrumentalni padež, pl je množina, ali je neživ, sv je savršeni oblik, dst je aktivni glas, ne je prijelaznost glagola, pvl je imperativ glagola, nst je prezent glagola itd. d.

Analiza fragmentacije ima za cilj podijeliti rečenicu na neodvojive fragmente (sintaktičke jedinice), veće fraze ili njima jednake (sintaktička skupina), te uspostaviti djelomičnu hijerarhiju na skupu tih jedinica. Moguće vrste fragmenata: glavne rečenice, podređene rečenice kao dio složenih, participalnih, priloških i drugih izoliranih obrata. Za svaki ulomak se zna koji su fragmenti u njemu izravno ugniježđeni, a u koji izravno.

FRAP sustav je sadržavao potpuni lanac analize teksta do semantičke, koji je samo djelomično implementiran. U sustavu FRAP razvijen je i testiran semantički aparat na temelju kojeg je u Dialing sustavu kreirana posebna metoda semantičke analize – metoda potpunih varijanti. FRAP nije sadržavao mehanizme za strukturnu procjenu semantičke reprezentacije, odnosno metode ne samo za jedno pojavljivanje elementa teksta, već za cijelu strukturu u cjelini. Ideja metode pune varijante je da analiza treba jasno odvojiti opcije analize koje se pojavljuju različite faze, te deklarativno jezična pravila (parcijalni modeli) koja grade i vrednuju pojedinačne varijante. Ovaj pristup, koji se prije koristio samo za predsemantičke analizatore, sada je, zbog razvoja računalne snage, postao moguć prijelaz na semantiku, čime se povećava razina razdvajanja proceduralnih i deklarativnih dijelova sustava. Proceduralni dio semantičke analize u idealnom slučaju sveden je na cikluse koji prolaze kroz različite jezične opcije. Tako je postalo moguće pojednostaviti lingvističke modele zbog povećane brzine računala.

Glavne komponente semantičkog aparata koji se koristi u biranju su semantičke relacije (SR) i semantičke karakteristike (SH). Primjeri semantičkih odnosa: INSTR - "instrument", LOC - "lokacija, lokacija", BELONGING - "pripadanje", REZLT - "rezultat" itd. Oni su prilično univerzalni i imaju sličnosti s predikatima o kojima se govori u prvom odjeljku, i semantičke uloge, spomenute u trećem odjeljku. Semantičke karakteristike omogućuju izradu formula pomoću logičkih spojeva "i" i "ili". Svakoj riječi je dodijeljena određena formula, sastavljena od semantičkih karakteristika. Semantički rječnik "Dialinga" sadrži oko 40 semantičkih karakteristika. Primjeri semantičkih karakteristika: ABSTRA - apstraktna imenica ili pridjev, STVARI - naziv kemijske tvari ili nečega što se može mjeriti težinom ili volumenom; GEOGR - geografski objekt; KRITI - glagoli kretanja; INTEL - radnje povezane s mentalnom aktivnošću; KOMUNIKALNI - glagoli govora; NOSINF - nositelji informacija; ORG - organizacija; SOBIR - sve što znači puno objekata iste vrste; EMOC - pridjevi koji izražavaju emocije itd. Neke karakteristike su složene jer se mogu izraziti u terminima drugih. Postoje karakteristike koje su antonimi. Zabranjena je njihova uporaba u istoj kombinaciji. Postoje karakteristike koje su varijante drugih. Semantičke karakteristike, uz gramatičke karakteristike, omogućuju provjeru slaganja riječi pri tumačenju poveznica u tekstu.

Trenutno su svi alati razvijeni u okviru projekta AOT (uključujući sustav biranja) besplatni softver za više platformi. Demo i detaljna dokumentacija dostupni su na web stranici.

Sustavi ekstrakcije informacija i predstavljanja znanja

Postoje i drugi sustavi koji sadrže komponente semantičke analize. Međutim, oni imaju značajne nedostatke za istraživanje: teško je pronaći opise koji nisu besplatni i slobodno distribuirani ili ne rade s tekstovima na ruskom. To uključuje OpenCalais (http://www.opencalais.com/opencalais-api/), RCO (http://www.rco.ru/?page_id=3554), Abbyy Compreno (https://www.abbyy.com /ru-ru/isearch/compreno/), SemSin (http://www.dialog-21.ru/media/1394/
kanevsky.pdf), DictaScope (http://dictum.ru/) i drugi.

Treba spomenuti sustav za izdvajanje podataka iz nestrukturiranih tekstova Pullenti (http://semantick.ru/). Zauzela je prvo mjesto na stazama T1, T2, T2-m i drugo mjesto na T1-l na konferenciji Dialog-2016 u natjecanju FactRuEval. Na web stranici programera sustava Pullenti postoji i demo verzija semantičkog analizatora, koja vam omogućuje izgradnju semantičke mreže na temelju prijedloga.

Okruženje DECL alata (http://ipiranlogos.com/) razvijeno je kasnih 90-ih i korišteno za izgradnju ekspertnih sustava (ES), ljuski za ES, logičko-analitičkih sustava (LAS), lingvističkih procesora (LP), koji omogućuju obradu i automatsko izdvajanje znanja iz tokova neformaliziranih dokumenata na prirodnom jeziku.

Sustav strojnog prevođenja ETAP-3 dizajniran je za analizu i prevođenje tekstova na ruskom i engleskom jeziku. Sustav koristi transformaciju tekstova prirodnog jezika u njihovu semantičku reprezentaciju u univerzalnom mrežnom jeziku. Kao što je ranije spomenuto, označavanje sintaktičkog korpusa "Nacionalni korpus ruskog jezika" obavlja jezični procesor ETAP-3, na temelju principa teorije "Značenje Û teksta".

U posljednje vrijeme pojavljuje se sve više sustava za predstavljanje baza znanja u obliku grafova. Budući da se količina informacija neprestano povećava nevjerojatnom brzinom, takvi sustavi moraju podržavati izgradnju i nadopunjavanje baza znanja u automatskom načinu rada. Automatska izgradnja baza znanja može se provesti na temelju strukturiranih izvora podataka.

Primjeri takvih sustava: Yago (http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/), DBpedia (http://wiki.dbpedia .org/), Freebase (https://developers.
google.com/freebase/), Googleov grafikon znanja (https://developers.google.com/knowledge-graph/), OpenCyc (http://www.opencyc.org/). Drugi pristup vam omogućuje da izvučete informacije iz otvoreni resursi na Internetu bez ljudske intervencije: ReadTheWeb (http://rtw.ml.cmu.edu/rtw/), OpenIE (http://nlp.stanford.edu/
software/openie.html), Google Knowledge Vault (https://www.cs.ubc.ca/~murphyk/Papers/kv-kdd14.pdf). Takvi su sustavi eksperimentalni, svaki od njih ima svoje karakteristike. Na primjer, Trezor znanja pokušava uzeti u obzir nesigurnosti, svakoj činjenici se dodjeljuje koeficijent pouzdanosti i podrijetlo informacije. Dakle, sve tvrdnje se dijele na one za koje postoji velika vjerojatnost da su istinite i one koje mogu biti manje vjerojatne. Predviđanje činjenica i njihovih svojstava provodi se metodama strojnog učenja na temelju vrlo velikog broja tekstova i već postojećih činjenica. Trezor znanja trenutno sadrži 1,6 milijardi činjenica. Sustav NELL, razvijen kao dio projekta ReadTheWeb na Sveučilištu Carnegie Mellon, sadrži više od 50 milijuna zahtjeva s različitim stupnjevima povjerenja. Oko 2 milijuna 800 tisuća činjenica ima visok stupanj povjerenja. Proces učenja NELL-a također još nije dovršen.

Donesimo sljedeće zaključke. S razvojem računalna tehnologija i stalni rast
volumena tekstualnih informacija, istraživanja u području automatske obrade teksta usmjerena su na primijenjeni aspekt. Mogućnosti većine alata ograničene su na morfološku i sintaktičku analizu u kombinaciji s metodama iz teorije vjerojatnosti i matematičke statistike. Dakle, samo odabrani dio najviše jednostavni zadaci pokazalo se riješenim. Ostale probleme tek treba riješiti.

Kao što smo vidjeli, postoji mnogo razloga za to. Na primjer, postoji mišljenje da svako pravilo u sintaksi ima svoj pandan u semantici. Ovaj postulat naziva se hipoteza od pravila do pravila. Zapravo, ova korespondencija nije jedan na jedan, i to je glavna poteškoća. Doista, svako sintaktičko pravilo (stablo raščlanjivanja) može biti povezano sa semantičkim pravilom (stablo raščlanjivanja), ali neće biti jedinstveno. U suprotnom smjeru, slično semantičkom pravilu, usklađuje se sintaktičko pravilo, ali ne nužno i jedino. Upravo ta nejasnoća dovodi do današnjih nerješivih problema u području automatske obrade teksta. U vezi s ovim obrazloženjem postavlja se pitanje odabira prave usporedbe iz velikog broja mogućih opcija.

Iz navedenog se može izvući još jedan vrlo važan zaključak. Procese generiranja i tumačenja izjava ne treba promatrati odvojeno, oni su međusobno neraskidivo povezani
sami. Izražavajući svoju misao, osoba se usredotočuje na to hoće li njegov sugovornik razumjeti. U procesu generiranja izričaja, osoba se, takoreći, "ponovo provjerava", modelirajući kako će sugovornik percipirati informaciju. Sličan mehanizam prisutan je i u tumačenju iskaza. Kad shvatimo ono što smo čuli ili pročitali, ponovno “provjeravamo” svojim znanjem i predodžbama o svijetu. Samo kroz to možemo odabrati odgovarajuće značenje.

Suvremeni istraživači skloni su misliti da je moguće napraviti pravi izbor uz dodatnu bazu znanja o svijetu. Takva baza znanja trebala bi sadržavati zdravorazumske informacije o pojmovima i odnosima među njima, kako bi prilikom pristupanja bilo moguće odrediti odgovarajući kontekst iskaza u automatskom načinu rada. Pomoglo bi uzeti u obzir akumulirano znanje o svijetu, koje nije eksplicitno prisutno u pojedinom iskazu, ali izravno utječe na njegovo značenje.

Književnost

  1. Melchuk I.A. Iskustvo teorije lingvističkih modela "Značenje-tekst". Moskva: Jezici ruske kulture, 1999. 346 str.
  2. Lakhuti D.G., Rubashkin V.Sh. Semantički (pojmovni) rječnik za informacijske tehnologije // Znanstvene i tehničke informacije. 2000. broj 7. S. 1–9.
  3. Paducheva E.V. Dinamički modeli u semantici vokabulara. M.: Jezici slavenska kultura, 2004. 608 str.
  4. Tuzov V.A. Računalna semantika ruskog jezika. Sankt Peterburg: Izdavačka kuća St. Petersburg State University, 2003. 391 str.
  5. Nacionalni korpus ruskog jezika. URL: http://www.ruscorpora.ru/ (datum pristupa: 22.08.2016.).
  6. Apresyan V.Yu. i dr. Novi pojašnjavajući rječnik sinonima ruskog jezika. M.–Beč: Jezici slavenske kulture–Bečki slavenski almanah, 2004. 1488 str.
  7. Khoroshilov A.A. Metode za automatsko utvrđivanje semantičke blizine dokumenata na temelju njihove konceptualne analize // Elektroničke knjižnice: perspektivne metode i tehnologije, Elektroničke zbirke: tr. XV Sveruski. znanstvenim konf. RCDL" 2013. Jaroslavlj: Izd-vo YarSU, 2013. str. 369–376.
  8. Rubashkin V.Sh. Prikaz i analiza značenja u inteligentnim informacijskim sustavima. M.: Nauka, 1989. 189 str.
  9. Lakhuti D.G., Rubashkin V.Sh. Sredstva i postupak konceptualne interpretacije ulaznih poruka na prirodnom jeziku // Izv. Akademija znanosti SSSR-a. Ser. Tehn. kibernetski. 1987. br. 2, str. 49–59.
  10. Rubashkin V.Sh. Semantička komponenta u sustavima razumijevanja teksta // KII-2006. Tr. 10 nacionalnih konf. umjetnim. obavještajne podatke iz međunarodne sudjelovanje 2006. URL: http://www.raai.org/resurs/papers/kii-2006/#dokladi (pristup 23.08.2016).
  11. Paducheva E.V. Semantika pogleda i referentna točka // Izv. Akademija znanosti SSSR: Ser. lit. i yaz. 1986. V. 45. broj 5. C. 18–25.
  12. Paducheva E.V. Otpredikatska imena u leksikografskom aspektu // Znanstveno-tehnički. inf. 1991 Ser. 2. broj 5. C. 21–31.
  13. wordnet. Leksička baza podataka za engleski jezik. URL: http://wordnet.princeton.edu/ (pristupljeno 23.08.2016.).
  14. Semantička mreža. URL: https://ru.wikipedia.org/wiki/Semantic_Network (pristupljeno 23.08.2016.).
  15. Minsky M. Minsky "s frame system theory // Proceedings of the workshop on Theoretical issues in natural language processing (TINLAP "75). 1975., str. 104–116 (prikaz, stručni).
  16. Khabarov S.P. Prikaz znanja u informacijskim sustavima: bilješke s predavanja. URL: http://www.khabarov.spb.ru/bz/bz07.htm (datum pristupa: 23.08.2016.).
  17. Lutsenko E.V. Zastupljenost znanja u informacijskim sustavima: elektr. udžbenik dodatak za studente. Krasnodar: Izd-vo KubGAU, 2010. 428 str.
  18. Konstantinova I.S., Mitrofanova O.A. Ontologije kao sustavi za pohranu znanja // Vseros. natjecateljski izbor stat. po prioritetu smjer "Informacijski i telekomunikacijski sustavi". 2008. 54 str.
  19. Razin V.V., Tuzovski A.F. Prikaz znanja o vremenu uzimajući u obzir nesigurnost u semantičkim WEB ontologijama // Dokl. Tomsk država Sveučilište upravljačkih sustava i radioelektronike. 2013. broj 2 (28). str. 157–162.
  20. Patel-Schneider P.F., Horrocks I. et al. SWRL: Jezik pravila semantičkog weba koji kombinira OWL i RuleML // World Wide Web Consortium (W3C). 2004. URL: http://www.w3.org/Submission/SWRL (pristupljeno 18.08.2016.).
  21. Fillmore Ch. Slučaj za slučaj. Proc. Texas Symp. o jezičnim univerzalijama, 1967., 134 str.
  22. Fillmore C. Slučaj slučaja // Novo u stranoj lingvistici. M.: Progres, 1981. S. 369–495.
  23. Dowty D. Tematske proto-uloge i odabir argumenata // Jezik, 1991., sv. 67, br. 3, str. 547–619 (prikaz, stručni).
  24. Norvig P., Russell S. Umjetna inteligencija: moderan pristup. Moskva: Williams, 2007. 1408 str.
  25. Jurafsky D., Martin J. Obrada govora i jezika: Uvod u obradu prirodnog jezika, računsku lingvistiku i prepoznavanje govora. 2008., 1024 str.
  26. Batura T.V., Murzin F.A. Strojno orijentirane logičke metode za prikaz semantike teksta prirodnog jezika: monografija. Novosibirsk: Izdavačka kuća NSTU, 2008. 248 str.
  27. vremenska logika. URL: https://ru.wikipedia.org/wiki/Temporal_logic (datum pristupa: 23.08.2016.).
  28. Vendler Z. Glagoli i vremena. The Philosophical Review, 1957, sv. 66, br. 2, str. 143–160 (prikaz, stručni).
  29. Paducheva E.V. Leksička aspektualnost i klasifikacija predikata prema Maslovu–Wendleru // Questions of linguistics. 2009. broj 6. Str. 3–21.
  30. Zaključak u logičkim modelima. metoda razrješenja. URL: http://www.aiportal.ru/articles/knowledge-models/method-resolution.html (pristupljeno 11.8.2016.).
  31. Boral H., Redfield S. Morfologija stroja baze podataka. Proc. 11. pripravnik. Konf. Vrlo velike baze podataka, 1985., str. 59–71 (prikaz, stručni).
  32. Fushimi S., Kitsuregawa M., Tanaka H. Pregled sustava paralelnog stroja za relacijske baze podataka GRACE. Proc. 12. pripravnik. Konf. Vrlo velike baze podataka, 1986., str. 209–219 (prikaz, stručni).
  33. Tanaka H. Motor paralelnog zaključivanja. IOS Press Publ., 2000., 296 str.
  34. otvorenu spoznaju. URL: http://opencog.org/ (datum pristupa: 23.08.2016.).
  35. Link za analizu gramatike. AbiWord, 2014. URL: http://www.abisource.com/projects/link-grammar/ (pristup 20.08.2016).
  36. Parser prirodnog jezika CMU Link Grammar. URL: https://github.com/opencog/link-grammar/ (pristupljeno 22.08.2016.).
  37. RelEx Dependency Relationship Extractor. opencog. URL: http://wiki.opencog.org/wikihome/index.php/Relex (pristupljeno 22.08.2016.).
  38. Sokirko A.V. Semantički rječnici u automatskoj obradi teksta (na temelju materijala sustava DIALING). Diss. … cand. oni. znanosti. M.: MGPIIA, 2001. 120 str.
  39. Automatska obrada teksta. URL: http://www.aot.ruhttp://aot.ru/ (datum pristupa: 23.08.2016.).
  40. Prószeky G. Strojno prevođenje i hipoteza od pravila do pravila. Novi trendovi u prevoditeljstvu (U čast Kinge Klaudy). Budimpešta: Akademiai Kiado, 2005., str. 207–218 (prikaz, stručni).

Metoda semantičkog polja

Ideje i principi semantičke analize jezika, koji su kasnije objedinjeni pod općim konceptom metode semantičkog polja, razvijali su se postupno i potječu s kraja 19. i početka 20. stoljeća. Među onima koji su se približili formuliranju ovih ideja i principa, ističu, na primjer, A. A. Potebnya, M. M. Pokrovsky, R. Meyer, G. Shperber, G. Ipsen i druge.

Pokušavajući pronaći sistematizirajući početak u sadržajnoj organizaciji jezika, akademik M.M. Pokrovski napisao je 1895. u svom djelu "Semasiološka istraživanja na području starih jezika": "Riječi i njihova značenja ne žive odvojeno jedna od druge, već ujedinjuju se u našoj duši, bez obzira na našu svijest, u različite skupine, a osnova za grupiranje je sličnost ili izravna suprotnost u glavnom značenju.

Richard Meyer u svom djelu iz 1910. razlikuje tri vrste semantičkih sustava (klasa): 1) prirodni (imena drveća, životinja, dijelova tijela itd.), 2) umjetni (imena vojnih činova, sastavnica mehanizama itd.) , 3) poluumjetan (terminologija lovaca i ribara, nazivi etičkih pojmova i sl.).

Načela metode semantičkog polja formulirana su 1930-ih godina, a njezinim se utemeljiteljem smatra njemački znanstvenik Jost Trier.

Neki od najvažnijih postulata koji su činili osnovu Trierove metode semantičkog polja svode se na sljedeće točke:

1. Slijedeći F. de Saussurea, Trier polazi od činjenice da je jezik određenog razdoblja stabilan i relativno zatvoren sustav u kojem su riječi obdarene značenjima ne u izoliranom obliku, već utoliko što su druge riječi susjedne prvom obdaren njima.

2. Opći sustav jezika sastoji se od dvije korelativne vrste polja: a) pojmovnih polja, podijeljenih na elementarne jedinice - pojmove, i b) verbalnih polja, također podijeljenih na elementarne jedinice - riječi.

3. Jedinice verbalnih polja u potpunosti pokrivaju odgovarajuća konceptualna polja, stvarajući svojevrsni mozaik.

4. Semantička polja su međusobno povezana prema načelu hijerarhije podređenosti (šire i uže). S vremenom, semantička polja mijenjaju svoju strukturu, čime se mijenja i leksički sustav jezika u cjelini.

Slijedeći W. Humboldta, jezik se ne tumači kao bitka objektivne stvarnosti, nego kao svjetonazor koji karakterizira samostalna vrijednost i na svoj način raskomada stvarnost.

Jedan od klasičnih primjera semantičkog polja je polje za imenovanje boja koje se sastoji od nekoliko raspona boja ( Crvenaružičastaružičastagrimizno; plavaplavaplavkastotirkiz itd.): zajednička semantička komponenta ovdje je "boja".

Semantičko polje ima sljedeća glavna svojstva:

1. Semantičko polje intuitivno je razumljivo izvornom govorniku i za njega ima psihološku stvarnost.

2. Semantičko polje je autonomno i može se izdvojiti kao samostalan jezični podsustav.

3. Jedinice semantičkog polja povezane su određenim sustavnim semantičkim odnosima.

4. Svako semantičko polje povezano je s drugim semantičkim poljima jezika i zajedno s njima čini jezični sustav.

Teorija semantičkih polja temelji se na ideji postojanja određenih semantičkih skupina u jeziku i mogućnosti pojave jezičnih jedinica u jednoj ili više takvih skupina. Konkretno, rječnik jezika (leksikon) može se predstaviti kao skup zasebnih skupina riječi ujedinjenih različitim odnosima: sinonim ( hvaliti sehvaliti se), antonim ( govoritibudi tiho) itd.

O mogućnosti takvog prikaza vokabulara u obliku kombinacije mnogih privatnih sustava riječi raspravljalo se već u lingvističkim djelima 19. stoljeća, na primjer, u djelima M. M. Pokrovskog (1868/69–1942). Prvi pokušaji identificiranja semantičkih polja učinjeni su pri izradi ideografskih rječnika, odnosno tezurusa - primjerice, kod P. Rogera. Sam izraz "semantičko polje" počeo se aktivno koristiti nakon objavljivanja radova J. Triera i G. Ipsena. Takav prikaz leksičkog sustava prvenstveno je lingvistička hipoteza, a ne aksiom, pa se često koristi kao metoda provođenja jezičnog istraživanja, a ne kao cilj.

Elementi zasebnog semantičkog polja povezani su redovitim i sustavnim odnosima, te su, posljedično, sve riječi polja međusobno suprotstavljene. Semantička polja mogu se presijecati ili potpuno ulaziti jedno u drugo. Značenje svake riječi najpotpunije je određeno samo ako su poznata značenja drugih riječi iz istog područja. Usporedite dvije boje Crvenaružičasta i crveno - ružičasto - ružičasto. Ako se fokusirate samo na prvi red boja, tada se istim leksemom može označiti nekoliko različitih nijansi boja ružičasta. Druga serija boja nam daje detaljniju podjelu nijansi boja, t.j. iste nijanse boja već će biti u korelaciji s dva leksema - ružičasta i ružičasta.

Zasebna jezična jedinica može imati više značenja i stoga se može dodijeliti različitim semantičkim poljima. Na primjer, pridjev Crvena mogu se uključiti u semantičko polje oznaka boja i istodobno u polje čije jedinice objedinjuje generalizirano značenje "revolucionaran".

Semantički atribut koji leži u osnovi semantičkog polja također se može smatrati određenom konceptualnom kategorijom, na ovaj ili onaj način povezanu sa stvarnošću koja okružuje osobu i njezino iskustvo. Odsutnost oštre suprotnosti između semantičkih i konceptualnih pojmova spominje se u radovima J. Triera, A.V. Bondarka, I.I.Meščaninova, L.M. Vasiljeva, I.M. Kobozeve. Ovo razmatranje integralnog semantičkog atributa ne proturječi činjenici da izvorni govornici percipiraju semantičko polje kao neku vrstu neovisne asocijacije, koja je u korelaciji s jednim ili drugim područjem ljudskog iskustva, tj. psihološki stvarno.

Najjednostavnija vrsta semantičkog polja je polje paradigmatskog tipa, čije su jedinice leksemi koji pripadaju istom dijelu govora i ujedinjeni zajedničkim kategoričkim semom u značenju. Takva se polja često nazivaju i semantičkim klasama ili leksiko-semantičkim skupinama.

Kao što su primijetili I.M. Kobozeva, L.M. Vasiliev i drugi autori, veze između jedinica zasebnog semantičkog polja mogu se razlikovati po "širini" i specifičnosti. Najčešći tipovi poveznica su poveznice paradigmatskog tipa (sinonimne, antonimske, rod-vrste itd.).



Na primjer, grupa riječi drvo, podružnica, deblo, list itd. može činiti i samostalno semantičko polje, ujedinjeno relacijom "dio - cjelina", i biti dio semantičkog polja biljaka. U ovom slučaju, token drvo poslužit će kao hipernim (generički pojam) za lekseme kao što su npr. Breza, hrast, dlan itd.

Semantičko polje govornih glagola može se predstaviti kao unija sinonimskih nizova ( govoritirazgovorkomunicirati – ...; grditi segrditikritizirati...; zafrkavatiRugati sevic- ...) itd.

Primjer minimalnog semantičkog polja paradigmatskog tipa je sinonimna skupina, na primjer, neka skupina istih glagola govora. Ovo polje tvore glagoli govoriti, reći, čavrljati,klepet i dr. Elemente semantičkog polja glagola govora objedinjuje integralni semantički znak "govorenja", ali njihovo značenje nije istovjetno. Jedinice ovog semantičkog polja razlikuju se po različitim značajkama, na primjer, "međusobna komunikacija" ( govoriti), "jednosmjerna poruka" ( obavijestiti, izvješće). Osim toga, razlikuju se po stilskim, uobičajenim, derivacijskim i konotativnim komponentama značenja. Na primjer, glagol grditi se, osim seme "govoriti", ima i dodatno konotativno značenje - negativnu ekspresivnost.

Zajednički semantički atribut koji objedinjuje elemente određenog semantičkog polja može djelovati kao diferencijalni u drugim semantičkim poljima istog jezika. Na primjer, semantičko polje "glagola komunikacije" uključivat će i polje glagola govora uz lekseme kao što su telegraf, pisati i dr. Integralno semantičko obilježje za ovo polje bit će obilježje "prijenosa informacija", a "kanal prijenosa informacija" - usmeni, pisani itd. - djelovat će kao diferencijalno obilježje.

Za identifikaciju i opisivanje semantičkih polja često se koriste metode analize komponenti i asocijativnog eksperimenta. Skupine riječi dobivene kao rezultat asocijativnog eksperimenta nazivaju se asocijativnim poljima.

Sam pojam "semantičko polje" danas se sve više zamjenjuje užim jezičnim pojmovima: leksičko polje, sinonimski niz, leksičko-semantičko polje itd. Svaki od ovih pojmova jasnije specificira vrstu jezičnih jedinica uključenih u polje i/ili vrstu odnosa između njih. Ipak, u mnogim se djelima i izraz "semantičko polje" i specijaliziranije oznake koriste kao terminološki sinonimi.

Metode jezične i stilske analize - to je skup različitih metoda analize teksta (i njegovih jezičnih sredstava), uz pomoć kojih se oblikuje znanje u stilistici o zakonitostima funkcioniranja jezika u različitim područjima komunikacije; metode teorijskog razvoja uočenog i otkrivenog u procesu istraživanja. Uz korištenje općelingvističkih metoda, stilistika razvija i vlastitu, koja odgovara predmetu istraživanja i ciljevima analize. Pravila korištenja metoda, kao i tehnika koje ih čine, jesu tehnika stilska analiza. Osim toga, koncept M. s. a. poput općenitijeg pojma "metode lingvističke analize") povezuje se s pojmovima aspekt, koncept i metodologija, ne podudara se, međutim, po značenju ni s jednim od njih u potpunosti.

Aspekt proučavanja je "ugao gledanja", kut razmatranja" predmeta stvarnosti, na primjer, dijakronija i sinkronija, paradigmatika i sintagmatika, jezik i govor u zbiru metoda i tehnika koje se koriste u njihovom proučavanju. Koncept (lat. conceptio - razumijevanje, sustav) - određeni način razumijevanja, tumačenja bilo koje pojave, ideja vodilja za njihovo osvjetljavanje, ideja vodilja, konstruktivno načelo različitih aktivnosti. Posljedično, koncept predodređuje mogući postupak za implementacija (praktična provjera) vlastitih temeljnih odredbi. Upravo u tom smislu stilistika kao određeni način sagledavanja jezičnih pojava ne samo da na svoj način koristi metode koje postoje u lingvistici, već i predlaže (razvija) svoje.

Metodološka osnova stilske analize u ruskoj lingvistici od 19. stoljeća. temeljne su odredbe o povezanosti jezika i mišljenja, jezika i društva, o društvenoj biti jezika i njegovih funkcija (djela W. Humboldt, A.A. Potebni, F. de Saussure, B. De Courtenay, M.M. Bahtin, L.S. Vygotsky, B.A. Serebrennikova, A.A. Leontijev, G.P. Shchedrovitsky i tako dalje.).

Uz dopuštenje funkt. stilistika u zasebnoj znanstvenoj disciplini, problemi sustavnosti predmeta koji se proučava, društvene funkcije jezika, razlikovanje jezika i govora, s naglaskom na problem upotrebe (uporabe) jezika u različitim područjima komunikacija povezana s različitim vrstama aktivnosti i oblicima svijesti. S tim u vezi širi se metodološka osnova stilistike koja se temelji na poznavanju srodnih humanističkih znanosti – filozofije, epistemologije, psihologije, psiholingvistike, znanosti o znanosti itd.

Primjena određene metode u određenoj istraživačkoj praksi ovisi o svrsi istraživanja. Ako, u najopćenitijem smislu, stil razumjeti lingvističku znanost o sredstvima govorne izražajnosti i zakonitosti funkcioniranja jezika, zbog primjerene uporabe jezičnih jedinica ovisno o sadržaju iskaza, ciljevima, situaciji, sferi komunikacije i drugim izvanjezičnim čimbenicima, zatim treba prepoznati realnost postojanja različitih ciljeva stilskog istraživanja, od kojih svaki tvori određeni metodološki stilski smjer, istraživački aspekt. Danas se razlikuje šest takvih područja koja se razlikuju po metodama (metodologiji) analize predmeta proučavanja: stil resursa , (uključujući praktične ), funkcionalni stil , stil teksta , stil književnog teksta , dijakronijsku i komparativnu stilistiku kao ogranci (varijeteti) iz stila sredstava i funkcija. stilistika. Istodobno, principi func. stilistika – kao metodološki širi pravac – prožima sve ostale stilove. pravci: u okviru funkcionalno-stilskog istraživanja mogu se postaviti ciljevi i riješiti zadaci koji se odnose na bilo koji od smjerova ili više njih odjednom. konceptualni okvir, ciljni početak će i dalje ostati funkcionalan. stil. Teorijska osnova funkcionalni stil je ideja jedinstva jezika s cijelim kompleksom nejezičnih (ekstralingvističkih) čimbenika koji prate intelektualnu i duhovnu aktivnost osobe i utječu na proces i specifičnosti proizvodnje govora. Stoga je predmet njezina istraživanja organizacija govora(dosljednost govora), t.j. ne struktura jezika, ne sama jezična sredstva, nego načela njihovog odabira i kombiniranja u različitim područjima djelovanja, ovisno o specifičnim komunikacijskim uvjetima komunikacije i ekstralingvističkom stiloobličavanju.

NA stil resursa glavna metoda i put analize - od sredstava do funkcija; oni. Ovdje je glavni cilj utvrditi da li kao određena stilska jezična sredstva(jedinice i njihovi slojevi sa stilskim bojama) korišteni u tekstovima pojedinih djela, autori, žanrovi itd., koji specifične stilske funkcije nastupaju.

U funkciji stilistika, kao jedan od središnjih smjerova stilistike, opći pristup i metodologija istraživanja su suprotni – od funkcija do sredstava; oni. središnji cilj analize je identificirajući koji jezik i govorna sredstva ostvaruju se glavne funkcije govornih varijeteta(funkcionalni stilovi, podstilovi, žanrovi), kako ekstralingvistička osnova stilova utječe na formiranje govorne organizacije, govornu sustavnost stilova. Pri tome se uzima u obzir interakcija sredstava ne samo iste stilske boje ili jedne razine jezika, već interakcija različitih razina sredstava.

Dakle, func. pristup (metoda), Kao prvo, znači analizu jedinica različitih razina jezika, i to ne toliko njihovo strukturno i sistemsko proučavanje koliko komunikacijsko i sistemsko, vodeći računa o ciljevima i zadacima komunikacije. Drugo, za func. stilistiku karakterizira funkcionalna metoda čije je značenje u utvrđivanju značaja pojedinih obrazaca funkcioniranja jezičnih sredstava za specifičnosti govornog sustava stila i njegovih varijanti(tekstovi). Treće, funkcionalno-stilska metoda usko je povezana s idejom jedinstva jezičnog i ekstralingvističkog aspekta govora. Ova ideja, pak, predodređuje važnost za funkcionalni stil načela konzistentnosti, kada se govorna jedinica shvaća kao određena komponenta međuovisnosti u nizu drugih sličnih jedinica, kao iu odnosu na ovaj niz s izvanjezičnim čimbenicima. stila. Polazeći od zadanog principa jezične pojave razmatraju se u funkts. stila u smislu njihove tekstotvorne uloge. Četvrta, funkcionalno-stilska metoda temelji se na prepoznavanju djelatne prirode jezika (jezika kao intelektualne i emocionalne aktivnosti), te stoga u okviru funk. stilistika je od posebne važnosti antropocentrični pristup proučavanju jezičnih pojava. Pritom je nužna i korištena složena/interdisciplinarna metoda, tj. uzimajući u obzir znanja srodnih disciplina (epistemologija, psihologija, psiholingvistika, znanost znanosti i dr.), utvrđuje se kako i u kojim ekstralingvističkim čimbenicima, a prije svega osnovnim (određivanje oblika svijesti, tip mišljenja, odgovarajuća vrsta aktivnosti u društvu, ciljevi i zadaci komunikacije i sl.), utječu na obrasce funkcioniranja jezičnih sredstava, formirajući specifičnosti stila i njegove govorne organizacije na razini mikroteksta i makroteksta. To su temeljna načela funkcionalno-stilskog pristupa proučavanju jezika (govora), koja omogućuju utvrđivanje konstruktivnih metoda za formiranje funk. stilovi, obrasci oblikovanja teksta u svakom od njih itd.

Osim ovih osnovnih, temeljnih načela istraživanja, u funkt. stilistika postoji i uzima se u obzir sporedna, od njih izvedenica. To su: 1) načelo jedinstva oblika i sadržaja. Formalna jezična obilježja teksta neraskidivo su povezana s njegovom sadržajnom stranom, pa proučavanje specifičnosti funkcioniranja pojedinih cjelina može biti objektivno samo na temelju prepoznavanja međuovisnosti površinske (strukturno-jezične) i unutarnje (sadržajne). -semantičke) razine teksta. U isto vrijeme, func. stilistika ne analizira površinsku razinu teksta s formalne (gramatičke), nego s funkcionalno-komunikacijske strane; 2) načelo koordinacije općeg i pojedinačnog. Ovo načelo pretpostavlja razmatranje pojedinca - leksičke jedinice, iskaza, složene sintaktičke cjeline ili cijelog teksta - ili kao jedinice cjeline, koja odražava sva svojstva i značajke te cjeline (npr. određeni funkcionalni stil kao npr. poseban sustav), tj. u pogledu tipologije; ili kao jedinica izrazito specifičnog karaktera (npr. obilježja individualnog stila književnika, znanstvenika, zakonodavca, publicista i sl.), koja je u rodno-vrstskim odnosima s cjelinom, čiji su „otisci“ ipak zadržava.

Polazeći od ovih konceptualnih načela funkts. stilistike, njezine najvažnije, osnovne metode analize su: 1) funkcionalna metoda koja se, za razliku od strukturalne, temelji, kao što je već napomenuto, na pažnji na funkcije. aspekt jezika/govora, kada se jezična sredstva proučavaju s gledišta njihove uloge u procesu formiranja i izražavanja misli, pojmova, kompozicija, žanrova itd. Ovdje fokus nije na statičkim svojstvima jezika/govora, već na procesu oblikovanja govorno-tekst. To pak predodređuje stvarni komunikacijski pristup funkcija. stilistika na objašnjenje jezika, t.j. vođenje računa o ciljevima, ciljevima, situacijama, komunikacijskim uvjetima itd. do društvenih i individualnih karakteristika sugovornika; 2) sveobuhvatna metoda učenja jezika/govora, t.j. široka (ciljana) upotreba podataka iz različitih znanosti – posebice filozofije, psihologije, znanosti o znanosti, logike, sociologije, teorije komunikacije, pragmatike i dr. drugi - objasniti u procesu znanstvenog tumačenja činjenice dobivene u eksperimentu ili promatranju; 3) višeaspektna analiza odnosa jezičnih jedinica različitih razina u procesu njihova funkcioniranja, utvrđivanje obrazaca tog funkcioniranja, specifičnosti funk. stilova.

Više privatne metode funkt. stilistika – ali za nju ne manje važna u teorijskom smislu – jesu semantičke (ili semantičko-semantički), stilostatistički i poredbeno-dijakronijski metoda koja se temelji na usporednoj povijesnoj analizi iskaza/tekstova. Istodobno, semantička metoda se može smatrati vodećom u ovoj skupini specifičnijih tipova stilova. analiza, koja je povezana s posebnom pažnjom funkts. stilistika na problem adekvatnosti izraza u iskazu/tekstu raznih nijansi značenja.

Tako, semantička metoda povezana s analizom pojedinih jezičnih (govora/teksta) elemenata u smislu njihovo smisleno i semantičko značenje u okolnom kontekstu ili cijelom djelu, kao i u smislu definicije specifičnosti interakcije vanjskih i unutarnjih članova iskaza. Stilostatska metoda koristi se u određivanju stilske specifičnosti kao posljedica utjecaja pojedinih ekstralingvističkih čimbenika na ovaj stil. Preko komparativna metoda analize u stilistici se utvrđuje specifičnost svakog od stilova govora, njihova funkcionalna, jezična, kompozicijska i semantičko-semantička originalnost u međusobnom odnosu. Komparativno-dijakronijska metoda osmišljen da pomogne proučavanju procesa formiranja funkcija. stilova u vezi s promjenom društveno-povijesnih uvjeta ljudskog života i, posljedično, izvanjezičnih čimbenika jezika. Ova metoda se koristi u proučavanju specifičnosti funkcioniranja pojedinih jedinica u jeziku/govoru/tekstu bilo kojeg vremenskog razdoblja, kao i u proučavanju obrazaca oblikovanja stilskog sustava i funkcija. stilova unutar lit. Jezik.

Uz navedene početne, opće metode i načela funkcionalno-stilske analize, danas u stilistici postoji niz konkretno-praktičnih metoda, odnosno tehnika za neposredno provođenje stilskog proučavanja jezika. Mogu se podijeliti na:

1) opće znanstvene, među kojima se ističu

a) metoda izravnog promatranja,

b) deskriptivna metoda s posebnim tehnikama kao što su promatranje, usporedba, klasifikacija, eksperiment, rekonstrukcija, generalizacija, interpretacija,

c) metoda modeliranja

; 2) opći filološki, uključujući metodu interpretacije i komparativnu analizu jezične građe;

3) općelingvističke metode prikazane u stilističkim studijama

a) strukturnu, posebno strukturno-semantičku analizu,

b) statistička analiza,

c) način izgradnje jezičnih paradigmi,

d) metoda strukturiranja polja,

e) složena analiza;

4) privatni lingvistički, uklj. vlasničke metode, ujedinjujući

a) analiza diskursa,

b) distributivna analiza,

c) analiza komponenti,

d) metoda postupne identifikacije predmeta proučavanja,

e) kontekstualna ili kontekstualna analiza,

e) pragmatičan,

g) analiza sjemena,

h) strukturna i semantička analiza građe,

i) analiza diskursa i neke. drugi

Specifična primjena M. sa. a. određen je ciljevima, zadacima, metodološkim i konceptualnim postavkama studija, kao i znanstvenom pripadnošću jednoj ili drugoj lingvističkoj školi. U tom smislu, metode poput analize diskursa, kompleksne analize i metode strukturiranja polja donekle su modificirane u okviru funkcija. stilistika. Tako, metoda strukturiranja polja služi za sistematizaciju identificiranih stilskih sredstava (ne samo predtekstnih, već i tekstualnih) u smislu njihove bliskosti/udaljenosti (centralnosti/perifernosti) u smislu implementacije određene stilske značajke ili kategorije u tekstu. Metoda analize diskursa ne shvaća se kao analiza određenih strukturnih i semantičkih konteksta cjeline – npr. fragmenti teksta koji sadrže ekspresivnost, imperativnost, nedorečenost i sl., ali kao analizirano ili drugo strukturno i semantičko obilježje teksta u njegovoj povezanosti s ekstralingvističkim temeljima komunikacije određene govorne sfere. Kompleksna analiza u okviru funkcija. Stilistika ne uključuje samo kombiniranje različitih vrsta i metoda istraživanja (kao, na primjer, u drugim disciplinama), već uglavnom uzimanje u obzir povezanosti između specifičnih činjenica funkcioniranja jezika u određenom području komunikacije s raznim izvanjezičnim pojavama. studirao u drugim znanostima. Štoviše, oslanjanje na podatke drugih znanosti - filozofije, logike, sociologije, znanosti, psihologije, psiholingvistike, pragmatike, semiotike, komunikacijske teorije, kulturoloških studija itd. - djeluje kao objašnjavajuća osnova za proučavanje zakonitosti funkcioniranja jezik (govor).

Osim toga, dobiva poseban sadržaj u okviru funkcija. stilistika metoda interpretacije povezana s objašnjenjem i interpretacijom funkt. specifičnosti ne toliko predtekstnih cjelina, koliko tekstualnih, s pristupom interpretaciji cijelog teksta = djela.

Uzimajući u obzir ciljeve, podciljeve i zadaće komunikacije u procesu kognitivne i govorno-mislećih aktivnosti koje se odražavaju u tekstu, prilikom identificiranja njihove projekcije na određeni tekst, njegove sadržajno-semantičke jedinice i govorne žanrove, omogućuje se određivanje struktura i kompozicija teksta na razini mikroteksta, primarni govorni žanrovi kao odraz dinamike verbalne aktivnosti. Pritom se kao posebne metode koriste stilostatistička i kvantitativna metoda, točnije, kvalitativna (uzimajući u obzir semantiku) kvantitativna metoda (radovi OKO. Sirotinina, M.A. Kormilitsyna, V.V. Odintsova, O.A. Krylova, Yu.A. Škrebneva, N.M. Razinkina, E.A. Bazhenova, V.A. Salimovski, N.A. Kupina, V.V. Dementieva, K.F. Sedova, I.A. Sternina i tako dalje.).

posebna grupa M. s. a. predstavljaju tehnike koje se koriste za analizu umjetnički tekst(x. t). Proučavanje x. t. polazi od načela opće figurativnosti, jedinstva oblika i sadržaja, ostvarenja estetske funkcije jezika u ovoj sferi komunikacije. Glavna metoda (pristup) za analizu predmeta koji se proučava je utvrditi kako je cjelokupna struktura govora pojedinog umjetnika. kontekst, djelo (niz spisateljskih tekstova, književni pokret i sl.) i njegove pojedine jezične i tekstualne cjeline (stilska sredstva, kompozicija i sl.) pridonosi izražavanju idejnog i figurativnog sadržaja djela, provodi u tekst" autorova slika" .

Jedna od najranijih metoda analize korištena u ruskoj stilistici je metoda "explication du text" koju je razvio i primijenio L.V. Shcherba u analizi umjetnika. i značajke kreativnih radova. Bit ove metode je odrediti interakciju jezične organizacije (obilježja arhitektonike, specifičnosti sintaktičkih struktura, metode i načela rasporeda i rasporeda riječi, oblici i vrste intonacijske podjele iskaza itd.). .) idejnim, likovno-figurativnim i emocionalnim sadržajem teksta. Pritom se interakcija smatra konstruktivnim međusobnim utjecajem, kojim se stvara (materijalizira, izražava) estetski koncept autora djela u cijelom djelu.

prijepodne Peshkovsky je razvio metodu stilskog eksperimenta, koja se sastoji u zamjeni sinonima za određenu riječ u djelu (ili u uklanjanju bilo koje riječi iz njega) i utvrđivanju estetskog značaja autorove riječi/izraza, njezinog konceptualnog, figurativnog i semantičkog opterećenja u usporedbi s eksperimentalnim tekstovima. oženiti se koncept "opće figurativnosti" koji je uveo znanstvenik, a koji leži u činjenici da su sve jezične jedinice jednog ili drugog uistinu umjetničke. tekstovi su usmjereni na izražavanje određenog umjetnika. slike i stoga su strogo estetski i stilski motivirani, t.j. jedini mogući način izražavanja ove estetske misli.

Analiza umjetnika. tekstova zastupa i B.A. Larina, s ciljem otkrivanja sustavnih odnosa riječi s drugim riječima umjetnika. cjelina pri izražavanju takozvane presečne pjesničke misli-ideje (ili lajtmotiva) djela, umjetnik. slika. Takvo svojstvo umjetnika. znanstvenik je nazvao riječi "kombinatorno povećanje značenja", pojavljujući se u riječi u dinamici sadržajno-konceptualnog razmještanja svih x. t. (cijela), kao i idiostil književnika. Ideja G.O. Vinokura o "unutarnji oblik umjetničke riječi", koji se sastoji u tome da su leksička sredstva jezika i njihova značenja u x. odnosno osnove, polazeći od koje umjetnik stvara poetsku riječ - metaforu, u potpunosti "okrenutu" temi i ideji djela. Istovremeno, smisao i svrha umjetnika. metafore se mogu razumjeti tek nakon čitanja cijelog djela, tj. proizlaze iz estetske cjeline.

U cjelini, sve ove metode (-e) mogu se uvjetno kombinirati u općenitiju metodu nazvanu "riječ i slika" i usredotočene na detekciju u x. v. Sustavi jezičnih sredstava za provedbu figurativno-estetičke funkcije umjetnički stil govore. Ova metoda ima za cilj postizanje što adekvatnijeg čitanja autorovog teksta, u aspektu jedinstva riječi i slike, prirode individualnog stila pisca, književnog smjera, t.j. rješavaju se različiti problemi interpretacije x. t. sri. u vezi s tim, razvio V.V. Vinogradovljeva načela proučavanja umjetničkog jezika. književnost kao umjetnost pjesničke riječi, jezik umjetnika. djelo, individualni autorski stil i sam koncept "slike autora", kao i razvoj ovih ideja u djelima V.V. Odintsova, N.A. Kozhevnikova, L.A. Novikova, V.P. Grigorieva, D.N. Šmeleva, I.Ya. Chernukhina i drugi.

U području stilska analiza X. t. najčešće metode kao npr asocijativno-konceptualna analiza pjesničkog (umjetničkog) teksta otkrivajući njegova dominantna značenja. Takva analiza objedinjuje sljedeće specifične istraživačke aktivnosti: komponentnu analizu, kontekstualnu analizu, estetsku i stilsku analizu, kulturološku analizu, korelaciju tekstualnih značenja s informacijama iz općeg kulturnog fonda. H. t. također se proučava kroz tematsko-klasifikacijske, semantičke, formalno-spoznajne vrste analize usmjerena na proučavanje strukturnih i sadržajnih obilježja pojedinog pojma u x. t .; konceptualna analiza, osmišljen da identificira ideje pojmova kao normativno-vrijednih činjenica u pjesničkom (umjetničkom) stvaralaštvu; metoda strukturno-fragmentarnog opisa , koji se temelji na pojmu sustavnog x. v. i omogućava odabir pojedinačnih fragmenata u svrhu usporedbe; komparativna stilska analiza , koji omogućuje usporedbu izvornog (nacrta) teksta s njegovom konačnom verzijom kako bi se identificirale značajke autorovog rada na konceptu djela; metoda lingvopoetske interpretacije , koji uključuje tumačenje sadržaja teksta na temelju otvaranja sistemsko-semantičkih odnosa jezičnih jedinica različitih razina. Osim toga, u proučavanju ch.t. se posljednjih godina naširoko koristi složena analiza , koji objedinjuje različite vrste ne samo lingvističke, već i književne analize.

Komunikativni stil književnog teksta koji se pojavljuje posljednjih godina zaslužuje posebnu pozornost. U vezi s posebnim istraživačkim zadacima, komunikativni stil H. t. razvija vlastite metode (tehnike) analize, koje se općenito mogu predstaviti u tri varijante: metoda asocijativnog polja, "regulatorno strukturiranje" i metoda informacijsko-semantičke analize .

Metoda asocijativnog polja na temelju detekcije u x. odnosno asocijativne veze između riječi. Pritom se analiza leksema odvija na različitim razinama, pri čemu se istovremeno uzimaju u obzir njihov fonemski izgled i gramatička priroda, morfemska struktura i leksičko značenje, stilska obilježjenost te tematska i situacijska korelacija itd. Upravo zahvaljujući svojim asocijativnim poveznicama riječ postaje "dirigent" autorovog estetskog koncepta, izraženog u cjelokupnom djelu, pridonosi definiranju autorove konceptualne i jezične slike svijeta i njegovog idiostila.

Metoda "regulatornog strukturiranja"podrazumijeva prepoznavanje regulatornih struktura (regulatora) u tekstu koji potiču različite komunikacijske učinke i predstavljaju tekstualne strukture-podražaje. Potonji se shvaćaju kao metode organiziranja tekstualnih mikrostruktura u korelaciji s općom komunikacijskom strategijom teksta. Regulatori se razlikuju i oblikuju na temelju leksičkih sredstava koreliranih u čitateljevoj percepciji po principu asocijativnih veza, pa su ovdje pomoćne metode analize psiholingvistički eksperiment i kontekstualna analiza.

Preko informacijsko-semantička metoda provodi se analiza semantičkog razvoja teksta, usmjerena na proučavanje procesa formiranja značenja na temelju informacija prezentiranih u umjetnosti. raditi. Pod, ispod informacija ovdje razumijemo spoznaju o svijetu, utjelovljenu u tekstu sa stanovišta određenog estetskog ideala autora. Rezultat reflektiranja ove informacije u umu adresata je značenje teksta, što se shvaća kao struktura lingvistički oblikovanih semantičkih fragmenata teksta koji koreliraju sa stvarnim svijetom, t.j. semantička struktura teksta. Specifične tehnike ove metode su a) eksperimentalna analiza, koja omogućuje identificiranje ključnih elemenata leksičkog sustava teksta i značenja koja se njime ažuriraju, proučavanje mehanizma postupnog formiranja značenja u umu adresata u proces njegove spoznajne aktivnosti, kako bi se utvrdila individualna autorova specifičnost u razmještanju estetskog značenja, značajke tog procesa u tekstovima različite vrste zbog različitih komunikacijskih strategija itd. b) kontekstualna analiza; c) komponentna analiza; d) modeliranje tekstualnih paradigmi i asocijativnih semantičkih polja pojmova.

Valja napomenuti da u suvremenom func. stil – osobito u vezi s prijelazom na proučavanje cijelog teksta – primjenjuje se precizno složena metodologija istraživanja kako sa stajališta kombiniranja različitih vrsta analize u okviru određenog djela, tako i sa stajališta komplementarne kombinacije odgovarajućih jezičnih i izvanjezičnih planova intelektualne i duhovne djelatnosti. U funkciji stil Složen pristup Proučavanje govornog tkiva teksta nije samo jedna od metoda, već temelj funkcionalne i stilske analize.