Semantička načela. Krylova M.N. Funkcionalno-semantička analiza kao osnova za sistematsko proučavanje jezičkih jedinica. Funkcionalno-semantička kategorija poređenja

Semantička načela.  Krylova M.N.  Funkcionalno-semantička analiza kao osnova za sistematsko proučavanje jezičkih jedinica.  Funkcionalno-semantička kategorija poređenja
Semantička načela. Krylova M.N. Funkcionalno-semantička analiza kao osnova za sistematsko proučavanje jezičkih jedinica. Funkcionalno-semantička kategorija poređenja

Reč semantika dolazi iz starogrčkog jezika: σημαντικός sēmantikos, što znači „značajan“, a kao pojam prvi ju je upotrebio francuski filolog i istoričar Michel Bréal.

Semantika je nauka koja proučava značenje reči(leksička semantika), mnoga pojedinačna slova (u drevnim alfabetima), rečenice - semantičke fraze i tekstovi. Bliska je drugim disciplinama kao što su semiologija, logika, psihologija, teorija komunikacije, stilistika, filozofija jezika, lingvistička antropologija i simbolička antropologija. Skup pojmova koji imaju zajednički semantički faktor naziva se semantičko polje.

Šta je semantika

Ova nauka proučava jezičko i filozofsko značenje jezika, programskih jezika, formalne logike, semiotike i vrši analizu teksta. Povezano je sa:

  • sa značenjem riječi;
  • riječi;
  • fraze;
  • znakovi;
  • simboli i šta oni znače, njihova oznaka.

Problem razumijevanja je bio predmet mnogih istraživanja već duži vremenski period, ali su se njime bavili uglavnom psiholozi, a ne lingvisti. Ali samo u lingvistici proučava se tumačenje znakova ili simbola, koji se koristi u zajednicama pod određenim okolnostima i kontekstima. U ovom pogledu, zvuci, izrazi lica, govor tijela i proksemija imaju semantički (smisleni) sadržaj, a svaki od njih uključuje nekoliko odjeljaka. U pisanom jeziku stvari poput strukture pasusa i interpunkcije sadrže semantički sadržaj.

Formalna analiza semantike ukršta se s mnogim drugim područjima proučavanja, uključujući:

  • leksikologija;
  • sintaksa;
  • pragmatizam;
  • etimologija i drugi.

Podrazumijeva se da je definicija semantike također dobro definirano polje samo po sebi, često sa sintetičkim svojstvima. U filozofiji jezika, semantika i referenca su usko povezani. Dalja srodna polja uključuju filologiju, komunikacije i semiotiku.

Semantika je u suprotnosti sa sintaksom, proučavanjem kombinatorike jezičkih jedinica (bez osvrta na njihovo značenje) i pragmatikom, proučavanjem odnosa između simbola jezika, njihovog značenja i korisnika jezika. Područje proučavanja u ovom slučaju također ima značajne veze s različitim reprezentacijskim teorijama značenja, uključujući prave teorije značenja, koherentne teorije značenja i korespondentne teorije značenja. Svaki od njih povezan je s općim filozofskim proučavanjem stvarnosti i predstavljanjem značenja.

Lingvistika

U lingvistici je semantika potpolje posvećeno proučavanju značenja, svojstvene nivoima riječi, fraza, rečenica i širih jedinica diskursa (tekst ili narativna analiza). Proučavanje semantike je također usko povezano sa predmetima reprezentacije, reference i označavanja. Glavno istraživanje ovdje je usmjereno na proučavanje značenja znakova i proučavanje odnosa između različitih jezičkih jedinica i složenica kao što su:

  • homonimija;
  • sinonimija;
  • antonimija
  • metonimija;

Ključni problem je kako dati više značenja velikim komadima teksta kao rezultat sastava manjih jedinica značenja.

Montag gramatika

Kasnih 1960-ih, Richard Montague (Semantics Wikipedia) je predložio sistem za definisanje semantičkih zapisa u smislu lambda računa. Montagu je pokazao da se značenje teksta kao cjeline može razložiti na značenja njegovih dijelova i na relativno mala pravila kombinacije. Koncept takvih semantičkih atoma ili primitiva je fundamentalan za jezik mentalne hipoteze iz 1970-ih.

Uprkos svojoj eleganciji, Montaguova gramatika bila je ograničena varijabilnosti u značenju riječi ovisno o kontekstu i dovela je do nekoliko pokušaja da se uključi kontekst.

Za Montaguea, jezik nije skup oznaka prikačenih stvarima, već skup alata čiji je značaj elemenata u tome kako funkcioniraju, a ne u njihovoj vezanosti za stvari.

Specifičan primjer ovog fenomena je semantička dvosmislenost, značenja nisu potpuna bez nekih elemenata konteksta. Nijedna riječ nema značenje koje se može identificirati neovisno o tome šta se još nalazi u njenoj blizini.

Formalna semantika

Izvedeno iz Montaguovog rada. Visoko formalizirana teorija semantike prirodnog jezika u kojoj se izrazima dodjeljuju oznake (značenja), kao što su pojedinci, vrijednosti istine ili funkcije od jedne do druge. Istinitost rečenice i, što je još zanimljivije, njen logički odnos prema drugim rečenicama, tada se procjenjuje u odnosu na tekst.

Istinsko-uslovna semantika

Još jedna formalizirana teorija koju je stvorio filozof Donald Davidson. Svrha ove teorije je povezujući svaku rečenicu prirodnog jezika sa opisom uslova pod kojima je istinita npr. "snijeg je bijel" je istina ako i samo ako je snijeg bijel. Zadatak je doći do pravih uslova za bilo koju rečenicu iz fiksnih značenja koja se pripisuju pojedinim riječima i fiksnih pravila za njihovo kombinovanje.

U praksi, uslovna semantika je slična apstraktnom modelu; Konceptualno se, međutim, razlikuju po tome što istinito-uslovna semantika nastoji povezati jezik s iskazima o stvarnom svijetu (u obliku metajezičkih iskaza), a ne s apstraktnim modelima.

Konceptualna semantika

Ova teorija je pokušaj da se objasne svojstva strukture argumenta. Pretpostavka koja leži u osnovi ove teorije je da sintaktička svojstva fraza odražavaju značenja riječi koje su im na čelu.

Leksička semantika

Lingvistička teorija koja ispituje značenje riječi. Ova teorija to razumije značenje riječi se u potpunosti odražava u njenom kontekstu. Ovdje značenje riječi leži u njenim kontekstualnim odnosima. To jest, svaki dio rečenice koji ima smisla i kombinira se sa značenjima drugih komponenti označava se kao semantička komponenta.

Računarska semantika

Računarska semantika fokusira se na obradu lingvističkog značenja. U tu svrhu su opisani specifični algoritmi i arhitektura. U okviru ovog okvira, algoritmi i arhitekture se također analiziraju u smislu odlučivosti, složenosti vremena/prostora, potrebnih struktura podataka i komunikacijskih protokola.

Umjetna semantika je grupa ključnih riječi i fraza za pretraživanje za kreiranje sadržaja, tj. stvaranje semantičkog jezgra, koji može skrenuti pažnju na sadržaj ili povećati promet na web resursu, itd. U osnovi, umjetna semantika ili semantika teksta koristi se za kreiranje sadržaja i reklama.

Semantika online

U računarskoj nauci, termin semantika odnosi se na značenje jezičkih konstrukcija, za razliku od njihovog oblika (sintakse). Ona obezbeđuje pravila za tumačenje sintakse, koji ne daje značenje direktno, ali ograničava moguća tumačenja onoga što je deklarirano. U ontološkoj tehnologiji, termin se odnosi na značenje koncepata, svojstava i odnosa koji formalno predstavljaju stvarne objekte, događaje i scene u logičkom pristupu, kao što je logika opisa koja se obično implementira na Internetu.

Značenje pojmova logike opisa i uloga određeno je njihovom modelsko-teorijskom semantikom zasnovanom na interpretacijama. Koncepti, svojstva i odnosi definirani u ontologijama mogu se primijeniti direktno u označavanju web stranice, u bazama podataka grafova u obliku okidača. Semantika programskih jezika i drugih jezika je važan problem i oblast proučavanja u računarstvu. Razvijeni su različiti načini za formalno opisivanje programskih jezika, zasnovano na matematičkoj logici.

Semantički modeli

Online semantika se odnosi na širenje World Wide Weba kroz implementacija dodatih metapodataka koristeći metode semantičkog modeliranja podataka. U semantičkom webu, termini kao što su semantički web i semantički model podataka koriste se za opisivanje specifičnih tipova modela podataka koje karakterizira korištenje usmjerenih grafova u kojima vrhovi predstavljaju koncepte ili entitete svijeta i njihova svojstva, a lukovi označavaju odnose između njih. .

Na webu je nekoliko analiza riječi, strukture linkova i dekompozicije mreže i uključuju dio, vrstu i slične veze. U automatizovanim ontologijama, veze se računaju kao vektori bez eksplicitnog značenja. Razvijaju se različite automatizovane tehnologije za izračunavanje značenja reči: mašine za latentno semantičko indeksiranje i vektorsku podršku, kao i obradu prirodnog jezika, neuronske mreže i metode predikatskog računa.

Psihologija

U psihologiji, semantičko pamćenje je pamćenje za značenje – drugim riječima, aspekt pamćenja koji zadržava samo suštinu, opšte značenje zapamćenog iskustva, dok je epizodno pamćenje pamćenje za efemerne detalje - pojedinačne karakteristike ili jedinstvene karakteristike iskustva. Termin "epizodično pamćenje" skovali su Tulwig i Schacter u kontekstu "deklarativnog pamćenja", koje je uključivalo jednostavnu integraciju činjeničnih ili objektivnih informacija o objektu.

Sjećanja se mogu prenositi kroz generacije ili izolovati na jednu generaciju zbog kulturnog uništenja. Različite generacije mogu imati različita iskustva u sličnim trenucima u svojim vremenskim linijama. Ovo može stvoriti vertikalno heterogenu semantičku mrežu za određene riječi u homogenoj kulturi.

Zašto značenje zanima filozofe i psihologe i zašto se smatra kontroverznim „pitanjem“, nije teško razumjeti. Razmotrite naizgled nevino pitanje: "Šta znači riječ krava?" Naravno, ne radi se o nekoj specifičnoj životinji. Možda je onda čitava klasa životinja kojoj dajemo ime krava? Sve krave su različite na ovaj ili onaj način; i u svakom slučaju, niko ne zna niti bi mogao znati sve pripadnike klase krava, ali ipak bih volio da mislim da znamo značenje riječi krava, te da je možemo ispravno koristiti za označavanje određenih životinja koje imamo nikad ranije viđeno. Postoji li jedno ili više svojstava po kojima se krave razlikuju od svih drugih objekata koje nazivamo drugačije? Razmišljajući na ovaj način, nalazimo se uronjeni u filozofsku raspravu između “nominalista” i “realista” koja se u ovom ili onom obliku nastavlja od Platonovog vremena do danas. Da li stvari koje nazivamo istim imenom imaju neka zajednička “esencijalna” svojstva po kojima se mogu identificirati (kako bi rekli “realisti”), ili nemaju ništa zajedničko jedno s drugim osim imena, koje prema utvrđenim običaj koji smo naučili primijeniti na njih (kako bi „nominalista” mogao reći)? A krava nije posebno težak slučaj. Na kraju krajeva, može se uzeti zdravo za gotovo da se krave mogu definirati u smislu biološke klasifikacije rodova i vrsta. Šta je sa riječju stol? Stolovi dolaze u različitim oblicima i veličinama, izrađuju se od raznih materijala i koriste se u različite svrhe. Ali stolovi su, barem fizički, vidljivi i opipljivi objekti; i za njih je moguće sastaviti određenu listu definišnih karakteristika. Šta možemo reći o riječima kao što su istina, ljepota, dobrota, dobrota, dobar kvalitet, itd.? Imaju li sve ove stvari koje opisujemo kao “lijepe” ili “dobre” neko zajedničko svojstvo? Ako je tako, kako ga identificirati i opisati? Možda bi trebalo reći da je značenje riječi kao što su istina, ljepota i dobrota “pojam” ili “ideja” koja se s njima povezuje u “umovima” govornika odgovarajućeg jezika,^ i općenito ta “značenja” da li su “koncepti” ili “ideje”? Reći ovo znači ponovo ući u filozofske i psihološke debate, jer mnogi filozofi i psiholozi sumnjaju u mogućnost postojanja koncepata (ili čak „uma“). Ali čak i ako ostavimo ove poteškoće po strani ili odbijemo da ih razmotrimo, otkrit ćemo da postoje i druga pitanja povezana sa značenjem i koja imaju više ili manje filozofsku prirodu. Da li je smisleno reći da je neko upotrebio reč čije je značenje drugačije od onoga što reč „stvarno“ znači? Postoji li uopće “istinsko” ili “tačno” značenje riječi?

9.1.4. VRIJEDNOSTI "VRIJEDNOSTI"

Do sada smo govorili samo o značenjima reči. Rekli smo i za rečenice da imaju značenje. Da li se izraz "značenje" ovdje koristi u istom smislu? Inače, često kažemo da rečenice i kombinacije riječi imaju ili nisu “smislene”, ali obično ne kažemo da riječi nisu “smislene”. Da li je onda moguće ukazati na razliku, a možda i na čitav niz razlika, između pojmova „biti značajan“ i „imati značenje“? O ovim i mnogim drugim srodnim pitanjima više puta su raspravljali filozofi i lingvisti. U izlaganju semantičke teorije postalo je istina da se skrene pažnja na višestruka značenja "značenja".

Uz filozofska pitanja, postoje i ona koja direktno spadaju u nadležnost lingviste. Filozofi, kao i prva osoba koju sretnu, obično uzimaju "riječi" i "rečenice" kao očigledne činjenice. Lingvista to ne može učiniti. Riječi i rečenice su za njega prvenstveno jedinice gramatičkog opisa; Uz njih se prepoznaju i druge gramatičke jedinice. Lingvista treba da razmotri opšte pitanje o tome kako su gramatičke jedinice različitih tipova povezane s jedinicama semantičke analize. Posebno, on mora ispitati pitanje da li treba praviti razliku između „leksičkog“ i „gramatičkog“ značenja.

Još niko nije predstavio, barem generalno, zadovoljavajuće i razumna teorija semantika. I to treba jasno prepoznati u svakoj raspravi o problemima ove discipline. Međutim, odsustvo koherentne i potpune teorije semantike ne znači da do sada nije postignut apsolutno nikakav napredak na polju teorijskog proučavanja značenja. U nastavku donosimo kratak pregled najvažnijih dostignuća lingvista i filozofa posljednjih godina.

Semantiku smo već okvirno definisali kao nauku o značenju; a ova definicija je jedina stvar koja okuplja sve semantičare. Čim počnemo da se upoznajemo sa određenim semantičkim radovima, susrećemo se sa toliko raznolikim pristupima definisanju i utvrđivanju značenja da to zbunjuje neiskusnog čitaoca. Prave se razlike između "emocionalnog" i "konceptualnog" značenja, između "značenja" i "značenja", između "performativnog" i "opisnog" značenja, između "značenja" i "reference", između "denotacije" i "konotacije", između “znakova” i “simbola”, između “ekstenzionalnog” i “intenzije”, između “implikacije”, “posljedice” i “pretpostavke”, između “analitičkog” i “sintetičkog”, itd. Terminologija semantike je bogata i potpuno zbunjujuće, jer upotrebu termina različitih autora karakteriše odsustvo bilo kakve konzistentnosti i jednoobraznosti. Zbog toga termini koje uvodimo u ovom poglavlju neće nužno imati isto značenje koje imaju u drugim radovima o semantici.

Počinjemo s kratkom kritikom tradicionalnog pristupa definiranju značenja.

9.2. TRADICIONALNA SEMANTIKA

9.2.1. IMENOVANJE STVARI

Tradicionalna gramatika je bila zasnovana na pretpostavci da je reč (u smislu "značenja"; up. §5.4.4) osnovna jedinica sintakse i semantike (uporedi takođe §1.2.7 i §7.1.2). Riječ se smatrala "znakom" koji se sastoji od dva dijela; nazvaćemo ove dvije komponente oblik riječi i njegove značenje. (Zapamtite da je ovo samo jedno od značenja koje termin „forma” ima u lingvistici; „oblik” reči kao „znaka” ili leksičke jedinice treba razlikovati od specifičnih „slučajnih” ili flektivnih „oblika” u koje se ta reč pojavljuje u rečenicama; up. § 4.1.5.) Vrlo rano u istoriji tradicionalne gramatike postavilo se pitanje o odnosu između reči i „stvari“ na koje se odnose ili koje su „označavale“. Drevni grčki filozofi iz vremena Sokrata, a nakon njih i Platona, formulirali su ovo pitanje terminima koji su se od tada uobičajeno koristili u njegovoj raspravi. Za njih je semantička relacija koja postoji između riječi i “stvari” bila “imenovanje”; a onda se pojavio sledeći problem: da li su „imena” koja dajemo „stvarima” „prirodnog” ili „konvencionalnog” porekla (up. § 1.2.2). Kako se tradicionalna gramatika razvijala, postalo je uobičajeno praviti razliku između značenja riječi i "stvari" ili "stvari" koje su "imenovane" tom riječju. Srednjovekovni gramatičari su ovu razliku formulisali na sledeći način: oblik reči (onaj deo dictio-a koji je okarakterisan kao vox) označava „stvari” pomoću „koncepta” koji je povezan sa oblikom u glavama govornika datog jezika; a ovaj koncept je značenje riječi (njeno značenje). Ovaj koncept ćemo smatrati tradicionalnim viđenjem odnosa između riječi i "stvari". Kao što je već spomenuto, ovaj pogled je, u principu, bio osnova za filozofski definiciju „delova govora” u skladu sa karakterističnim za njih „sredstvima označavanja” (uporedi § 1.2.7). Ne ulazeći u detaljno izlaganje tradicionalne teorije „značenja”, samo ćemo primetiti da terminologija korištena u ovoj teoriji nije isključila mogućnost dvosmislene, ili nediferencirane, upotrebe termina "označiti" : moglo bi se reći da oblik riječi "označava" "pojam" pod koji su "stvari" podvedene (po "apstrahirajući" od njihovih "slučajnih" svojstava); moglo bi se reći i da "označava" same "stvari". Što se tiče odnosa između "koncepta" i "stvari", on je, naravno, bio predmet znatnih filozofsko neslaganje (posebno je upadljivo neslaganje između “nominalista” i “realista”; up. § 9.1.3) Ovdje možemo zanemariti ove filozofske razlike.

9.2.2. REFERENCE

Ovdje je korisno uvesti moderan termin za “stvari” razmatrane sa stanovišta “imenovanja”, “imenovanja” riječima. Ovo je termin referent. Reći ćemo da je odnos koji postoji između riječi i stvari (njihovih referenta) odnos reference (korelacija): riječi korelirati sa stvarima (i nemojte ih „imenovati“ ili „imenovati“). Ako prihvatimo razliku između oblika, značenja i referenta, tada možemo dati poznati shematski prikaz tradicionalnog pogleda na odnos između njih u obliku trokuta (koji se ponekad naziva i „semiotički trokut“) prikazanog na Sl. 23. Isprekidana linija između forme i referenta ukazuje da je odnos između njih indirektan; oblik je povezan sa svojim referentom kroz posredničko (pojmovno) značenje koje je povezano sa svakim nezavisno. Dijagram jasno ilustrira važnu točku da je u tradicionalnoj gramatici riječ rezultat kombiniranja specifičnog oblika sa određenim značenjem.

Već smo spomenuli filozofske i psihološke sporove u vezi sa statusom “koncepta” i “ideja” u “umu” (up. §9.1.3). Tradicionalna semantika uzdiže postojanje “koncepta” do principa sve teorijske konstrukcije i stoga (gotovo neizbježno) potiče subjektivnost i introspekciju u istraživanju značenja. Kao što Haas piše, “Empirijska znanost ne može se u potpunosti osloniti na istraživačku metodologiju koja se svodi na to da ljudi zapažaju u svojim umovima, svaki u svom vlastitom umu.” Ova kritika pretpostavlja prihvatanje gledišta da je semantika, ili bi trebala biti, empirijska nauka, gledište za koje je poželjno, koliko god je to moguće, da se ne vezuje za tako kontroverzna filozofska i psihološka pitanja kao što je razlika između "tijela". " i "duh" ili status "koncepta". Mi ćemo se pridržavati ove tačke gledišta kada razmatramo semantiku u ovim poglavljima. Treba, međutim, naglasiti da metodološko odbacivanje „mentalizma“ ne znači i usvajanje „mehanizma“, kako smatraju neki lingvisti. Bloomfieldova "mehanistička" i "pozitivistička" definicija značenja riječi kao potpunog "naučnog" opisa njenog referenta više je štetna za napredak u semantici nego tradicionalna definicija u smislu "koncepta", budući da Bloomfieldova definicija daje prednost relativno mali skup riječi unutar vokabulara prirodnih jezika, riječi koje odgovaraju „stvarima“ koje se u principu mogu opisati pomoću fizičkih nauka. Štoviše, počiva na dvije implicitne i neutemeljene pretpostavke: (i) da je "znanstveni" opis referenci ovih riječi povezan s načinom na koji te riječi koriste govornici datog jezika (većina govornika nema dovoljno pojma o "naučni" opis); (ii) da se značenje svih riječi u konačnici može opisati istim terminima. Istina je da se Bloomfieldov pristup (koji se nalazi i kod drugih autora) može smatrati zavisnim od "realističkog" pogleda na odnos između jezika i "svijeta", gledišta koje se ne razlikuje bitno sa stanovišta mnogih "konceptualisti"; to barem implicira pretpostavku da budući da postoji, na primjer, riječ inteligencija "um, intelekt, mentalni kapacitet", onda postoji i nešto na šta se odnosi (a to "nešto" će se, pretpostavlja se, vremenom na zadovoljavajući način opisati pomoću "nauke"); pošto postoji reč ljubav, onda postoji i nešto što znači riječ se odnosi, itd. Stav koji lingvista mora zauzeti je neutralan u odnosu na "mentalizam" i "mehanizam", to je stav koji je u skladu s oba gledišta, ali ne pretpostavlja ni jedno ni drugo.

9.2.7. "OSTENZIVNA" DEFINICIJA

Implicitno u prethodnom pasusu je još jedna kritika tradicionalne semantike (kao i nekih modernih teorija). Već smo vidjeli da termin “značenje”, u svojoj uobičajenoj upotrebi, sam po sebi ima mnoga “značenja”. Kada nekome postavimo pitanje – „Šta znači ta riječ X? - u svakodnevnom (ne filozofskom ili visokospecijalizovanom) razgovoru dobijamo (i to nas nimalo ne iznenađuje) odgovore koji se razlikuju po formi, u zavisnosti od okolnosti i situacije u kojoj postavljamo ovo pitanje. Ako nas zanima značenje riječi na jeziku koji nije naš, odgovor na naše pitanje najčešće je prijevod. ("Prevod" pokreće razne vrste problema od semantičkog interesa, ali ih za sada nećemo dodirivati; uporedi § 9.4.7.) Za nas je sada mnogo otkrivajuća situacija u kojoj se pitamo o značenju reči u naš vlastiti jezik (ili na drugom jeziku, koji „znamo“, barem „djelimično“, – općenito pojam „ puno znanje jezik" je, naravno, fikcija). Pretpostavimo da želimo znati značenje riječi krava u nevjerovatnoj (ali prikladnoj za naše svrhe) situaciji u kojoj postoji nekoliko krava na susjednoj livadi. Mogli bi nam reći: „Vidiš li one životinje tamo? Ovo su krave." Ovaj način prenošenja značenja riječi krava uključuje element onoga što filozofi nazivaju ostenzivna definicija. (Ostenzivna (vizuelna) definicija je ona koja direktno „ukazuje“ na odgovarajući objekt.) Ali ostenzivna definicija sama po sebi nikada nije dovoljna, jer osoba koja tumači ovu „definiciju“ mora prije svega znati značenje „pokazivanja“ u datom kontekstu (i da zna da je govornikova namjera upravo da da „definiciju“) i, što je još važnije, mora ispravno identificirati predmet na koji se „pominje“. U slučaju našeg hipotetičkog primjera, riječi “te životinje” ograničavaju mogućnost nesporazuma. (Oni ga ne eliminišu u potpunosti; ali pretpostavićemo da je "definicija" značenja krave na zadovoljavajući način interpretirana.) Teorijski značaj ovog previše pojednostavljenog i prilično nerealnog primera je dvostruk: prvo, on pokazuje poteškoću u objašnjavanju znači bilo koju riječ bez upotrebe drugih riječi kako bi se ograničilo i učinilo eksplicitnijim "područje" "indikacije" (to potvrđuje ideju da je vjerovatno nemoguće utvrditi, a možda čak i znati, značenje jedne riječi bez također poznavanje značenja drugih riječi s kojima je „povezana“; na primjer, krava „krava“ je povezana sa životinjskom „životinjom“); drugo, ostenzivna definicija se odnosi samo na relativno mali skup riječi. Zamislite, na primjer, uzaludnost pokušaja da se na ovaj način objasni značenje riječi istinito “tačno, istinito”, lijepo “lijepo, lijepo, veličanstveno” itd.! Značenje takvih riječi obično se objašnjava, iako ne uvijek uspješno, uz pomoć sinonima (čija se značenja pretpostavljaju već poznata osobi koja postavlja pitanje) ili uz pomoć prilično dugih definicija tipa koji se obično daje u rječnicima. I opet, ovdje se jasno očituje neizbježna kružnost semantike: u rječniku ne postoji nijedna tačka koja se može uzeti kao polazište i iz koje se može izvesti smisao svega ostalog. Ovaj problem "kružnosti" će biti razmatran u nastavku (up. §9.4.7).

9.2.8. KONTEKST

Još jedna karakteristika svakodnevnih situacija u kojima se nalazimo da se pitamo o značenju riječi je da nam se često kaže: „Zavisi od konteksta“. („Daj mi kontekst u kojem si naišao na ovu riječ, pa ću ti reći njeno značenje.”) Često je nemoguće odrediti značenje riječi bez „stavljanja u kontekst”; a korisnost rečnika direktno zavisi od broja i raznovrsnosti „konteksta“ koji su u njima dati za reči. Često (a to je možda i najčešći slučaj) značenje riječi se objašnjava na sljedeći način: daje se "sinonim" koji ukazuje na "kontekstualna" ograničenja koja regulišu upotrebu dotične riječi (dodatno: "pokvareno (od jaja )"; užeglo: "pokvareno (od putera)" itd.). Činjenice kao što su raznovrsnost načina na koje utvrđujemo značenje riječi u praksi, kružnost vokabulara i suštinska uloga „konteksta“ ne dobijaju puno teorijsko priznanje u tradicionalnoj semantici.

9.2.9. "ZNAČENJE" I "UPOTREBA"

Ovdje možemo spomenuti poznatu i vrlo popularnu Vitgenštajnovu parolu: “Ne tražite značenje riječi, tražite njenu upotrebu.” Termin "upotreba" sam po sebi nije jasniji od pojma "značenje"; ali zamjenom jednog termina drugim, semantičar napušta tradicionalnu tendenciju da definira “značenje” u terminima “značenja”. Vitgenštajnovi sopstveni primeri (u njegovom kasnijem radu) pokazuju da je on verovao da su „upotrebe“ u kojima se reči pojavljuju u jeziku veoma različite prirode. On nije izneo (i nije izjavio da namerava da iznese) teoriju „upotrebe“ reči kao teoriju semantike. Ali možda imamo pravo da izvučemo sledeće principe iz Vitgenštajnove programske izjave. Jedini testni kriterijum primenljiv na istraživanje jezika je „upotreba“ jezičkih iskaza u različitim situacijama Svakodnevni život. Izrazi kao što su "značenje riječi" i "značenje rečenice (ili prijedloga)" prepuni su opasnosti da nas dovedu u zabludu jer nas navode da tražimo "značenja" koja imaju i da identifikujemo njihova "značenja". ” sa entitetima kao što su fizički objekti, “koncepti” dati “umu” ili “stanja stvari” u fizičkom svijetu.

Nemamo direktne dokaze o razumijevanju iskaza, već imamo podatke o njihovom nesporazum(nesporazum) - kada se nešto „povredi“ u procesu komunikacije. Ako, na primjer, kažemo nekome da mi donese crvenu knjigu koja je na stolu gore, a on nam donese knjigu druge boje, ili kutiju umjesto knjige, ili siđe dole da traži knjigu, ili nešto potpuno neočekivano, onda sasvim razumno možemo reći da je on “pogrešno shvatio” cijelu ili dio naše izjave (naravno, moguća su i druga objašnjenja). Ako uradi ono što se od njega očekuje (ide u pravom smjeru i vrati se s pravom knjigom), onda možemo reći da je ispravno shvatio izjavu. Želimo da naglasimo da (u ovakvom slučaju) postoje prima facie „bihevioralne“ činjenice da nije došlo do nesporazuma. Sasvim je moguće da bi, ako bismo nastavili da vrlo uporno testiramo njegovo "razumijevanje" riječi donijeti, ili crveno, ili knjiga, došlo do trenutka kada bi nešto što je učinio ili rekao otkrilo, da je njegovo "razumijevanje" ovih riječi nešto drugačije od našeg, da iz iskaza koji sadrže ove riječi izvodi zaključke koje mi ne izvodimo (ili, obrnuto, da mi izvodimo zaključke koje on ne izvodi), ili da ih koristi za označavanje nešto drugačije klase predmeta ili akcije. Normalna komunikacija zasniva se na pretpostavci da svi „razumijemo“ riječi na isti način; ova pretpostavka se s vremena na vrijeme prekrši, ali ako se to ne dogodi, činjenica „razumijevanja“ se uzima zdravo za gotovo. Da li imamo ili nemamo iste "koncepte" u našim "umovima" kada razgovaramo jedni s drugima je pitanje na koje se ne može odgovoriti osim u smislu "upotrebe" riječi u iskazima. Tvrdnja da svi istu riječ "razumeju" malo drugačije je vjerovatno tačna, ali prilično besmislena. Semantika se bavi objašnjavanjem stepena uniformnosti u „upotrebi“ jezika koja omogućava normalnu komunikaciju. Jednom kada napustimo gledište da je "značenje" riječi ono što ona "označava", sasvim prirodno prepoznajemo da se moraju uspostaviti određeni odnosi različitih vrsta kako bi se objasnila "upotreba". Dva „faktora“ koja se moraju razlikovati su referenca(o čemu smo već govorili gore) i značenje(smisao).

9.2.10. NEDETERMINISTIČKA VRIJEDNOST

Dakle, predlažemo da se napusti gledište da je „značenje“ reči ono što ona „znači“, a u procesu komunikacije ovo „označeno“ „prenosi“ (u nekom smislu) govornik slušaocu; prilično smo spremni da se složimo da određenost (izvjesnost) značenja riječi nije ni potrebna ni poželjna. Kao što smo videli, upotreba jezika u normalnim situacijama može se objasniti na osnovu mnogo slabije pretpostavke, naime, da među govornicima datog jezika postoji saglasnost o „upotrebi“ reči (na šta se odnose, na šta impliciraju, itd.), što je dovoljno da razjasni „nesporazum“. Ovaj zaključak se mora imati na umu u svakoj analizi “značenja” riječi i rečenica. Uzećemo ovo zdravo za gotovo u narednim odeljcima ova dva poglavlja o semantici.

Potrebno je naglasiti još dvije stvari o društveno propisanim iskazima kao što su Kako ste? "Zdravo!". Obično imaju karakter “gotovih” formacija, odnosno uče ih izvorni govornici kao neanalizirane cjeline i, sasvim očito, ne konstruiraju se iznova u svakom slučaju kada se koriste u okolnostima koje, slijedeći Furs, mi može nazvati „tipične ponavljajuće događaje u lancu društveni proces" Budući da su takve prirode, bilo bi ih moguće objasniti u okviru “biheviorističkog” koncepta: dotični iskazi bi se mogli opisati kao “uslovljeni odgovori” na situacije u kojima se javljaju. Ovu činjenicu semantičar ne bi trebao zanemariti. Velik dio naše svakodnevne upotrebe jezika može se adekvatno opisati 'bihejviorističkim' terminima i može uključivati ​​'igranje' određenih 'uloga' u izvođenju društveno propisanih, 'ritualnih' obrazaca ponašanja. Kada se posmatra sa stanovišta ovog aspekta upotrebe jezika, ljudske individue pokazuju ponašanje slično onom mnogih životinja, čiji se "komunikacijski sistemi" sastoje od raznih "spremnih iskaza" koji se koriste u specifičnim situacijama. Tipičniji ljudski aspekti jezičkog ponašanja, koji zavise od generativnih svojstava jezika, kao i od semantičkih koncepata značenja, reference i smisla, ne mogu se uvjerljivo objasniti proširenjem "biheviorističkih" koncepata "stimulusa" i "odgovor" na njih. Međutim, istina je da ljudski jezik uključuje i “bihevioralnu” komponentu. Iako o tome nećemo više govoriti u nastavku, teoretski tu istinu moramo priznati ovdje.

9.3.7. "FATIČNO ZAJEDNOST"

S tim u vezi, potrebno je spomenuti i aspekt jezičkog ponašanja na koji je B. Malinovsky primijenio termin „fatička komunikacija“. Skrenuo je pažnju na činjenicu da se mnogim našim iskazima pogrešno pripisuje kao jedina ili primarna funkcija prenošenje ili traženje informacija, davanje naredbi, izražavanje nada, potreba i želja, ili čak „manifestiranje emocija” (u nejasnom smislu u kojem semantika često koriste ovaj posljednji izraz); zapravo služe uspostavljanju i održavanju osjećaja društvene solidarnosti i društvenog samoodržanja. Mnoge „gotove“ izjave poput Kako ste? “Halo!”, društveno propisano u određenim kontekstima, može obavljati upravo tu funkciju “fatične komunikacije”. Međutim, postoje mnogi drugi iskazi koje govornici više-manje slobodno konstruiraju, ali u isto vrijeme prenose informacije i služe u svrhu “fatičke komunikacije”. Primjer bi bila fraza Još je jedan lijep dan, izgovorena (pretpostavkom) kao prva fraza u razgovoru kupca i trgovca.Jasno je da glavna funkcija ove izjave nije da „prenese“ trgovcu ono što - informacije o vremenu; ovo je jasan primjer "fatične" komunikacije." U isto vrijeme, ovaj izraz još uvijek ima značenje koje se razlikuje od značenja bezbrojnih drugih iskaza koji se mogu naći u ovom kontekstu i također bi mogli služe svrsi "fatičke" komunikacije"; a sljedeći "korak" u razgovoru se obično odnosi na ovaj konkretan iskaz na osnovu njegovog značenja. Stoga moramo razlikovati onaj aspekt "upotrebe" iskaza koji može se pripisati implementaciji "fatičke komunikacije" i onog dijela, koji se mora izolirati kao njihovo značenje (ako imaju značenje prema našoj definiciji), ali prepoznajemo da čak i kada iskaz ima oba ova aspekta, dominantan dio "upotreba" iskaza može biti ili prvi ili drugi aspekt. Malinovsky je očito pretjerao kada je tvrdio da je prijenos informacija jedna od „najperifernijih i visokospecijaliziranih funkcija“ jezika.

9.3.8. PROŠIRENJE KONCEPTA “IMATI ZNAČENJE” NA SVE JEZIČKE JEDINICE

Do sada smo ilustrovali koncept postojanja značenja samo u odnosu na čitave iskaze, koji se smatraju nerazložljivim jedinicama. Sada ćemo nastaviti da razmatramo iskaze radije nego rečenice i nastavićemo da se pozivamo na intuitivni koncept „konteksta“; ali sada ćemo generalizirati koncept posjedovanja značenja u smislu sljedećeg principa: svaki jezički element koji se pojavljuje u iskazu ima značenje osim ako nije potpuno određen („obavezan“) u datom kontekstu.

Jasno je da se koncept posedovanja značenja (kako je ovde definisan) primenjuje na svim nivoima analize iskaza, uključujući i fonološki nivo. Na primjer, postoji mnogo konteksta u kojima bi se riječi jagnje "jagnje" i ovan "ovan" mogle koristiti s jednakim uspjehom, a odgovarajući izrazi mogu se razlikovati samo u ovim riječima. Budući da se ovi iskazi očigledno razlikuju po značenju (referenti riječi janje i ovan su različiti i, općenito govoreći, implikacije „sadržane“ u odgovarajućim iskazima su različite), onda fonemi /l/ i /r/ ne samo da imaju značenje, ali imaju i različita značenja u ovim izjavama. Postoje i drugi iskazi koji sadrže riječi osim jagnje i ovan, u kojima se razlika u značenju može izraziti isključivo fonološkom opozicijom /l/ - /r/. Kao što smo videli u jednom od prethodnih poglavlja (uporedi § 3.1.3), fonološka struktura specifičnih jezika u krajnjoj liniji počiva na sposobnosti diferencijacije fonema (tačnije, na sposobnosti razlikovanja njihovih „različitih karakteristika“), ograničen određenim granicama koje nameće dodatni princip fonetske sličnosti. Postoje, dakle, dobri razlozi za primjenu koncepta smisla čak i na nivou fonološke analize. Vrijedi napomenuti, međutim, da u slučaju fonetski različitih, ali „sličnih“ glasova, postojanje značenja nužno podrazumijeva drugačije značenje, barem u nekim kontekstima. Na „najvišim“ nivoima to nije slučaj. Kada govorimo o jezicima u kojima se pojavljuju glasovi [l] i [r], ali nikada ne razlikuju iskaze, kažemo da su u tim jezicima ovi glasovi u odnosu dodatne distribucije ili slobodne varijacije (drugim riječima, da su alternativne fonetske realizacije iste fonološke jedinice; up. § 3.3.4). U kontekstima u kojima glasovi govora, inače različiti kao zasebne fonološke jedinice, imaju isto značenje, sasvim razumno se mogu okarakterizirati kao sinonimni. Primjeri su početni samoglasnici u alternativnom izgovoru riječi ekonomija (suprotan slučaj je diferencijalni kvalitet istih samoglasnika u beat /bi:t/ : bet /bet/, itd.) ili naglasni obrasci kontroverze: kontroverza.

Iako bi semantičar teorijski trebao prepoznati princip da se posjedovanje značenja odnosi na fonološki nivo, u svom praktičnom radu on se obično ne bavi značenjem fonoloških jedinica. Razlog je u tome što fonološke jedinice nikada nemaju subjektivnu korelaciju i ne ulaze ni u kakve semantičke odnose, osim u odnose istosti i razlike značenja. Štaviše, odnos istovetnosti značenja, kada se javlja između fonoloških jedinica (fonološka "sinonimija", kao što je gore ilustrovano), sporadičan je i nesistematičan. Mora se opisati u smislu alternativnih pravila implementacije za određene riječi; kada se ova pravila steknu, ništa više nije potrebno. Uopšteno govoreći (posebno se mora spomenuti slučaj „zvučnog simbolizma“ – semantički zanimljivog fenomena koji ovdje nećemo razmatrati zbog ograničenih mogućnosti; up. § 1.2.2), „značenje“ date fonološke jedinice je jednostavno njegova razlikovnost od svih drugih fonoloških jedinica (ako ih ima) koje se mogu pojaviti u istom kontekstu.

9.3.9. OGRANIČENI KONTEKSTI

Sada se možemo obratiti na razliku između iskaza i rečenica (up. §5.1.2). Dvije stvari treba imati na umu. Prvo. Kada koristimo jezik da komuniciramo jedni s drugima, ne proizvodimo rečenice, već iskaze; takvi iskazi se proizvode u specifičnim kontekstima i ne mogu se razumjeti (čak i unutar granica postavljenih gore za tumačenje pojma „razumijevanje“; uporedi § 9.2.9) bez poznavanja relevantnih kontekstualnih karakteristika. Štaviše, tokom razgovora (pretpostavimo da se radi o razgovoru), kontekst se stalno razvija, u smislu da „upija“ iz rečenog i onoga što se dešava sve što je relevantno za produkciju i razumijevanje narednih iskaza. Ekstremni slučaj konteksta koji nisu "razvijeni" u ovom smislu bili bi oni u kojima se učesnici u razgovoru ne oslanjaju na prethodno znanje jedni o drugima, niti na "informacije" sadržane u prethodno izgovorenim izjavama, već u kojima više koriste opšta mišljenja, običaje i pretpostavke koje prevladavaju u datoj specifičnoj „sferi rasuđivanja“ i u datom društvu. Takvi konteksti - mi ćemo ih nazvati ograničeni konteksti(ograničeni konteksti) - relativno retko, jer razumevanje većine izjava zavisi od informacija sadržanih u prethodnim izjavama. Ne smijemo izgubiti iz vida odnose između iskaza i konkretnih konteksta.

Druga stvar je sljedeća: budući da rečenice nikada ne proizvode govornici (na kraju krajeva, rečenice su teorijske jedinice koje su uspostavili lingvisti u svrhu opisivanja distribucijskih ograničenja na pojavu klasa gramatičkih elemenata), ne može postojati direktan odnos između rečenica i konkretni konteksti. Istovremeno, iskazi imaju gramatičku strukturu koja zavisi od njihovog „zaključivanja“ iz rečenica, a gramatička struktura iskaza je ili može biti semantički relevantna. Ovo je posebno jasno u slučaju sintaksičke „dvosmislenosti“ (up. § 6.1.3). Štaviše (sa izuzetkom takvih „gotovih“ izraza kao što je Kako radiš? „Zdravo!“), izgovore proizvode govornici i slušaoci ih razumiju na osnovu pravilnosti u konstrukciji i u transformacijama koje su za rečenice određene pravilima gramatike. Trenutno, ni lingvistika ni bilo koja od drugih nauka koje se bave proučavanjem "mehanizama" koji su u osnovi proizvodnje iskaza nisu u stanju da daju bilo kakve definitivne izjave o tome kako znanje o apstraktnim odnosima koji postoje između gramatičkih elemenata u rečenicama stupaju u interakciju sa različitim svojstva konteksta, što rezultira formiranjem i razumijevanjem iskaza u kojima se nalaze “korelati” ovih gramatičkih elemenata. Sama činjenica da postoji određena interakcija između gramatičke strukture jezika i relevantnih kontekstualnih karakteristika čini se nepobitnom i tu činjenicu moramo uzeti u obzir.

Budući da, generalno, ne možemo identifikovati ni one stvarne elemente koje govornik „odabira” u procesu formiranja iskaza, ni sve relevantne karakteristike konkretnih konteksta, možemo prihvatiti kao metodološku odluku princip koji lingvisti obično slede u praksi, i, naime, razmotriti semantičke odnose između iskaza u smislu semantičkih odnosa koji se održavaju između rečenica, na osnovu kojih se često smatra da su iskazi „stvoreni“ kada ih proizvedu izvorni govornici u ograničenim kontekstima. (Koncept "ograničenog konteksta" još uvijek se mora zadržati, jer, kao što ćemo vidjeti u nastavku, nemoguće je formulirati semantičke odnose koji postoje između rečenica bez, barem u maloj mjeri, uzimanja u obzir "kontekstualizacije"; up. § 10.1.2.) Svojstva određenog konteksta će se tada pozivati ​​(u obliku koji se, barem za sada, može okarakterisati kao ad hoc opis) kako bi se objasnili „rezidualni“ semantički relevantni aspekti iskaza. Ono što smo ovdje predstavili kao svjesnu, metodološku odluku, međutim, ne treba uzeti kao da želimo naglasiti primat gramatičkog nad kontekstualnim u psihološkim procesima proizvodnje i razumijevanja iskaza.

9.3.10. ELEMENTI DUBOKE STRUKTURE IMAJU ZNAČENJE U REČENICAMA

Sada možemo primijeniti koncept “imanja značenja” na gramatičke elemente iz kojih se generišu rečenice pomoću pravila koja određuju konstrukciju i transformaciju njihovih osnova (up. § 6.6.1). Budući da posjedovanje značenja uključuje “biranje”, slijedi da nikakvi elementi koji se unose u rečenice pomoću obaveznih pravila ne mogu imati značenje u našem smislu. (Dummy elementi kao što je do (pomoćni glagol) u Da li želite da idete? nemaju značenje; up. § 7.6.3.) Štaviše, ako pretpostavimo da se svi "izbori" sprovode u odnosu na izbor elemenata u "dubokoj" strukturi (ovi elementi su ili "kategorije" ili "obilježja"; up. § 7.6.9), tada će postati jasno da koncept posjedovanja značenja nije vezan za jedinice bilo kojeg određenog ranga. Prvo, razlika u jeziku takvih jedinica kao što su morfemi, riječi i grupe riječi (fraze) se u određenoj mjeri zasniva na „površinskoj“ strukturi (§ 6.6.1); i, drugo, postoje mnoge „gramatičke kategorije“ (vreme, raspoloženje, aspekt, rod, broj, itd.; uporedi § 7.1.5), koje se mogu, ali ne moraju realizovati u morfemima ili rečima, ali koje čine sisteme “izbora” u prijedlozima. Pitanje da li se može ili ne može napraviti striktna razlika između "leksičkog" i "gramatičkog" značenja, uzimajući u obzir tačno koje značenje elementi imaju, biće razmotreno u nastavku (up. § 9.5.2). Ovdje je dovoljno napomenuti da se koncept posedovanja značenja podjednako primenjuje na elemente oba tipa u „dubokoj“ strukturi rečenica. Štaviše, ovaj koncept se uzima u obzir, eksplicitno ili implicitno, u svim novijim lingvističkim teorijama. Klase elemenata (označene ili pomoćnim ili terminalnim simbolima - up. § 6.2.2) se uspostavljaju na svakoj tački "izbora" u procesu generisanja rečenica.

Iz rečenog proizilazi da nijedan element u rečenici nema značenje osim ako nije član jedne od sintaktički specificiranih klasa u "dubokoj" strukturi rečenice: i upravo ta činjenica opravdava pretpostavku, gotovo univerzalno izrečenu od strane lingvista, logičara i filozofa, da je skup elemenata, koji imaju značenje u nekom specifičnom jeziku, barem u vrlo visokoj mjeri, srazmjeran skupovima terminalnih “komponenti” i “osobina” ovog jezika. Međutim, iz ovoga ne proizlazi da će svaka “komponenta” i svaka “osobina” imati značenje u svakoj rečenici u kojoj se pojavljuju. Ovu važnu tačku lingvisti ponekad zanemaruju i stoga zaslužuje nešto detaljnije razmatranje.

Cijeli problem se svodi na razliku između gramatičke i semantičke prihvatljivosti. Kao što smo videli u jednom od prethodnih poglavlja (up. § 4.2.12 i dalje), gramatičnost je onaj aspekt prihvatljivosti iskaza koji se može objasniti u smislu pravila konstrukcije i transformacije koja određuju dozvoljene kombinacije distributivnih klasa elemenata ("kategorija" i "znakova") u rečenicama. Općenito se vjeruje da gramatika bilo kojeg jezika proizvodi, posebno, beskonačan broj rečenica koje su neprihvatljive u različitim aspektima; i postalo je tradicionalno opisati barem jednu vrstu neprihvatljivosti karakterizirajući dotične prijedloge kao „besmislene” ili „bez sadržaja”. Neka sljedeće rečenice budu generirane engleskom gramatikom (i stoga budu gramatički ispravne):

(a) Jovan pije mlijeko (pivo, vino, vodu, itd.) "Jovan pije mlijeko (pivo, vino, vodu, itd.)"

(b) Jovan jede sir (ribu, meso, hleb, itd.) "Jovan jede sir (ribu, meso, hleb, itd.)"

(c) Jovan pije sir (ribu, meso, hleb, itd.) "Jovan pije sir (ribu, meso, hleb, itd.)"

(d) Jovan jede mleko (pivo, vino, vodu, itd.) "Jovan jede mleko (pivo, vino, vodu, itd.)"

Pretpostavimo dalje da su sve ove rečenice, kada su generisane, snabdevene istim strukturnim opisom: da glagoli piju i jedu, kao i imenice mleko, pivo, vino, voda "voda", sir "sir", riba" riba", meso "meso", hljeb "hljeb" itd. ne razlikuju se u leksikonu nikakvim relevantnim sintaksičkim osobinama. Očigledno je da su, s obzirom na određeno razumijevanje pojmova “prihvatljivo” i “neprihvatljivo”, prihvatljive izjave izvedene iz rečenica grupiranih u klase (a) i (b), dok su izjave izvedene iz rečenica u grupama (c) i (d) ) su neprihvatljivi (pod „prirodnim“ okolnostima). Da li ovu vrstu prihvatljivosti i neprihvatljivosti opisujemo na osnovu kriterijuma „smislenosti“ (u smislu ovog pojma koji predlažemo da istaknemo kroz termin „značaj“) – ovo pitanje ćemo razmotriti u nastavku. Ovdje želimo naglasiti da su skupovi elemenata koji se mogu pojaviti i koji imaju glagolsko i objektno značenje u ovim rečenicama vrlo ograničeni podskupovi onih skupova elemenata čije je pojavljivanje dozvoljeno pravilima gramatike. Opet, ovdje je ekstremni slučaj kada je pojavljivanje elementa u potpunosti određeno kontekstom drugih elemenata u rečenici. Primjer potpune predodređenosti na ovom nivou je pojava riječi zubi u Ugrizao sam ga svojim umjetnim zubima. Kao što ćemo vidjeti u nastavku (up. § 9.5.3), ova rečenica otkriva zanimljiv tip sintagmatske "pretpostavke" sa semantičke tačke gledišta, koja je obično skrivena, ali koja se može eksplicitno predstaviti kada se pojavi njen "sintaktički odraz". u rečenici " u obliku "definicije" (u ovom primjeru - lažno "umetnuto"). Da se riječ zubi nikada nije pojavila u rečenicama osim u onima u kojima je u potpunosti određena svojim kontekstom, ne bi imala značenje u engleskom jeziku, a semantičar ne bi imao ništa o tome reći.

Svrha naše diskusije je bila da pokažemo kako se tačno koncept postojanja značenja može i treba preneti sa nivoa prilično „konkretnih“ slučajeva kada se radi, s jedne strane, o gramatički ispravnim, nestrukturiranim celim iskazima, a sa druge strane. , iskazi , koji se minimalno razlikuju po svojoj fonološkoj strukturi, na "apstraktniji" nivo na kojem se primjenjuje na važniju i mnogo veću klasu rečenica generiranih pravilima gramatike. Pojam postojanja značenja podržan je činjenicom da odražava intuitivni princip da „značenje implicira izbor“ u određenim kontekstima. Njegovo prenošenje na „apstraktniji“ nivo zasniva se na metodološkoj odluci, čija motivacija ima dva aspekta: prvo, ova odluka prepoznaje činjenicu da se specifične kontekstualne karakteristike koje utiču na proizvodnju i interpretaciju iskaza mogu opisati samo ad hoc; i drugo, ovaj pristup na zadovoljavajući način povezuje semantičku interpretaciju rečenica s njihovim sintaksičkim opisom. Ako se ustanovi da neki određeni element ima značenje unutar određene klase rečenica, onda se možemo pitati koje značenje ima taj element; a na ovo pitanje se može odgovoriti na različite načine, kao što ćemo vidjeti u sljedećem odjeljku.

9.3.11. "ZNAČAJ"

Sada se moramo ukratko zadržati na konceptu „značaja“ (up. §9.3.1). Na prvi pogled, sasvim je opravdano željeti identificirati značaj s potpunom prihvatljivošću u odnosu na specifične kontekste u slučaju iskaza iu odnosu na opštije ograničene kontekste u slučaju rečenica. Ali već smo vidjeli da postoje mnogi slojevi prihvatljivosti (koji se nalaze "iznad" gramatičkog sloja) koji se, iako se često bez kvalifikacije opisuju kao "semantički", ipak mogu razlikovati od onoga što se tradicionalno naziva "sadržaj" ili "značaj"". (up. § 4.2.3). Neke izjave mogu biti osuđene kao „blasfemične” ili „nepristojne”; drugi se mogu smatrati prihvatljivim u određenim upotrebama jezika (molitve, mitovi, bajke, naučna fantastika, itd.), ali su neprihvatljivi u svakodnevnom razgovoru. Teško je preporučljivo pokušati definiciju „značajnosti“ koja bi obuhvatila sve te različite „dimenzije“ prihvatljivosti. Uzmimo primjer iz engleskog: iako se glagol die slobodno koristi u sprezi sa živim imenicama, uključujući imena osoba, na engleskom postoji opšteprihvaćeni tabu protiv njegove upotrebe u sprezi sa mojim ocem, mojom majkom. ", moj brat." moj brat" i moja sestra "moja sestra" (odnosno u odnosu na članove uže porodice govornika); Dakle, moj otac umro sinoć bi se smatrao neprihvatljivim, ali ne i Njegov otac umro sinoć. Zatim, očito, ispravno objašnjenje neprihvatljivosti rečenice Moj otac je umro sinoć mora biti takvo da možemo reći, prvo, da je „smislena“, jer će, ako se koristi suprotno tabuu, biti shvaćena (zaista moglo bi se tvrditi da sam tabu zavisi od mogućnosti razumijevanja ove rečenice), i, drugo, da je semantička relacija između Moj otac je sinoć umro i Njegov otac je umro sinoć identična odnosu između Moj otac je sinoć umro i Njegov otac sinoć je došao "Sinoć je došao njegov otac" itd. Tradicionalno, značaj gramatički ispravnih rečenica objašnjava se u smislu određenih opštih principa kompatibilnosti "značenja" njihovih sastavnih elemenata. Moglo bi se, na primjer, reći da su rečenice Ivan jede mlijeko i Ivan pije kruh besmislene jer je glagol jesti kompatibilan samo s imenicama (u objektnoj funkciji) koje označavaju čvrste tvari, tvari pogodne za konzumaciju, a glagol piti “piti” - s imenicama koje označavaju tekuće tvari pogodne za konzumaciju. (Imajte na umu da se, sa ove tačke gledišta, rečenica Džon jede supu može smatrati semantički anomalnom, koja ima "društvenu prihvatljivost" samo na osnovu posebne konvencije van opštih pravila tumačenja engleskih rečenica.) Postoje velike implikacije. povezane s konceptom značaja, teškoće (mogli bismo tvrditi, na primjer, da je Ivan jede mlijeko "smislena" rečenica, iako su okolnosti u kojima bi se mogla koristiti pomalo neobične). Ipak, tradicionalna eksplikacija ovog koncepta u smislu „kompatibilnosti“ izgleda uglavnom razumna. Razmotrićemo neke od najnovijih formulacija ovog koncepta u sledećem poglavlju (up. § 10.5.4).

9.4.1. REFERENCE

Termin „referenca“ („korelacija“) je ranije uveden za odnos koji se odvija između reči, s jedne strane, i stvari, događaja, radnji i kvaliteta koje one „zamjenjuju“, s druge strane (up. §9.2 .2). Gore je naznačeno da se pod određenim uslovima postavlja pitanje „Šta je značenje riječi X? može se odgovoriti korištenjem "ostenzivne" definicije - pokazivanjem ili na drugi način direktnim ukazivanjem referent(ili referenti) date reči (up. § 9.2.7). Postoje dobro poznate filozofske poteškoće povezane s preciznom definicijom pojma „referenca“, koje ovdje ne treba razmatrati. Pretpostavimo da se relacija reference (koja se ponekad naziva “denotacija”) nužno mora uzeti u obzir prilikom izgradnje bilo koje zadovoljavajuće teorije semantike; drugim riječima, u određenom smislu možemo reći da se barem neke jedinice vokabulara u svim jezicima mogu staviti u korespondenciju s određenim „svojstvima“ fizičkog svijeta.

Pretpostavka koju smo postavili ne znači da referencu smatramo semantičkom relacijom na koju se svi drugi odnosi mogu svesti; Niti to znači da sve vokabularne jedinice jezika imaju referencu. “Referenca”, kako se razumije u ovom radu, nužno je povezana s osnovnim pretpostavkama o “postojanju” (ili “stvarnosti”) koje su izvedene iz naše direktne percepcije objekata u fizičkom svijetu. Kada kažemo da se određena riječ (ili druga jedinica značenja) „odnosi na neki predmet“, mislimo da je referenca riječi predmet koji „postoji“ (je „stvaran“) u istom smislu u kojem kažemo da konkretni ljudi, životinje i stvari „postoje“; takođe implicira da se u principu može dati opis fizičkih svojstava predmetnog objekta. Ovaj koncept "fizičkog postojanja" može se smatrati fundamentalnim za definiciju semantičkog odnosa reference. Primjena pojmova "egzistencija" i "referenca" se tada može proširiti na nekoliko načina. Na primjer, iako ne postoje takvi objekti kao što su kolačići, jednorozi ili kentauri (takva će biti naša pretpostavka), bilo bi sasvim razumno pripisati im fiktivno ili mitsko „postojanje“ u rasuđivanju određene vrste; i tako možemo reći da riječi goblin, jednorog ili kentaur imaju referencu na engleskom (unutar relevantnog obrazloženja). Slično tome, možemo proširiti upotrebu pojmova "egzistencija" i "referenca" na takve teorijske konstrukcije nauke kao što su atomi, geni, itd., pa čak i potpuno apstraktni objekti. Važno je, međutim, napomenuti da se izvor ovih "analognih" proširenja pojmova "egzistencije" i "reference" može pronaći u njihovoj temeljnoj ili primarnoj primjeni na fizičke objekte u toku "svakodnevne" upotrebe jezika. .

Iz ovog tumačenja koncepta reference slijedi da u rječniku jezika može postojati mnogo jedinica koje nisu povezane referencom ni sa jednim entitetom izvan jezika. Na primjer, moglo bi se pomisliti da ne postoje stvari poput inteligencije ili ljubaznosti s kojima se povezuju riječi inteligentan i dobar, iako psiholog ili filozof uvijek može pretpostaviti postojanje takvih entiteta u okviru neke određene teorije psihologije ili etike, pa čak može i tvrditi da se njihova “stvarnost” može demonstrirati nekom vrstom “ostenzivne” definicije. Činjenica da na različitim nivoima ovakvih sofističkih konstrukcija mogu nastati nesuglasice između njihovih autora u pogledu „stvarnosti“ određenih imaginarnih „objekata“ ne mijenja se. opšti položaj ta referenca pretpostavlja postojanje. Bilo bi uzaludno insistirati da sve leksičke jedinice moraju nešto koreliraju, ako se ima u vidu da je u pojedinim slučajevima nemoguće iznijeti bilo koji drugi dokaz postojanja tog „nečega“ osim same činjenice prisutnosti neke leksičke jedinice „korelirane“ s tim „nečim“.

U vezi sa konceptom reference mogu se uočiti još dvije tačke. Iako se slažemo da se određene leksičke jedinice odnose na objekte i svojstva objekata izvan jezika, nismo dužni logički zaključiti da svi objekti označeni određenom riječi čine "prirodnu klasu" (bez obzira na "konvenciju"), prešutno prihvaćenu od strane članova datog govornog kolektiva kako bi ove objekte podveli „pod“ neki opšti pojam); drugim riječima, gore opisana pozicija kompatibilna je ili s “nominalizmom” ili “realizmom” u filozofskoj semantici. Drugo, referenca na leksičku jedinicu ne mora biti precizna i potpuno definirana u smislu da je uvijek jasno da li određeni objekt ili svojstvo spada ili ne spada u opseg date leksičke jedinice: to smo već vidjeli takva pretpostavka nije neophodna da bi se objasnilo “razumijevanje” iskaza u procesu normalne komunikacije (up. § 9.2.9). Često su “referentne granice” leksičkih jedinica nesigurne. Na primjer, nemoguće je naznačiti potpuno određenu tačku na kojoj moramo povući liniju razdvajanja između referenci riječi brdo i planina, kokoš, piletina; mladi pijetao; kokoš; pileće meso i kokoš. , zeleno „zeleno“ i blue „plavo; plavo, azurno; plavkasto“ itd. Ali to ne znači da koncept reference nije primjenjiv na takve riječi. Karakteristična karakteristika jezika je to što nameću određenu leksičku “kategorizaciju” stvarnom svijetu i, takoreći, povlače “proizvoljne” granice na raznim mjestima. Kao što ćemo vidjeti, to je jedan od razloga zašto je često nemoguće uspostaviti leksičke ekvivalentnosti između različitih jezika. Činjenica da su “referentne granice” “proizvoljne” i neodređene obično ne dovodi do sloma u međusobnom razumijevanju, jer je “tačno” podvođenje objekta “pod” jednu ili drugu leksičku jedinicu vrlo rijetko relevantno; a kada se pokaže relevantnim, okrećemo se drugim sistemima identifikacije ili specifikacije. Na primjer, ako želimo da označimo jednu od dvije osobe, od kojih bi se svaka mogla nazvati riječju djevojka ili riječju žena, možemo ih razlikovati jednu od druge po imenu, po relativnoj starosti, po boji kose, po načinu na koji su obučeni, itd. Iako se referenti riječi djevojka „preklapaju” s referentima riječi žena, te dvije riječi nisu sinonimi; njihov relativni položaj na starosnoj skali je fiksiran, a postoji mnogo slučajeva u kojima je samo jedna od njih prikladna reč za upotrebu. „Netačnost“ reference koju smo ilustrovali, daleko od toga da je nedostatak jezika (kako neki filozofi misle), čini jezik efikasnijim sredstvom komunikacije. Apsolutna "preciznost" je nedostižna, budući da nema ograničenja u broju i prirodi razlika koje se mogu napraviti između različitih objekata; i jedva da postoji ikakva zasluga u nasilnom pravljenju više razlika nego što je potrebno za sadašnje svrhe.

9.4.2. SENSE

Sada moramo uvesti koncept "značenja". Ispod značenje reč se odnosi na svoje mesto u sistemu odnosa u koje ulazi sa drugim rečima u rečniku jezika. Jasno je da, budući da značenje mora biti definirano u smislu odnosa koji se odvijaju između jedinica vokabulara, ono ne nosi sa sobom nikakve temeljne pretpostavke o postojanju objekata ili svojstava izvan rječnika dotičnog jezika.

Ako se dva elementa mogu pojaviti u istom kontekstu, onda oni imaju značenje u ovom kontekstu; i dalje, možemo se zapitati da li Koje je značenje oni imaju. Kao što smo vidjeli, jedan dio ili komponenta značenja određenih elemenata može se opisati u smislu njihove reference. Bez obzira imaju li dva elementa referencu ili ne, možemo se zapitati da li oni, u kontekstu ili kontekstima u kojima se oba pojavljuju, imaju isto značenje ili ne. Pošto je ista vrijednost sinonimija- postoji odnos koji se odvija između dvije (ili više) jedinica vokabulara; povezan je sa značenjem, a ne sa referencom. Iz razloga koje ovdje ne moramo razmatrati, ponekad bi moglo biti zgodno reći da dvije jedinice imaju istu referencu, ali se razlikuju po značenju; i, naravno, prirodno je reći da jedinice mogu biti sinonimi čak i ako im nedostaje referenca. Može se pretpostaviti da je (za jedinice sa referencom) identitet reference neophodan, ali ne i dovoljan uslov za sinonimiju.

Teorijska razmatranja sinonimije često su neadekvatna zbog dvije neopravdane pretpostavke. Prvi od njih je da dva elementa ne mogu biti "savršeno sinonimna" u jednom kontekstu osim ako nisu sinonimna u svim kontekstima. Ovaj zaključak se ponekad opravdava upućivanjem na razliku između "konceptualnog" i "emocionalnog" značenja. Ali sama ova razlika treba opravdanje. Ne može se poreći da je izbor određenog govornika jedne jedinice umjesto druge određen „emocionalnim asocijacijama“. Međutim, to ne znači da su “emocionalne asocijacije” uvijek relevantne (čak i ako su zajedničke svim članovima govorne zajednice). I ne može se jednostavno smatrati premisom tvrdnja da riječi uvijek nose “asocijacije” koje se izvode iz njihove upotrebe u drugim kontekstima. Stoga ćemo odbaciti pretpostavku da riječi ne mogu biti sinonimne u nekim kontekstima osim ako nisu sinonimne u svim kontekstima.

Druga pretpostavka koju često postavljaju semantičari je da je sinonimija odnos identiteta između dva (ili više) nezavisno definisanih značenja. Drugim riječima, pitanje da li su dvije riječi - a i b - sinonimi, svodi se na pitanje da li a i b označavaju istu suštinu, isto značenje. U okviru pristupa semantici koji skiciramo u ovoj knjizi, neće biti potrebno postulirati postojanje nezavisno definiranih značenja. Sinonimija će se definirati na sljedeći način: dvije (ili više) jedinica su sinonimne ako rečenice nastale zamjenom jedne jedinice drugom imaju isto značenje. Ova definicija je eksplicitno zasnovana na apriornom pojmu “istosti značenja” za rečenice (i iskaze). Kasnije ćemo se vratiti na ovo pitanje. Ovdje samo želimo naglasiti ideju da se odnos sinonimije definira kao odnos koji se odvija između leksičkih jedinica, a ne između njihovih značenja. Sinonimnost leksičkih jedinica dio je njihovog značenja. Ista ideja može se formulirati u općenitijem obliku: ono što nazivamo značenjem leksičke jedinice predstavlja cijeli skup semantičkih odnosa(uključujući sinonimiju) u koju ulazi sa drugim jedinicama u vokabularu jezika.

9.4.3. PARADIGMATSKI I SINTAGMATSKI ZNAČENI ODNOSI

Pored sinonimije, postoji mnogo drugih semantičkih odnosa. Na primjer, muž i žena nisu sinonimi, ali su semantički povezani na način koji ne postoji između muža i sira ili vodonika; dobro i loše imaju različita značenja, ali su bliže od dobrog i crvenog ili okruglog; kuc "kuc; udari", bang "udari, kuc; pljesak; tutnjava", tap "lagano udari, kuc" i rap "lagano udari; kuc, kucni" povezani su odnosom koji se ne odnosi na riječi kucaj i jedi "jesti, jesti" " ili se diviti "diviti se". Ovdje ilustrovani odnosi su paradigmatičan(svi članovi skupova semantički povezanih pojmova mogu se pojaviti u istom kontekstu). Riječi također mogu biti povezane jedna s drugom sintagmatski; up.: plava "plava" i kosa "dlaka", lajanje "laje" i pas "pas", udarac nogom "udarati, šutnuti, šutnuti" i stopalo "noga" itd. (Opšti principi za razlikovanje paradigmatskih i sintagmatskih odnosa, videti § 2.3.3.) Ovde nećemo razmatrati pitanje da li se ovi sintagmatski i paradigmatski odnosi (kako neki semantičari predlažu) mogu definisati u smislu njihove „udaljenosti“ od sinonimije na skali istovetnosti i značenja razlike: alternativa pristup ovome će biti opisan u sljedećem poglavlju. Ovdje jednostavno pretpostavljamo da su barem neke oblasti vokabulara podijeljene leksičkim sistemima Pa šta semantička struktura Ovi sistemi moraju biti opisani u smislu semantičkih odnosa koji se odvijaju između leksičkih jedinica. Ovu izjavu smatramo rafiniranom formulacijom principa prema kojem je "značenje svake jedinice funkcija mjesta koje zauzima u odgovarajućem sistemu" (uporedi § 2.2.1, gdje se porede ruski i engleski pojmovi srodstva) .

Posljednjih godina dosta se radilo na proučavanju leksičkih sistema u vokabularu raznih jezika, posebno u odnosu na takve polja(ili regioni), kao što su srodstvo, boja, flora i fauna, težina i mjere, vojni činovi, moralne i estetske ocjene, kao i različite vrste znanja, vještina i razumijevanja. Rezultati su dalje pokazali vrijednost strukturalnog pristupa semantici i potvrdili predviđanja naučnika kao što su Humboldt, Saussure i Sapir da će vokabulari različitih jezika (barem u određenim područjima) nije izomorfna da postoje semantičke razlike koje se prave u jednom jeziku, a ne u drugom; Štoviše, kategorizacija specifičnih polja na različitim jezicima može se provesti na različite načine. Izražavajući ovu činjenicu sosirovski, kaže se da svaki jezik nameće specifičnost formu do a priori nediferenciranih supstance plan sadržaja (up. § 2.2.2 i § 2.2.3). Da bismo ilustrirali ovaj koncept, možemo uzeti (kao supstancu) polje boje i vidjeti kako se ovaj koncept tumači, ili "formulira", na engleskom.

Radi jednostavnosti, prvo ćemo razmotriti samo onaj dio polja koji je pokriven riječima crvena, narandžasta, žuta, zelena i plava. Svaki od ovih pojmova je referentno neprecizan, ali je njihov relativni položaj u ovom leksičkom sistemu fiksan (i općenito pokrivaju većinu vidljivog spektra): narandžasta je između crvene i žute, žuta je između narandžaste i zelene, itd. e. Značenje svake od ovih riječi uključuje indikaciju da one pripadaju ovom određenom leksičkom sistemu engleskog jezika i da u ovom sistemu stoje jedna s drugom u odnosu sporednosti (ili, možda preciznije, „biti između“). Može se činiti da je pojam značenja ovdje suvišan i da bi za opisivanje njihovog značenja bilo sasvim dovoljno uzeti u obzir referencu svakog od pojmova u boji. Razmotrimo, međutim, uslove pod kojima osoba može znati (ili se može misliti da zna) referencu ovih riječi. Dijete koje uči engleski ne može prvo steći referencu riječi zeleno, a onda, zauzvrat, referencu riječi plavo ili žuto, tako da bi se u određenom trenutku moglo reći da zna referencu jedne riječi, ali ne zna referencu drugog. (Naravno, po ostenzivnom načinu definicije on bi mogao znati da se riječ zeleno odnosi na boju trave ili lišća određenog drveta, ili boju jedne od majčinih haljina: ali referenca riječi zeleno je širi od bilo koje posebne instance njegove upotrebe, a poznavanje njegove reference uključuje i poznavanje granica te reference.) Treba pretpostaviti da tokom određenog vremenskog perioda dijete postepeno uči poziciju riječi zeleno u odnosu na riječi plavo i žuto, i riječi žuto u odnosu na riječi zeleno i narandžasto, itd. dok , dok ne sazna poziciju svakog pojma u boji u odnosu na njegovog susjeda u datom leksičkom sistemu i približan opseg granica regije u kontinuumu datog polja koje pokriva svaka riječ. Njegovo znanje o značenju termina u boji stoga nužno uključuje poznavanje i njihovog značenja i njihove reference.

Područje koje pokriva pet pojmova u boji o kojima se raspravljalo može se smatrati nediferenciranom (perceptivnom ili fizičkom) supstancom na koju engleski jezik nameće neki specifičan oblik crtanjem granica na određenim mjestima, a na pet tako dobijenih područja primjenjuje određenu leksičku klasifikaciju. (nazivajući ih riječima crvena, narandžasta, žuta, zelena i plava). Često se primjećuje da drugi jezici nameću drugačiji oblik ovoj tvari, odnosno prepoznaju u njoj različit broj regija i crtaju granice na drugim mjestima. S obzirom na gornji primjer, možemo reći da su ruske riječi plava I plava zajedno pokrivaju približno isto područje kao engleska riječ blue; označavajući posebne, iako susedne boje i zauzimajući ravnopravan položaj u sistemu sa rečima zeleno I žuta, ne treba ih smatrati riječima koje označavaju različite nijanse iste boje na isti način kao grimizno i ​​grimizno, zajedno sa drugim riječima, dijele područje pokriveno riječju crvena na engleskom (up. § 2.2.3) .

Odnos između pojmova u boji i njihovog značenja ne može se zamisliti na jednostavan način na koji smo do sada radili. Razlika u referenci riječi crveno, narandžasto, žuto, zeleno i plavo može se opisati u smislu varijacije tonovima(refleksije svjetlosti različitih valnih dužina). Fizičari razlikuju dvije druge varijable kada analiziraju boju: gospodstvo, ili svjetlina (reflektirajući više ili manje svjetlosti), i saturation(stepen oslobođenosti od bijelih nečistoća). Područja boja koja se na engleskom označavaju riječima crna, siva i bijela odlikuju se uglavnom svjetlošću, ali upućivanje na neke druge najčešće korištene termine boja mora se dati uzimajući u obzir sve tri dimenzije duž kojih boja može varirati, na primjer: smeđa “ smeđa" odnosi se na raspon boja, koji se nalazi u tonu između crvene "crvene" i žute "žute", ima relativno nisku svjetlost i zasićenost; ružičasta se odnosi na boju koja je crvenkastog tona, ima prilično visoku lakoću i vrlo nisku zasićenost. Analiza ovih činjenica može dovesti do ideje da je supstanca boje lisnih uši trodimenzionalni (fizički ili perceptivni) kontinuum.

Ali ova izjava također djeluje previše pojednostavljeno. Ne radi se samo o tome da se jezici razlikuju po relativnoj težini koju pridaju dimenzijama - nijansi, svjetlini i zasićenosti - u organizaciji svojih sistema označavanja boja (na primjer, latinski i grčki izgleda da više cijene lakoću nego nijansu) ; Postoje jezici u kojima se razlike u boji prave na osnovu potpuno različitih principa. U svojoj klasičnoj studiji o ovoj temi, Conklin je pokazao da su četiri glavna "termina u boji" jezika Hanunoo (jezik porijeklom s Filipina) povezana sa svjetlošću (uključujući obično bijele i svijetle nijanse drugih "engleskih boja"), tamom (uključujući englesku crnu, ljubičastu, , plavu, tamno zelenu i tamne nijanse druge boje), "vlažnost" (obično povezana sa svijetlozelenom, žutom i svijetlo smeđom, itd.) i "suvoća" (obično povezana sa kestenjastom, crvenom, narandžastom, itd.). Da razlika između "mokrog" i "suvog" nije samo stvar tona ("zeleno" vs. "crveno": upravo ova razlika može biti očigledna na osnovu najčešćih engleskih prijevoda ova dva termina u pitanju), postaje jasno iz činjenice da "sjaj, vlažan, braon komad svježe isječenog bambusa" opisuje se riječju koja se obično koristi za svijetlozelenu boju, itd. Conklin zaključuje da "boja, u strogom smislu riječi, nije za zapadnoevropske jezike univerzalni koncept"; da opozicije u smislu kojih se u različitim jezicima definira supstancija boje mogu ovisiti prvenstveno o povezanosti leksičkih jedinica s onim svojstvima predmeta u prirodnom okruženju osobe koja su bitna za datu kulturu. Što se tiče hanunbo jezika, sistem njegovih definicija očigledno počinje od tipičan tip svježe, mlade („mokre“, „sočne“) biljke. S tim u vezi, vrijedno je napomenuti da engleski rječnici često definiraju osnovne pojmove boja u odnosu na tipična svojstva ljudskog okruženja (na primjer, u rječniku se može reći da plava odgovara boji vedrog neba, crvena boji krv, itd.).

9.4.6. SEMANTIČKA "RELATIVNOST"

Polje boja je detaljno razmotreno jer se vrlo često koristi kao primjer da se pokaže kako isto supstanca može imati različit oblik, koje su joj nametnuli razni jezici. Sada znamo da čak iu slučaju označavanja boja imamo sve razloge da sumnjamo u mogućnost a priori postuliranja identiteta „supstancije sadržaja“. Conklinovi opisi kategorija "boje" u Hanunoou bi nas prirodno trebali navesti na pomisao da su jezički relevantne definicije supstance boje teško da su uvijek one dimenzije koje prirodne nauke biraju kao fundamentalne. Ovo dovodi do opšteg zaključka da jezik određenog društva jeste sastavni dio svoju kulturu i da leksičke distinkcije koje pravi svaki jezik obično odražavaju važna (sa stanovišta te kulture) svojstva objekata, institucija i aktivnosti društva u kojem jezik funkcioniše. Ovaj zaključak potvrđuju brojne novije studije iz različitih oblasti u vokabularu različitih jezika. S obzirom na činjenicu da prirodno okruženje različitih društava može biti vrlo različito (da ne spominjemo njihove društvene institucije i obrasce ponašanja), sama mogućnost plodnog razmatranja semantičke strukture kao rezultat superpozicije forme na njenu podlogu (perceptivnu, fizička ili konceptualna) supstancija izgleda vrlo sumnjiva, zajednička svim jezicima. Kao što je Sapir rekao: “Svjetovi u kojima žive različita društva su odvojeni svjetovi, a ne isti svijet s različitim etiketama.”

Čak i ako pretpostavimo da različita društva žive u “posebnim svjetovima” (i na to ćemo se uskoro vratiti), ipak se može tvrditi da svaki jezik nameće neki specifičan oblik supstanciji “svijeta” u kojem funkcionira. To je u određenoj mjeri tačno (kao što smo vidjeli, na primjer, u slučaju termina u boji). Važno je, međutim, biti svjestan da leksički sistemi ne moraju biti izgrađeni na osnovu unaprijed određene „osnovne“ supstance. Neka, na primjer, riječi poštenje "poštenje, istinitost, iskrenost, direktnost, čednost, vrlina, pristojnost", iskrenost "iskrenost, iskrenost, direktnost, poštenje", čednost "čednost, nevinost, čistoća, čistoća, vrlina, strogost, jednostavnost , skromnost , suzdržanost, uzdržavanje, suzdržanost", vjernost "vjernost, odanost, odanost, tačnost, ispravnost" itd. spadaju u isti leksički sistem sa riječju vrlina "vrlina, moral, čednost, dobar kvalitet, pozitivna osobina, dostojanstvo. " Struktura ovog sistema može se opisati u smislu semantičkih odnosa koji se odvijaju između njegovih članova. Sa ove tačke gledišta, pitanje da li postoje "značajne" korelacije između leksičkih jedinica i prepoznatljivih karakternih osobina ili obrazaca ponašanja je nebitno. Ako se takve korelacije uoče, one će biti opisane u smislu referenci, a ne značenja. Ukratko, primenljivost koncepta supstance u semantici određena je istim postulatom „postojanja“ kao i koncept reference (up. § 9.4.1).

Izjava da su “svjetovi u kojima žive različita društva posebni svjetovi” često se tumači kao proklamacija lingvističkog “determinizma”. Da li je Sapir (ili Humboldt prije njega i Whorf nakon njega) vjerovao da je naša kategorizacija svijeta u potpunosti određena strukturom našeg maternjeg jezika, pitanje je o kojem ovdje nećemo raspravljati. Većina naučnika se slaže da je lingvistički determinizam, shvaćen u ovom snažnom smislu, neodrživa hipoteza. Međutim, gore usvojeno gledište, prema kojem jezici u svom rječniku odražavaju razlike koje su važne sa stanovišta kulture društava u kojima funkcionišu, dijelom nas naginje na poziciju jezičke i kulturne „relativnosti“ . Stoga moramo naglasiti neospornu činjenicu da je razumijevanje strukture leksičkih sistema u jezicima osim našeg maternjeg neophodno i sasvim moguće kako pri ovladavanju njima u praktične svrhe, tako i prilikom proučavanja njihovog vokabulara. Mogućnost prevođenja sa jednog jezika na drugi očigledno zavisi od toga.

9.4.7. SLUČAJNOST KULTURA

Kulture (kako taj termin koriste antropolozi i sociolozi) nisu u direktnoj korespondenciji sa jezicima. Na primjer, mnoge institucije, običaji, odjevni predmeti, namještaj, hrana, itd., koji se odvijaju u Francuskoj i Njemačkoj, opažamo iu Engleskoj; ispostavilo se da su drugi karakteristični za pojedinačne zemlje ili određene regije ili društvene klase jedne zemlje. (Odnos između jezika i kulture je, naravno, mnogo složeniji nego što sugeriše ova pojednostavljena prezentacija: političke granice se ne poklapaju sa jezičke granice, čak i ako, bez dokaza, smatramo donekle legitimnim koncept jedinstvenog govornog kolektiva; kulturne sličnosti se mogu naći između različitih društvene grupe u različitim zemljama itd.). Generalno, može se tvrditi da će između bilo koja dva društva postojati veći ili manji stepen kulturno preklapanje; a može se ispostaviti da će određene karakteristike biti prisutne u kulturi svih društava. Praktično iskustvo izučavanja stranih jezika (u normalnim uvjetima u kojima se ti jezici koriste) sugerira da brzo identificiramo određene predmete, situacije i znakove kada se kulture poklapaju i lako naučimo riječi i izraze koji se na njih primjenjuju. Značenja drugih riječi i izraza se teže usvajaju, a njihova pravilna upotreba dolazi, ako i dođe, samo kao rezultat dugotrajne konverzacijske prakse. Teorijska interpretacija ovih činjenica našeg iskustva može biti sljedeća: ulaz u semantičku strukturu drugog jezika otvara se iz područja podudarnosti kultura; i kada jednom prekinemo ovaj krug značenja identifikacijom jedinica u ovom domenu (uporedi § 9.4.7, o neizbežnom "kružnom" karakteru semantike), možemo postepeno poboljšati i razjasniti naše znanje o ostatku rečnika iznutra, sticanjem reference leksičkih jedinica i semantičkih odnosa koji povezuju jedinice u kontekstu njihove upotrebe. Prava dvojezičnost uključuje ovladavanje dvije kulture.

9.4.8. "PRIJAVA"

Ako se jedinice različitih jezika međusobno dovode u korespondenciju na osnovu identifikacije zajedničkih karakteristika i situacija dviju kultura, možemo reći da te jedinice imaju iste aplikacija. Razlog za korištenje ovog termina umjesto "reference" je zbog dva razmatranja. Prije svega, predloženi termin označava odnos koji se odvija između situacija i izraza koji se javljaju u tim situacijama (na primjer, odnos između Oprostite „Izvinite“, Hvala „Hvala“ itd. i raznih karakterističnih situacija u u kojoj se ove izjave pojavljuju); ovo očigledno nije referentni odnos. Drugo, potrebno je uzeti u obzir i semantičku identifikaciju leksičkih jedinica koje nemaju referencu; preporučljivo je reći, na primjer, da engleska riječ sin "sin" i francuska riječ peche imaju istu primenu, iako bi moglo biti veoma teško ili čak nemoguće utvrditi ovu činjenicu sa referentne tačke gledišta. Može se dogoditi da će drugi od ovih razloga za uvođenje pojma "primjena" nestati nakon što se izgradi sveobuhvatna i zadovoljavajuća teorija kulture. Trenutno, tumačenje aplikacije, kao i proces prevođenja, u osnovi zavisi od intuicije dvojezičnih govornika. Ovo ne znači to ovaj koncept nema objektivan sadržaj, jer se dvojezični govornici obično međusobno slažu oko upotrebe većine riječi i izraza u jezicima koje koriste.

Ovaj odjeljak ništa ne govori o tome kako se uspostavljaju paradigmatski i sintagmatski semantički odnosi. Prije nego što pređemo na ovo pitanje, moramo razmotriti mogućnost proširenja pojmova reference i značenja i na gramatičke jedinice.

9.5. "LEKSIČKO" ZNAČENJE I "GRAMATIČKO" ZNAČENJE

9.5.1. "STRUKTURNE VRIJEDNOSTI"

Razmatrajući pitanje “gramatičkih kategorija”, pozvali smo se na tradicionalno, “aristotelovsko” gledište prema kojem su samo glavni dijelovi govora (imenice, glagoli, “pridjevi” i prilozi) “značeni” u potpunosti. smisao pojma (oni „označuju“ „koncepte“ koji čine „materiju“ diskursa), a preostali delovi govora učestvuju u formiranju ukupnog značenja rečenica, namećući „sadržaj“ određeni gramatički „oblik“. ” diskursa (up. § 7.1.3). Iznenađujuće slične stavove brane mnogi protivnici tradicionalne gramatike.

Na primjer, Frieze pravi razliku između "leksičkih" i "strukturnih" značenja, a ovaj kontrast tačno odražava "aristotelovsku" razliku između "materijalnog" i "formalnog" značenja. Glavni dijelovi govora imaju „leksičko“ značenje; i dat je u rječniku koji je povezan s određenom gramatikom. Naprotiv, razlika između subjekta i objekta u rečenici, suprotnosti u određenosti, vremenu i broju, te razlika između iskaza, pitanja i zahtjeva su sve razlike vezane za „strukturalna značenja“. („Ukupno jezičko značenje bilo kojeg iskaza sastoji se od leksičkih značenja pojedinih riječi plus takva strukturalna značenja... Gramatika jezika se sastoji od sredstava za signaliziranje strukturalnih značenja.”)

Friezeov koncept “strukturnog značenja” uključuje najmanje tri različite vrste semantičke funkcije; drugi lingvisti koriste termin „gramatičko značenje” (za razliku od „leksičkog značenja”) u istom smislu. Tri tipa "značenja" koja se spominju su: (1) "značenje" gramatičkih jedinica (obično pomoćnih dijelova govora i sekundarnih gramatičkih kategorija); (2) “značenje” gramatičkih “funkcija” kao što su “subjekat”, “objekat” ili “modifikator”; (3) “značenje” povezano s konceptima kao što su “deklarativno”, “upitno” ili “imperativno” u klasifikaciji različitih vrsta rečenica. Važno je razlikovati ove vrste "gramatičkog značenja", a mi ćemo ih razmotriti u nastavku.

9.5.2. LEKSIČKE I GRAMATIČKE JEDINICE

Predloženi su različiti kriterijumi za razlikovanje gramatičkih i leksičkih jedinica. Najzadovoljavajući od njih (i jedini koji ćemo ovdje spomenuti) formulirali su Martinet, Halliday i drugi u smislu paradigmatske opozicije unutar bilo kojeg zatvoreno, ili otvoren mnoge alternative. Zatvoreni skup jedinica je skup sa fiksnim i obično malim brojem članova, na primjer skup ličnih zamjenica, vremena, rodova itd. Otvoreni skup je skup s neograničenim, neograničeno velikim brojem članova, npr. klasa imenica ili glagola u jeziku. Koristeći ovu razliku, možemo reći da gramatičke jedinice pripadaju zatvorenim skupovima, a leksičke jedinice otvorenim skupovima. Ova definicija odgovara tradicionalnom razlikovanju značajnih dijelova govora, s jedne strane, i pomoćnih dijelova govora i sekundarnih gramatičkih kategorija, s druge strane. Za razliku od nekih drugih predloženih definicija, on nije vezan za jezike jednog morfološkog „tipa“ (na primjer, „flektivni“ jezici; up. § 5.3.6). Pretpostavimo za sada da je ova definicija tačna i da se (na osnovu razlike između zatvorenih i otvorenih skupova) svi elementi koji se unose u dubinsku strukturu rečenica mogu klasifikovati na „gramatičke” i „leksičke”. Sada se postavlja pitanje da li u principu postoji razlika između značenja gramatičkih i leksičkih jedinica.

Prvo, imajte na umu da leksičke jedinice, prema tradicionalnom gledištu, imaju i „leksičko“ i „gramatičko“ značenje (i „materijalno“ i „formalno“ značenje; up. §9.5.1). Koristeći terminologiju sholastičke, „spekulativne“ gramatike, možemo reći da određena leksička jedinica, na primjer krava, ne „označava“ samo neki specifičan „pojam“ (ovo je „materijalno“ ili „leksičko“ značenje jedinice u pitanju), ali istovremeno implementira određeni „način označavanja“ fenomena u obliku, na primjer, „supstanci“, „kvaliteta“, „akcija“ itd. (up. § 1.2.7 i § 7.1.1). Iako se lingvisti retko izražavaju ovim terminima, ovaj opšti koncept razlike između "leksičkog" i "gramatičkog" značenja leksičkih jedinica je još uvek u upotrebi. Štaviše, čini se da je u određenoj mjeri opravdano.

Na primjer, Lermontov ima dobro poznatu pjesmu koja počinje riječima: Usamljeno jedro je bijelo... Ovu frazu je teško (a možda i nemoguće) prevesti na engleski, jer njen efekat zavisi od činjenice da se na ruskom "imati svojstvo belog" može "izraziti" pomoću "glagola" (tada isto izražava se rečima bijela, koji se u rečenicama koje nisu označene vremenom, aspektom i modalitetom obično koristi bez „glagola biti“; Wed § 7.6.3). Kombinacija usamljeno jedro može se prevesti na engleski kao "usamljeno jedro" ( ploviti je imenica, a usamljen je “pridjev”). Sa tradicionalnog stanovišta, „glagol“ predstavlja „posedovanje svojstva belog“ kao „proces“ ili „aktivnost“, „pridjev“ kao „kvalitet“ ili „stanje“. Specifičnost preferiranog izbora u ovom slučaju „glagola“ umjesto „pridjeva“ može se pokazati pomoću engleskog jezika samo uz pomoć prilično neadekvatne parafraze poput „Postoji usamljeno jedro koje se ističe (ili čak sija četvrto) bijelo (na pozadini mora ili neba)..." Problemi ove vrste dobro su poznati onima koji prevode s jednog jezika na drugi. Teorijsko pitanje koje nas ovdje zanima je: možemo li reći da postoji specifično “gramatičko značenje” povezano sa svakim od glavnih dijelova govora?

Već smo vidjeli da je razlika između "glagola" i "pridjeva" u općoj sintaksičkoj teoriji težak problem: u nekim jezicima takva razlika se uopće ne pravi; u drugim jezicima brojne sintaktičke karakteristike su povezane sa ovom razlikom, au određenim slučajevima one mogu biti u suprotnosti jedna s drugom (up. § 7.6.4). Ali glavni kriterijum, kriterijum koji odražava tradicionalnu razliku između “aktivnosti” i “kvaliteta”, leži u specifičnoj razlici između “dinamičkog” i “statičnog” (up. § 8.4.7). U ruskom, ova razlika u "gramatičkom značenju" je "nametnuta" "leksičkom značenju", koje je zajedničko za oba "glagola" pobijeli, a za "pridjev" bijela. Prema ovom pristupu, tradicionalna teorija "sredstava notacije" mora se prihvatiti kao ispravna: ona se, naravno, mora preformulisati u okviru zadovoljavajuće teorije sintaksičke strukture.

Istovremeno, ne smijemo izgubiti iz vida opći princip da “imati značenje uključuje izbor”. Ako jezik koji se opisuje dopušta izbor ili „verbalnog” ili „pridjevskog” izraza (ograničavamo se na razliku ilustriranu u našem primjeru), tada upotreba jedne ili druge od ovih metoda već spada u opseg semantička analiza jezika. Dalje se možemo zapitati da li data dva "načina" izražavanja imaju isto značenje ili ne; i, ako se razlikuju po značenju, onda se možemo zapitati koja je semantička razlika između njih. Ako se ova razlika može povezati s nekom gramatičkom razlikom u dubokoj strukturi (npr. "dinamički" vs. "statičan"), onda je izraz "gramatičko značenje" sasvim prikladan za ovaj slučaj. Ali to ne znači da je izbor “glagola” umjesto “pridjeva” uvijek povezan s razlikom u “gramatičkom značenju”. U mnogim slučajevima, određeno "leksičko značenje" povezano je s jednim dijelom govora, ali ne i s drugim. Ukratko, u ovom pitanju, kao iu mnogim drugim, lingvistička teorija mora uspostaviti ravnotežu između “konceptualne” i “formalne” gramatike (up. § 7.6.1). Ne treba tvrditi da je “oznaka aktivnosti” dio “značenja” bilo kojeg “glagola” ili da je “oznaka kvaliteta” dio “značenja” bilo kojeg “pridjeva”.

Tradicionalno se vjeruje da leksičke jedinice imaju i „leksičko“ („supstancijalno“) i „gramatičko“ („formalno“) značenje. Obično se smatra da gramatičke jedinice imaju samo „gramatičko“ značenje. U prethodnom poglavlju smo vidjeli da se neke jedinice, koje djeluju kao „glagoli“ u površinskoj strukturi rečenica, mogu tumačiti kao „leksičke realizacije“ aspektalnih, kauzativnih i drugih „gramatičkih“ razlika. Ostavićemo po strani pitanje koliko su ove hipoteze istinite za stvarnost. U trenutnom stanju sintaktičke teorije, razlika između gramatičkih i leksičkih jedinica je prilično nejasna. Razlog je taj što se razlika između otvorenih i zatvorenih skupova alternativa može primijeniti samo na pozicije izbora u dubokoj strukturi rečenica; ali, kao što smo vidjeli, moguća su vrlo različita gledišta o tome gdje se te pozicije „izbora“ nalaze.

Glavna poenta koju ovdje treba naglasiti je ovo: čini se da nema značajne razlike između "vrste značenja" povezane s leksičkim jedinicama i "vrste značenja" povezane s gramatičkim jedinicama u slučajevima kada ove dvije klase elemenata imaju duboko značenje .strukture mogu biti jasno razgraničene. Koncepti "značenja" i "reference" primjenjuju se na obje vrste elemenata. Ako postoji bilo kakva generalizacija koja se može napraviti u vezi sa značenjem gramatičkih elemenata (a neki čisto gramatički elementi, kao što se sjećamo, nemaju nikakvo značenje; usp. §8.4.1), čini se da su gramatički "izbori" povezuju se sa opštim konceptima prostorne i vremenske korelacije, uzročnosti, procesa, individuacije, itd. - koncepti tipa o kojima se govori u poglavljima 7 i 8. Međutim, ne možemo unapred reći da u strukturi bilo kog određenog jezika, npr. koncepti, čak i ako ih je lako identificirati, nužno će biti “gramatikalizirani”, a ne “leksikalizirani”.

9.5.3. “ZNAČENJE” GRAMATIČKIH “FUNKCIJA”

Druga klasa fenomena u strukturi engleskog jezika, na koju su Freese (i drugi) primijenili termin "strukturno značenje" (ili "gramatičko značenje") može se ilustrirati konceptima kao što su "subjekt", "objekt" i "definicija". . Friezeova knjiga je napisana prije moderne teorije transformacijske sintakse, a on je razmatrao isključivo površinsku strukturu (unutar prilično ograničenog koncepta). Stoga, mnogo od onoga što on kaže o ovim „funkcionalnim“ konceptima, iako tačno, teško da je relevantno za semantičku analizu. Isto se može reći i za većinu modernih lingvističkih teorija.

Sasvim je jasno da su neki gramatički odnosi koji se odvijaju na nivou dubinske strukture između leksičkih jedinica i kombinacija leksičkih jedinica relevantni za semantičku analizu rečenica. Prema Chomskyju, “funkcionalni” koncepti “subjekta”, “direktnog objekta”, “predikata” i “glavnog glagola” čine glavne duboke odnose između leksičkih jedinica; Katz, Fodor i Postal su nedavno pokušali formalizirati teoriju semantike skupom „pravila projekcije“ koja djeluju na leksičke jedinice koje su povezane ovim odnosima unutar rečenica (usp. §10.5.4). Koncepti kao što su "subjekt", "predikat" i "objekat" razmatrani su u prethodnom poglavlju; i videli smo da njihova formalizacija u opštoj sintaksičkoj teoriji uopšte nije tako očigledna kao što je Čomski pretpostavljao. Iz toga proizilazi da status „pravila projekcije“ koji tumače rečenice na osnovu ovih koncepata također izgleda sumnjiv.

Razmatrajući 'tranzitivnost' i 'ergativnost', istakli smo da se mnogi od 'direktnih objekata' engleskih rečenica mogu generirati umetanjem jednomjesnih konstrukcija kao 'predikata' dvomjesnih konstrukcija i uvođenjem novog 'agentivni' subjekt. Ali također smo vidjeli da postoje i druge tranzicione konstrukcije na dva mjesta koje se ne mogu generirati na zadovoljavajući način ovom šemom. Sama ova činjenica sugerira da odnos “direktnog objekta” ne može dobiti jedno jedino tumačenje u semantičkoj analizi rečenica. Tradicionalna gramatika razlikovala je mnogo različitih vrsta "direktnog objekta". Jedan od njih se ovdje može spomenuti jer je (bez obzira na svoj status u teoriji sintakse) nesumnjivo vrlo važan u semantici. Mislimo na "objekat rezultata" (ili "efekat").

"Objekat rezultata" može se ilustrovati sa sledeće dve rečenice:

(1) Nije čitanje knjige "On čita knjigu."

(1) Nije pisati knjigu “On piše knjigu.”

Knjiga iz rečenice (1) postoji prije i nezavisno od čitanja, ali knjiga iz rečenice (2) još ne postoji – nastaje nakon završetka aktivnosti opisane u toj rečenici. Zbog ove razlike, knjiga u (1) se tradicionalno smatra 'običnim' objektom glagola je čitanje, dok se knjiga u (2) opisuje kao 'objekat rezultata'. Sa semantičke tačke gledišta, svaki glagol koji sa sobom ima „objekat rezultata” može se nazvati „egzistencijalnim kauzativom”. Najčešći "glagol" na engleskom koji spada u ovu klasu je make, a već smo istakli da je to i "pomoćni glagol" (up. §8.3.6 i §8.4.7). Ovaj isti „glagol“ djeluje, kao i glagol do „raditi“, kao „zamjenski glagol“ u upitnim rečenicama. Pitanje poput Šta radiš? "Šta radiš?" nosi manje pretpostavki o „predikatu“ rečenice koja odgovara na pitanje (glagol može biti prelazan ili neprelazan, ali mora biti glagol „radnje“; up. § 7.6.4). Pitanje Šta radiš? “Šta radiš?”, naprotiv, pretpostavlja da je odgovarajuća “aktivnost” “rezultativna” i da ima za cilj ili ograničenje “egzistenciju” („postojanje”) nekog “objekta”. U brojnim evropskim jezicima ova razlika se pojavljuje, iako ne tako jasno kao u engleskom. (Na primjer, na francuskom, Qu" est-ce que tu fais? može se prevesti na engleski ili kao "Šta radiš?" ili kao "Šta praviš?"). Ali to ne znači da za ove jezike razlika između "običnih" objekata i "objekta rezultata" je irelevantna.

Važnost koncepta "egzistencijalnog kauzativa" proizlazi iz činjenice da u rečenicama koje sadrže konstrukciju sa "objektom rezultata" često postoji visok stepen međuzavisnosti između određenog glagola ili klase glagola i određene imenice ili klase imenice. Na primjer, nemoguće je dati zadovoljavajuću semantičku analizu imenice slika „slika“ bez identifikacije njenih sintagmatskih veza s glagolima kao što su slikati „slikati, crtati, pisati“ i crtati „crtati, crtati“; nasuprot tome, činjenica da ovi glagoli mogu imati kao "rezultatni objekat" imenicu slika mora se uzeti u obzir kao dio njihovog značenja.

Ovaj koncept sintagmatske međuzavisnosti, ili pretpostavke, igra značajnu ulogu u analizi rečnika bilo kog jezika (up. § 9.4.3). Ima mnogo širu primjenu nego što naši primjeri mogu pokazati. Postoje pretpostavke koje se javljaju između određenih klasa imenica i glagola kada je imenica subjekt glagola (na primjer, ptica : letjeti, riba : plivati); između “pridjeva” i imenica (plavo “plavo”: kosa “kosa”, dodano “pokvareno”: jaje “jaje”); između glagola i „običnih“ objekata (vožnja „voziti“: sag „automobil“); između glagola i imenica koje s njima imaju „instrumentalne“ odnose (ugristi „zagristi“: zube, udariti „dati“: noga „noga, noga“) itd. Mnogi od ovih odnosa su između određenih klasa leksičkih jedinica ne mogu se drugačije formulirati nego nekim skupom "pravila projekcije" (ad hoc pravila) unutar transformacijske sintakse koju je ocrtao Chomsky.

Zbog činjenice da još uvijek ne postoji potpuno zadovoljavajući sintaktički okvir unutar kojeg bi bilo moguće formulirati različite semantičke relacije koje služe kao sredstvo za strukturiranje rječnika jezika, nećemo pokušavati formulirati skupove „pravila projekcije“ koja rade na dubokim gramatičkim odnosima. U sljedećem poglavlju ćemo pogledati nekoliko posebno važnih paradigmatskih odnosa između klasa leksičkih jedinica; njihova analiza će se obaviti neformalno. Pretpostavljamo da bi se ovi odnosi mogli elegantnije formulisati u smislu nekog zadovoljavajućeg opisa gramatičkih odnosa na nivou dubinske strukture.

9.5.4. "ZNAČENJE" "VRSTE REČENICA"

Treća klasa "značenja" koja se obično smatraju "gramatičkim" može se ilustrovati razlikovanjem između "deklarativnih", "upitnih" i "imperativnih" rečenica. U novijim radovima na teoriji transformacije postoji tendencija da se u duboke NS strukture rečenica uvedu gramatički elementi kao što su „upitni marker” i „imperativ”, a zatim se na takav način formuliraju pravila transformacijske komponente. da će prisustvo jednog od ovih „markera“ „uključiti » odgovarajuće pravilo transformacije. Ovdje ne razmatramo sintaktičke prednosti ove formulacije razlike između različitih „vrsta rečenica“, već nas zanima njena semantička suština.

Sugerirano je (od strane Katza i Postala) da su ovi "markeri" semantički slični leksičkim i gramatičkim elementima koji se javljaju kao konstituenti u jezgri rečenica. Na primjer, “marker imperativnosti” je zapisan u rječniku i snabdjeven naznakom “što ga karakteriše otprilike sljedećeg značenja: “govornik postavlja zahtjev (pita, zahtijeva, insistira, itd.) tako da. ” Ali ovo mišljenje je zasnovano na konfuziji u upotrebi termina „značenje“. On zaobilazi kontradikcije koje nastaju u vezi s razlikama koje se prave u semantici između "značenja", "reference" i drugih vrsta "značenja". Ako nastavimo koristiti pojam "značenje" za sve vrste razlikovnih semantičkih funkcija, onda možemo opravdano reći da postoje razlike u "značenju" između odgovarajućih iskaza, pitanja i naredbi (koje nisu nužno "izražene" deklarativnim, upitne i imperativne rečenice, ali zbog jednostavnosti ovu činjenicu zanemarujemo). Međutim, pitanje da li dvije leksičke jedinice imaju „isto značenje“ ili ne obično se tumači u odnosu na pojam sinonimije – istovjetnost značenja. Ovo je paradigmatski odnos, odnosno odnos koji ili postoji ili ne važi između jedinica koje se javljaju u istom kontekstu, u istoj „tipi rečenice“. U narednom poglavlju ćemo vidjeti da je koncept "sinonimije" između X I at može se opisati u terminima skupa implikacija koje "slede" iz dve rečenice, koje se razlikuju samo po mestu gde u jednom slučaju stoji X, u drugom - vrijedi at. Ali ova razmatranja jednostavno se ne odnose na odgovarajuće izjavne i upitne (imperativne) rečenice (na primjer: Pišete pismo "Pišete pismo" vs. Pišete li pismo? "Pišete li pismo?" ili Napišite pismo! "Napisati pismo!"). Iako se odgovarajući članovi različitih "tipova rečenica" mogu okarakterisati kao različiti u "značenju", ne može se reći da se razlikuju po značenju. Nema potrebe pokušavati formalizirati teoriju semantike na način da se „značenje” „upitnog markera” ili „imperativnog markera” može opisati istim terminima kao i „značenje” leksičkih jedinica,

SEMANTIČKI PRINCIP KLASIFIKACIJE DELOVA GOVORA

Postoji nekoliko principa za podjelu riječi punog vrijednosti u kategorije. Jedan od ovih principa je semantički princip. Posebno se razmatralo (Panov M.V. O dijelovima govora na ruskom jeziku // Naučni izvještaji visoke škole. Filološke nauke, 1960, br. 4). Prema ideji, dijelovi govora bi trebali imati određeno zajedništvo, a ta zajednička ne bi trebala biti korijenska, već afiksalna i odnositi se ne na zvuk afiksa (oblik), već na njihovo značenje (sadržaj). U stvari, oblici riječi kukavica, kukavica,kukavički, iako dijele zajednički korijenski morfem, ne mogu se klasificirati kao jedan dio govora. Forme riječi napisao I strašilo, pospano I guranje, sladoled I veliki, iako sadrže formalno identične afiksalne elemente -l-, -n~, -oe, očigledno pripadaju različitim delovima govora. Stoga je potrebno otkriti neku smislenu afiksalnu zajednicu, koja bi trebala poslužiti kao osnova za podjelu riječi na dijelove govora.

Klasifikacija se zasniva na izuzetno opštem značenju – učešću u funkciji imenovanja. Postoji nekoliko takvih funkcija. Jedan od njih - proceduralnost- vidi se u bilo kojoj glagolskoj formi riječi, bez obzira na značenje korijena, koji možda i nema proceduralno značenje. Druga funkcija - sign. Dolazi nakon procesa u hijerarhiji funkcija. Na osnovu odsustva procesne funkcije i prisutnosti atributne funkcije, pridjev se izdvaja kao dio govora. Pri tome se particip kao dio govora ne izdvaja, budući da ima procesnu funkciju. Ova okolnost je osnova za klasifikaciju participskih oblika kao dijelova govora. Treća funkcija je direktan ili indirektan odnos prema objektu. Na osnovu toga, pridjev i glagol se suprotstavljaju prilogu. Prvi direktno karakteriziraju objekt: pridjev je neprocesualni, glagol (s participom!) je procesni. Prilog ne karakterizira direktno predmet, on obavlja funkciju karakteristike same karakteristike, odnosno glagola ili pridjeva. Istu funkciju atributa atributa obavlja i gerund. Međutim, za razliku od priloga, gerundi imaju proceduralnu prirodu.

Oblici riječi koji nemaju ni jedno od naznačenih značenja u svom afiksnom dijelu su imenice, koje pri ovakvom postavljanju pitanja uključuju kardinalne i zbirne brojeve. Sve ostale gramatičke razlike između oblika riječi ne utiču na identifikaciju dijelova govora.

Sličan - funkcionalno-semantički - pristup identifikaciji dijelova govora u ruskom jeziku ranije je proveden . Bio je sklon razlikovati četiri samostalna dijela govora u ruskom jeziku: imenicu, pridjev, glagol i prilog. Međutim, na osnovu razmatranja semantičko-funkcionalnih kategorija leksema koje je identifikovao, bilo je moguće otkriti napeto mesto u sistemu ruskih delova govora identifikovanih na ovaj način. Gleda fraze trci trku I trci trku. Prva fraza je prirodna i leksički i gramatički. Druga fraza je takođe leksički prirodna. Ali gramatički je nezakonito: rase- prilog, odnosno znak znaka, ali trči- imenica, tj. gramatički nije znak ili proces. Kolokacija trči brzo- i leksički i gramatički konzistentni. Kolokacija brzo trčanje gramatički i logički, ali leksički - ne, jer leksički trči nije nešto objektivno. Dakle, opozicija pridjeva i priloga u razmatranom aspektu ispada donekle zamagljena. Može se navesti mnogo primjera kada se prilog ponaša kao znak u odnosu na

na imenicu direktno: kajgana,timsko ošišana kosa, vitlati rep itd.

U poređenju s tradicionalno identificiranim dijelovima govora, predložena shema se razlikuje po nekim karakteristikama. U ovoj shemi nema zamjenica ili brojeva. Međutim, ovi gubici su logički neizbježan rezultat dosljedne primjene semantičko-funkcionalnog principa podjele. U skladu s ovim principom, sve tradicionalno dodijeljene zamjenice raspoređene su između imenica, pridjeva i priloga. Brojevi dijele istu sudbinu. Redni su uključeni u pridjeve, kvantitativni i zbirni u imenice, a oblici riječi poput dvaput, triput, iako se vezuju za brojanje, kao što su tradicionalno bili vezani uz priloge, ostaju među prilozima čak i uz naznačeni pristup. Klasifikacija prema principu “funkcije imenovanja” samo u svojim krajnje općim značenjima daje shemu koja podsjeća na tradicionalne dijelove govora. U principu, klasifikacija zasnovana na ovom principu može biti detaljna. Tada će to dovesti do identifikacije grupa leksema (ili oblika riječi) koje imaju funkcionalnu i semantičku zajedništvo. Tako se, na primjer, unutar glagola mogu razlikovati grupe ličnih i bezličnih glagola; unutar priloga grupa priloga koji označavaju karakteristični atribut i grupa priloga koji označavaju stanje (hladno mi je, on nema vremena), itd.

Uprkos objektivnoj vrijednosti razmatrane klasifikacije i njenoj posebnoj važnosti za semantiku i sintaksu, ona ne može u potpunosti zadovoljiti stručnjaka iz oblasti morfologije, jer ne uzima u dovoljnoj mjeri u obzir morfološke kategorije koje su zastupljene ili nisu zastupljene u određenoj grupi leksema. ili oblicima reči. Ova posljednja okolnost – stvarne morfološke karakteristike riječi – može poslužiti kao osnova za drugačiju identifikaciju dijelova govora.

MORFOLOŠKI PRINCIP KLASIFIKACIJE GOVORNIH DIJELOVA

ISTI SKUP MORFOLOŠKIH KATEGORIJA. Klasifikacija leksema može se zasnivati ​​na izražavanju istih morfoloških kategorija. U ovom slučaju lekseme kuća, životinja, zimačine jednu grupu, jer svi njihovi oblici riječi izražavaju morfološke kategorije broja, padeža i samo ove kategorije. S druge strane, sve ove lekseme biće suprotstavljene leksemama ljubazni, stari, veliki, budući da svi oblici riječi potonjeg izražavaju takve morfološke kategorije kao što su rod, broj, padež, sažetost-potpunost.

Međutim, klasifikacija prema principu „ozbiljnosti istog skupa morfoloških kategorija“ ne dovodi uvijek do tako jasnih rezultata kao u gore opisanom slučaju suprotstavljenih imenica i pridjeva. Direktor

Velike poteškoće nastaju kada različiti oblici riječi jedne lekseme izražavaju različite skupove morfoloških kategorija.

Najsloženija struktura u tom pogledu u ruskom jeziku su oblici riječi koji su tradicionalno uključeni u glagol. Čak se i oblici sadašnjeg i prošlog vremena razlikuju po skupu izraženih morfoloških kategorija. Sadašnjost izražava kategoriju osoba nestalih u prošlosti. I u prošlosti je izražena kategorija roda koja je odsutna u sadašnjosti. Morfološke kategorije glagola u oblicima indikativa, konjunktiva i imperativa ne poklapaju se. Još su upečatljivije razlike u skupovima morfoloških kategorija ličnih oblika glagola i infinitiva, ličnih oblika glagola i participa, infinitiva i participa. Uz sve to, i infinitiv i lični oblici svih načina, i particip i gerund treba smatrati oblicima riječi jedne lekseme, jer se značenja koja razlikuju ove oblike riječi mogu smatrati obaveznim i pravilnim (vidi više o tome u odeljku „Glagol“). Iz ove okolnosti proizlazi da se klasifikacija prema principu „izražavanja istog skupa morfoloških kategorija“ može dosljedno provoditi samo za oblike riječi. Za lekseme je takva klasifikacija u principu nemoguća.

Još jedna okolnost otežava primjenu ovog kriterija. Ona leži u činjenici da među ruskim leksemama ima mnogo onih koje se sastoje od jednog oblika riječi i stoga ne izražavaju ni jednu morfološku kategoriju. Tokeni kao što su kaput, taksi, hidro, po principu “izražavanja morfoloških kategorija” oštro se suprotstavljaju većini ruskih imenica, koje izražavaju morfološke kategorije i broja i padeža u svojim oblicima riječi. Tokeni tipa bež, kaki, semantički identični pridjevima, ne posjeduju nikakve morfološke kategorije svojstvene pridjevima. Stoga je klasifikacija po principu “izražavanja morfoloških kategorija” moguća samo za gramatički oblikovane oblike riječi.

U ovom slučaju bit će predstavljene sljedeće vrste oblika riječi:

1) imenice (izraženi padež i broj); Ovo također uključuje kvantitativne i skupne brojeve;

2) pridevi (izričiti padež, broj, rod i sažetost/potpunost);

3) infinitivi (izričiti aspekt i glas);

4) participi (izričiti aspekt);

5) participi (izričiti padež, broj, rod, sažetost/potpunost, vrsta, glas, vrijeme);

6) glagoli indikativnog raspoloženja sadašnjeg/budućeg vremena (izraziti broj, vid, glas, vreme, lice, raspoloženje);

7) glagoli indikativnog raspoloženja prošlog vremena (izraziti broj, rod, vid, glas, vreme, raspoloženje);

8) glagoli konjunktivnog raspoloženja (izraziti broj, rod, vid, glas, raspoloženje);

9) imperativni glagoli (izraziti broj, vid, glas, lice, raspoloženje);

10) gramatički neokarakterisani oblici reči: indeklinabilne imenice i pridevi, komparativni stepen i prilozi.

Upravo bi tako trebali izgledati samostalni dijelovi govora u ruskom jeziku kada bi se njihova identifikacija temeljila na jednoj osobini - prisutnosti zajedničkih morfoloških osobina izraženih u samom obliku riječi.

U usporedbi s tradicionalnim dijelovima govora, ova klasifikacija se pokazuje kompaktnijom za ime (nema različitih kategorija zamjenica, kardinalnih i rednih brojeva) i mnogo manje kompaktnom za glagol.

ISTI SKUP ČLANOVA PARADIGME. U okviru morfološkog pristupa identifikaciji delova govora moguća je još jedna klasifikacija. Može se zasnivati ​​na strukturnim karakteristikama paradigme. Jasno je da bi u ovom slučaju imenice, na primjer, bile suprotstavljene pridevima. Uostalom, paradigma potonjeg uključuje suprotstavljanje oblika riječi prema rodu, koje nema u imenicama. Istina, u ovom slučaju ni imenice ni pridjevi ne bi mogli održati svoje jedinstvo. Štaviše, do takve fragmentacije bi došlo ne samo zbog nepromjenjivih imenica i pridjeva. Među imenicama, veliku grupu leksema koje imaju oblike riječi samo jednog broja (u jednini ili množini, nije važno) trebalo bi suprotstaviti leksemama koje imaju oblike oba broja. (kuće-kuće I mladost, mleko). Zatim u kategoriji leksema like mladost, mleko Bilo bi potrebno uključiti i brojeve – zbirne i kvantitativne, kao i lične i upitne zamjenice. Uostalom, sve ove lekseme imaju oblike riječi samo jednog broja.

Lekseme pridjeva podijelile bi se na tri dijela: lekseme s kratkim i punim oblicima riječi (bijeli), lekseme samo sa punim oblicima reči (veliki), lekseme samo sa kratkim oblicima reči (drago).

Za razliku od imenica i pridjeva po samoj prirodi skupa oblika riječi, glagol u ovom slučaju treba podijeliti u nekoliko grupa ovisno o prisutnosti ili odsustvu aspektnog para, ličnom obliku pasiva, određenim participima i gerundima. , itd.

SINTAKTIČKI PRINCIP KLASIFIKACIJE GOVORINIH DIJELOVA

Ne treba zaboraviti da stvarni morfološki pristup identifikaciji dijelova govora ostaje potpuno nemoćan u odnosu na nepromjenjive riječi. Ovdje su mogući samo semantički i sintaktički pristupi.

Kada se primjenjuje na nepromjenjive riječi, odnosno na lekseme koje se sastoje od jednog oblika riječi, sintaktički princip se pokazuje vrlo djelotvornim. Suština ovog principa je odrediti one vrste leksema s kojima se riječi koje nas zanimaju mogu ili ne mogu kombinirati, kao i razumjeti funkcije koje te riječi obavljaju u rečenici. Tako se među nepromjenjivim riječima imenice kombinuju s imenicama, pridevima i glagolima (HE Sibira, Krasnojarskhidroelektrana, izgraditi hidroelektranu), su subjekt, predikat, objekat, definicija, okolnost; pridjevi se kombinuju sa imenicama (bež odijelo), su definicija ili predikat; prilozi se kombinuju sa glagolima i pridevima (obučena kao ljeto, topla kao ljeto), okolnosti su različite vrste.

Osim toga, ovaj princip podjele zahtijeva prepoznavanje među nepromjenjivim riječima kao posebnu klasu tzv. oblika komparativnog stepena, komparativni. Ove riječi, za razliku od imenica, prideva i priloga, kombiniraju se samo s glagolima i imenicama (stotinustariti, brat je stariji od sestre). Osim toga, upotreba sintaktičkog kriterija zahtijeva odabir grupe riječi koje se odnose samo na rečenicu u cjelini (možda moždane, naravno, šta dobro itd.). Ove riječi se obično nazivaju modalnim riječima. Dakle, upotreba sintaktičkog kriterija nam omogućava da identificiramo dijelove govora od nepromjenjivih riječi. Važno je napomenuti da se odabir imenica i pridjeva među nepromjenjivim riječima može vršiti na osnovu semantičkog kriterija. Semantički kriterij lako razlikuje priloge od nepromjenjivih riječi. Međutim, samo primjena sintaktičkog kriterija uvodi različite gradacije među prilozima.

U ruskoj gramatičkoj literaturi naširoko se raspravljalo o jednom pokušaju da se poseban dio govora izolira na osnovu sintaksičkog principa klasifikacije oblika riječi. Riječ je o oblicima riječi koji nisu verbalni, već se koriste kao predikat (hladan je, drago nam je, trebalo bi, previše je lijen za posao, previše lijen za razgovor itd.). Ovi oblici riječi dobili su status posebnog dijela govora, takozvane državne kategorije. Kombinacija svih ovih oblika riječi u jedan dio govora uzima u obzir zajedništvo njihove sintaksičke funkcije i određenu semantičku homogenost koja je povezana s tom zajedništvom, što je zabilježeno u samom nazivu „kategorija stanja“. Morfološki, svi ovi oblici riječi se različito karakteriziraju: Hladno ne izražava morfološke kategorije, drago mi je, trebalo bi imati broj lenjost, nedostatak vremena- broj, slučaj.

Dosljedna primjena sintaksičkog principa na sve oblike riječi dovodi do paradoksalnih zaključaka. Dakle, kratke pridjeve, na primjer, treba suprotstaviti punim. Prvi može djelovati i kao definicija i kao predikat, dok drugi može djelovati samo kao predikat. Sintaktičke funkcije različitih glagolskih oblika – ličnih, participativnih, participativnih – biće drugačije definisane. Istina, na osnovu sintaktičkih funkcija, oblici riječi kardinalnih i zbirnih brojeva mogu se suprotstaviti oblicima riječi samih imenica: poznato je da se kardinalni i zbirni brojevi ne mogu kombinirati s pridjevima.

Možda bi definisanje sintaktičkih funkcija u odnosu na lekseme moglo dati poznatije rezultate? Ovo je pogrešno. Unutar jedne lekseme koegzistiraju različito morfološki oblikovani oblici riječi. Na potpuno isti način različiti oblici riječi iste lekseme mogu obavljati različite sintaksičke funkcije. Stoga je klasifikacija po principu “sintaksičke funkcije” za lekseme u principu nemoguća, kao što je klasifikacija zasnovana na homogenom morfološkom dizajnu nemoguća za lekseme.

REZULTATI RAZLIČITIH KLASIFIKACIJA

Možemo izvući neke zaključke. Problem identifikacije dijelova govora je problem klasifikacije oblika riječi.

Ističe semantički kriterij u svojim najopćenitijim značenjima četiri klase punoznačni oblici riječi - imenica, pridjev, glagol i prilog.

Morfološki kriterijum ističe devet razreda formalizirani oblici riječi i neformirani oblici riječi.

Sintaktički kriterij, primijenjen na morfološki neokarakteriziranu grupu, omogućava nam da razlikujemo među potonjima imenice, pridjeve, priloge, komparativ (uporedni stepen), kategoriju stanja i modalne riječi. U principu je moguće primijeniti sintaktički kriterij na oblike riječi, ali će njegovi rezultati biti u suprotnosti s rezultatima morfološke i semantičke analize.

NAČELA KLASIFIKACIJE I TRADICIONALNA NASTAVA O GOVORIMA

Iz navedenog je jasno da je tradicionalna doktrina o dijelovima govora a priori klasifikacija, čiji su logički temelji vrlo heterogeni. Međutim, ova klasifikacija omogućava da se bilo koji oblik riječi ili leksema smjesti u odgovarajuću kategoriju. Ima mjesta za imenice, pridjeve, brojeve, glagole i priloge. Istovremeno, zbog logičke nesavršenosti, tradicionalna klasifikacija razdvaja ono što bi, iz nekih logičnih razloga, trebalo da bude zajedno.

Školski brojevi, na primjer, kombinujući kardinalne zbirne i redne brojeve na semantičkoj osnovi, odvajaju potonje od pridjeva, unatoč njihovoj morfološkoj i sintaksičkoj zajedničkosti. Želja da se razlikuje kategorija stanja među ruskim delovima govora objašnjava se činjenicom da jedinice sa istim sintaksičkim funkcijama postoje i u kategoriji "imenice". (nedostatak vremena, lenjost), i u odjeljku “pridjevi”. (drago, puno) i u odjeljku “prilozi”. (dosadno, zabavno).

Upravo u „apriornoj“ prirodi leži i snaga tradicionalne doktrine o dijelovima govora – stoljećima provjerena sposobnost da se okarakterizira bilo koji predmet – i njena slabost, otvorenost za kritiku logičkih osnova na kojima se ta klasifikacija nalazi.

Ne može se ne primijetiti još jedna prednost tradicionalne klasifikacije dijelova govora. Neke jedinice, iako ostaju sasvim logične, mogu se istovremeno svrstati u jednu i drugu kategoriju. Ovo je vrlo zgodno, jer u brojnim područjima sistema dijelova govora postoje stalni prijelazi (pridjevi u imenice, participi u pridjeve itd.).

Sve ove okolnosti predodređuju održivost tradicionalne doktrine o dijelovima govora.

Kao što je već napomenuto, doktrina o dijelovima govora važna je ne samo za morfologiju, već i za druge dijelove opisa ruskog jezika. Tradicionalna doktrina o dijelovima govora ne odražava rezultate nijedne od gore navedenih klasifikacija (uporedi s kriterijima za definiranje riječi), već predstavlja svojevrsni kompromis između svih ovih principa. Značajnu ulogu u postizanju takvog kompromisa igra činjenica da dijelovi govora identificirani iz različitih razloga formiraju grupe vrlo različite veličine. Uporedite, na primjer, imenice i takozvanu kategoriju stanja, glagolske i modalne riječi.

LITERATURA NA TEMU

“DELOVI GOVORA KAO LEKSIČKO-GRAMATIČKE KLASE RIJEČI”

Zhirmunskiy V.M. O prirodi dijelova govora i njihovoj klasifikaciji. - U knjizi: Pitanja teorije dijelova govora na temelju materijala jezika različitih vrsta. L., 1965.

P a n o v M. V. O dijelovima govora u ruskom jeziku. - Naučni izvještaji više škole. Philol. nauke, 1960, br. 4.

S t e b l i n - Kamenskiy M. I. O pitanju delova govora - Vestnik Lenjingradskog državnog univerziteta, 1954, br. 6.

Shcherba L.V. O dijelovima govora na ruskom jeziku. - U knjizi: Izabrani radovi na ruskom jeziku. M., 1957. .-

anotacija

Članak je posvećen problemima semantičke analize tekstova. Razmatrano razne metode: Konceptualni dijagrami zavisnosti i semantičke mreže; pristupi zasnovani na leksičkim funkcijama i tematskim klasama; okvir i ontološki modeli; logičke modele predstavljanja znanja. Svaki od njih ima svoje prednosti i nedostatke.

Stvaranje novih metoda semantičke analize tekstova relevantno je za rješavanje mnogih problema kompjuterske lingvistike, kao što su mašinsko prevođenje, auto-sažimanje, klasifikacija teksta i drugi. Jednako je važan razvoj novih alata za automatizaciju semantičke analize.

Metode i sistemi za semantičku analizu teksta

Semantika je grana lingvistike koja proučava semantičko značenje jezičkih jedinica. Osim znanja o strukturi jezika, semantika je usko povezana sa filozofijom, psihologijom i drugim naukama, jer neminovno postavlja pitanja o porijeklu značenja riječi, njihovom odnosu prema biću i mišljenju. Prilikom semantičke analize potrebno je uzeti u obzir društvene i kulturne karakteristike izvornog govornika. Proces ljudskog mišljenja, kao i jezik, koji je sredstvo za izražavanje misli, vrlo je fleksibilan i teško ga je formalizirati. Stoga se semantička analiza s pravom smatra najtežom fazom automatske obrade teksta.

Stvaranje novih metoda za semantičku analizu teksta otvorit će nove mogućnosti i omogućiti
čine značajan napredak u rješavanju mnogih problema kompjuterske lingvistike, kao što su mašinsko prevođenje, auto-sažimanje, klasifikacija teksta i drugi. Ništa manje relevantan nije razvoj novih alata za automatizaciju semantičke analize.

Trenutno postoji nekoliko metoda za predstavljanje značenja iskaza, ali nijedan od njih nije univerzalan. Mnogi istraživači su radili na povezivanju značenja teksta. Dakle, I.A. Melchuk je uveo koncept leksičke funkcije, razvio koncepte sintaktičke i semantičke valencije i razmatrao ih u kontekstu eksplanatorno-kombinatornog rječnika, koji je jezični model. Pokazao je da značenja riječi nisu direktno povezana
sa okolnom stvarnošću, ali sa idejama izvornog govornika o ovoj stvarnosti.

Većina istraživača sklona je mišljenju da semantičku analizu treba izvršiti nakon sintaktičke analize. V.Sh. Rubaškin i D.G. Lahuti je uveo hijerarhiju sintaktičkih veza za više efikasan rad semantički analizator. Najvažnije su obavezne veze uloga, zatim koreferentne veze, zatim fakultativne veze uloga, pa tek onda subjekt-asocijativne.

Poznati lingvista E.V. Paducheva predlaže razmatranje tematskih klasa riječi, posebno glagola, jer oni nose glavno semantičko opterećenje: glagoli percepcije, glagoli znanja, glagoli emocija, glagoli odlučivanja, govorne radnje, kretanja, glasovni glagoli, egzistencijalni glagoli, itd. Bitna je u ovom pristupu ideja podjele jezičkih koncepata u određene semantičke grupe, uzimajući u obzir činjenicu da ti koncepti imaju neku netrivijalnu zajedničku semantičku komponentu. Elementi takvih grupa imaju tendenciju da imaju isti skup zavisnih koncepata. Međutim, glavni problem ovog pristupa je taj što je identifikacija tematskih časova i sastavljanje semantičkih rječnika izuzetno naporan proces, koji u velikoj mjeri ovisi o individualnoj percepciji i interpretaciji pojmova od strane određene osobe.

Univerzalni jezik predstavljanja znanja trebao bi biti pogodan alat za izvlačenje novih znanja iz postojećeg znanja, što znači da je potrebno kreirati aparat za provjeru ispravnosti iskaza. Ovdje su korisni logički modeli predstavljanja znanja. Na primjer, semantički jezik koji je predložio V.A. Tuzova, sadrži formalizme predikatske logike; sadrži “atomske” koncepte, “funkcije” nad tim konceptima i pravila zaključivanja pomoću kojih se novi koncepti mogu opisati. Moguće je da će se naučna misao u budućnosti razvijati u pravcu stvaranja takvih semantičkih jezika.

Unatoč činjenici da se neke naučne i tehničke ideje u području obrade teksta razvijaju prilično brzo, mnogi problemi u semantičkoj analizi ostaju neriješeni. Većina istraživača je došla do zaključka da rečnik koji podržava semantičku analizu mora da operiše značenjima i da stoga opisuje svojstva i odnose pojmova, a ne reči. No, postavlja se pitanje kako pravilno strukturirati i prezentirati informacije u takvim rječnicima tako da pretraživanje po njima bude zgodno i brzo, a također bi bilo moguće uzeti u obzir promjene u prirodnom jeziku (nestanak starih i nastanak novih pojmova). ). U ovom članku pokušava se sistematizirati poznata dostignuća u oblasti semantičke analize i donekle pronaći odgovor na ovo i druga pitanja.

Proučavanje semantike u okviru teorije “Značenje ↔ Tekst”

Prilikom stvaranja teorije "Značenje ↔ Tekst" I.A. Melchuk je uveo koncept leksičke funkcije.
Sa formalne tačke gledišta, leksička funkcija je funkcija čiji su argumenti neke riječi ili fraze datog jezika, a vrijednosti su skup riječi i fraza istog jezika. Istovremeno, od suštinskog su interesa i razmatraju se samo one leksičke funkcije koje imaju frazeološki povezana značenja - značenja koja su moguća s nekim argumentima, a nemoguća s drugima.

Drugim riječima, leksička funkcija je određeni semantički odnos, na primjer, "jednakost u značenju" (Syn), "suprotno u značenju" (Anti), itd. Neka postoji određeni broj leksičkih jedinica - riječi i fraze; tada ova leksička funkcija svakoj od ovih jedinica dodjeljuje skup leksičkih jedinica koje su u odgovarajućem semantičkom odnosu s izvornom jedinicom.

Značenja jedne leksičke funkcije iz različitih argumenata mogu se potpuno ili djelomično podudarati; Vrijednosti različitih funkcija iz istog argumenta također se mogu podudarati. Alternativni korelati uključeni u značenje date leksičke funkcije iz datog argumenta ne moraju uvijek i u bilo kojem kontekstu biti zamjenjivi. Mogu se razlikovati po stilskim karakteristikama, u svim vrstama kompatibilnosti, u gramatičkim uvjetima upotrebe i, konačno, čak i po značenju. Ovo posljednje je posebno važno naglasiti: različiti korelati ne moraju uvijek biti potpuno sinonimi; dovoljno je da njihova značenja imaju zajednički dio koji odgovara datoj leksičkoj funkciji, a razlike ne prelaze neke granice, odnosno nisu „previše značajne“.

Općenito, leksička funkcija nije određena za sve riječi i izraze. Prvo, neke funkcije su definirane samo za jedan ili drugi dio govora: na primjer, Oper, Func i Labor su zamislive samo za imenice. Drugo, ova ili ona funkcija se može definirati samo za riječi određene semantike: Magn - za riječi čije značenje dozvoljava gradaciju („više - manje“); Opera, Func i Labor su definirani samo za nazive situacija.

Treba imati na umu da čak i uz potpuno prikladan (u smislu njegovih sintaktičkih i semantičkih svojstava) argument, leksička funkcija možda nema značenje (u datom jeziku). Na primjer, sinonimi su, u principu, mogući za bilo koju riječ, ali samo neke ih imaju. To je zbog frazeološke prirode leksičkih funkcija.

Mora se još jednom naglasiti da su inicijalno leksičke funkcije uvedene izričito da opisuju leksičku kompatibilnost, a ne da predstavljaju značenje u opštem smislu, stoga ne treba sve tumačiti kao semantičke jedinice. Odnos između leksičkih funkcija i značenja je daleko od jasnog. Neke leksičke funkcije mogu tražiti status semantičkih elemenata, druge mogu imati nikakvo značenje, a druge mogu pokrivati ​​vrlo složeno značenje.

S naše tačke gledišta, govoriti o leksičkim funkcijama kao o „viševrijednim“ funkcijama nije sasvim ispravno i zgodno. Pogodnije je govoriti o leksičkim predikatima. Slijedi lista jednostavnih standardnih leksičkih „funkcija“ (ovdje će biti predstavljene u obliku predikata).

1. Syn (x, y), x, y – sinonimi.

2. Conv (x, y), x, y – konverzije.

3. Anti (x, y), x, y – antonimi.

4. Der (x, y), y je sintaktički derivat od x, odnosno y se poklapa sa x po značenju, ali pripada drugom dijelu govora:

S0 (x, y), y je imenica izvedena od x (x nije imenica);

A0 (x, y), y – pridjev izveden od x (x – nije pridjev);

Adv0 (x, y), y – prilog nastao od x (x – nije prilog);

V0 (x, y), y je glagol nastao od x (x nije glagol).

Drugim riječima, "x"y (Der (x, y) « S0 (x, y) Ú A0 (x, y) Ú Adv0 (x, y) Ú V0 (x, y)).

5. Gener (x, y), y – generalizirajući koncept u odnosu na koncept označen kao x (x = jagoda, y = bobica). Ovaj predikat ovisi o leksičkoj kompatibilnosti riječi u datom jeziku: ako su x i m riječi dva različita jezika koje imaju isto značenje, tada za Gener (x, y) i Gener (m, n), respektivno, y i n možda nemaju isto značenje.

Situacija je određena leksička refleksija (na datom jeziku) nekog dijela stvarnosti. Situacije označene pojedinim leksičkim jedinicama prirodnih jezika (leksema) imaju, po pravilu, od jedne do četiri semantičke komponente, odnosno semantičke aktante, označene velikim latiničnim slovima A, B, C, D. Istovremeno, svaki takva leksema se dubinski uspoređuje sintaktički aktanti su njeni zavisnici, koji odgovaraju subjektu i jakim objektima (ako je ova leksema ostvarena predikatskim glagolom). Duboki sintaktički aktanti numerisani su arapskim brojevima: 1, 2, 3, 4.

6. Si (x, y), i = 1, …, 4, y – tipično ime i-tog aktanta za x.

7. Sc (x, y), y – cirkonstanta, odnosno tipično ime sekundarne komponente date situacije x:

Sloc (x, y), y – tipično ime mjesta gdje se ova situacija x javlja; "gdje..." (x = bitka, y = polje (bitka));

Sinstr (x, y), y – tipičan naziv instrumenta koji se koristi u datoj situaciji x; “ono čime/kroz koji...” (x = borba, x = oružje (borbe));

Smod (x, y), y – tipičan naziv metode (način, karakter) implementacije date situacije x; “put...” (x = život, y = slika (života));

Sres (x, y), y – tipično ime rezultata date situacije; “šta izlazi” (x = kopija, y = kopija).

Drugim riječima, "x"y (Sc (x, y) « Sloc (x, y) Ú Sinstr (x, y) Ú Smod (x, y) Ú Sres (x, y)).

8. Korelativni predikati Znak (x, y), y – tipično ime jednog “komada”, jednog “kvanta” nekog x; Mult (x, y), y – tipično ime kolekcije, skupa.

9. Sigur (x, y), y – metafora za x (x = san, y = zagrljaj (san)).

10. Centr (x, y), y – tipična oznaka “centralnog” dijela objekta ili procesa.

11. Ai (x, y), i = 1, …, 4, y – tipična definicija i-tog aktanta prema njegovoj stvarnoj ulozi; “jedna koja...”; “onaj koji...”

12. Ablei (x, y), i = 1, …, 4, y – tipična definicija i-tog aktanta prema njegovoj potencijalnoj ulozi u situaciji; “onaj koji može...”; “onaj koji može...”

13. Magn0 (x, y) i Magni (x, y), i = 1, ..., 4, y označava “visok stepen”, “intenzitet” same situacije x (Magn0) ili njen i-ti aktant (Magni).

14. Ver (x, y), y – “ispravno”, “odgovara namjeni”, “kako treba” u odnosu na x.

15. Bon (x, y), y – „dobro“ u odnosu na x.

16. Advix (z, y), i = 1, ..., 4, x = A, B, C, D, y – naziv situacije kao definicija za glagol koji imenuje drugu situaciju:

AdviA (z, y), i = 1, ..., 4, y – riječ nastala od z, koja, zamjenom z u tekstu, zahtijeva pretvaranje prvog aktanta ovog z u vrh (umjesto z) ( x = prati, y = zajedno sa).

AdviB (z, y), i = 1, …, 4, y zahtijeva da drugi aktant z postane vrh (x = pogrešno, y = pogrešno).

17. Loc (x, y), y – prijedlog tipične lokalizacije (prostorne, vremenske ili apstraktne):

Locin (x, y), y – “statična” lokalizacija (x = Moskva, y = in);

Locad (x, y), y – prijedlog smjera (x = Moskva, y = do);

Locab (x, y), y – prijedlog uklanjanja (x = Moskva, zatim y = iz).

Drugim riječima, "x"y (Loc (x, y) « Locin (x, y) Ú Locad (x, y) Ú Locab (x, y)).

Ponekad se Loc(x,y) ne može jednoznačno odrediti (x = snijeg, y = on i y = in).

18. Copul (x, y), y – vezni glagol “biti”, “pojaviti se” (x = napadnut, y = napadnut).

19. Oper1 (x, y), Oper2 (x, y), y – glagol koji povezuje ime prvog (odnosno drugog) aktanta u ulozi subjekta sa nazivom situacije u ulozi prvog objekta ( ako je x = podrška, onda je y = obezbijediti za Oper1 (x, y) i y = pronaći ili zadovoljiti za Oper2 (x, y)).

20. Func0 (x, y), Func1 (x, y), Func2 (x, y), y – glagol koji ima naziv situacije kao subjekt x sa imenima aktanata (ako ih ima) kao objekt (x = kiša, y = ići).

21. Rad12 (x, y), y – glagol koji povezuje ime prvog aktanta u ulozi subjekta, sa imenom drugog aktanta u ulozi prvog objekta i sa nazivom situacije u uloga drugog objekta (x = nalog, y = nagrada; x = kazna, y = subjekt).

22. Causij (x, y), y – radnja aktanata „činiti tako da...“, „prouzrokovati“. U slučaju bez aktantnih indeksa Caus (x, y), x je ime neučesnika u situaciji (x = zločin, y = guranje). Pojavljuje se odvojeno samo kod glagola; u drugim slučajevima je dio složenih parametara.

23. Incep (x, y), y – “za početak”. Svojstva su ista kao Causij (x, y).

24. Perf (x, y), y – „savršeno“, y nosi završetak radnje, postizanje njene prirodne granice. Perf (x, y) nema poseban nezavisni izraz na ruskom; Obično se ovaj predikat procjenjuje na istinito ako je y u savršenom obliku (x = čitanje, y = čitanje).

25. Rezultat (x, y), y – “rezultat”, odnosno y – “stanje kao rezultat...”; koristi se za nesavršene oblike (x = leći, y = leći za Perf(x, y), y = ležati za Rezultat(x, y)).

26. Činjenica j (x, y), y – “ostvariti”, “ispuniti”. Nadskript (rimski brojevi) predstavlja, ako je potrebno, stepen implementacije podrazumijevanog zahtjeva, s nižim indeksom koji je dodijeljen nižem stepenu (ako je x = zamka i j = I, onda y = okidač; ako je j = II, onda y = uhvatiti).

27. Real j1,2(x, y), y – “realizirati”, “ispuniti zahtjev” sadržan u x. Indeks j ima isto značenje kao i gore – stepen završenosti; indeks označava duboki sintaksički aktant koji ispunjava zahtjev (x = dug (monetarni), y = potvrda za Real I1,2(x, y), y = otplata za Real II1,2(x, y)).

28. Destr (x, y), y – tipičan naziv za “agresivnu” akciju (x = osa, y = ubodi).

29. Kap (x, y), y – “šef” (x = fakultet, y = dekan).

30. Oprema (x, y), y – “osoblje” (x = stanovništvo, y = država).

31. Dokument (x, y), y – “dokument”:

Docres (x, y), y – “dokument koji je rezultat”; “utjelovljenje” (x = izvještaj, y = izvještaj);

Docperm (x, y), y – „dokument za pravo...” (x = voz, y = (putna) karta za Docperm Oper2 (x, y));

Doccert (x, y), y – “dokument koji potvrđuje...” (x = visoko obrazovanje, y = diploma).

Drugim riječima, "x"y (Doc (x, y) « Docres (x, y) Ú Docperm (x, y) Ú Doccert (x, y)).

Pored gore navedenih jednostavnih leksičkih predikata, njihove kombinacije - složeni predikati - mogu se koristiti za opisivanje leksičke kompatibilnosti:

AntiReal2 (x, y): pali na ispitu/pali na ispitu;

IncepOper2 (x, y): steći popularnost, pasti u očaj;

IncepOper2 (x, y): pustiti u prodaju, biti na udaru;

CausOper2 (x, y): staviti pod kontrolu, staviti u promet.

Kao što je ranije navedeno, u općem slučaju, leksička funkcija nije određena za sve riječi i izraze. Funkcija se može definirati samo za riječi određene semantike. Na primjer, Cap and Equip - za riječi čije značenje podrazumijeva prisustvo „šefa“ i „osoblje“, odnosno za nazive institucija i organizacija u najširem smislu; Realni – za riječi čije značenje uključuje komponentu „zahtevati“ („potreba“) itd.

Ako se leksičke funkcije predstavljaju kao predikati, nema poteškoća.
U slučajevima kada leksičke funkcije nisu definirane, njihovi odgovarajući predikati će biti lažni.

Posebna uloga u proučavanju semantike u pristupu I.A. Melchuka igra valencija riječi, odnosno sposobnost riječi da stupe u vezu s drugim riječima. Riječi koje definiraju situaciju imaju valencije. To su sve glagoli, neke imenice (glagolske), pridjevi (koji označavaju poređenje: više, manje, više, niže), neki prijedlozi i prilozi.

Postoje dvije vrste valencija riječi: sintaktičke i semantičke. Iako je ova podjela ponekad prilično proizvoljna. Semantičke valencije određuju se leksičkom analizom situacije određene određenom riječju. Navedimo primjer s riječju rent ili rent. A daje u zakup C znači da za određenu naknadu D, osoba A stiče od druge osobe B pravo da upravlja imovinom C na određeni vremenski period T. Stoga je bitno za situaciju iznajmljivanja
su sljedeći „učesnici” ili semantički aktanti: subjekt zakupa (onaj koji iznajmljuje), prvi objekt zakupa (ono što se iznajmljuje), suprotna strana (onaj od koga iznajmljuju), drugi objekt (ono što se iznajmljuje). plaćanje) i rok.

Ovi aktanti su neophodni, jer eliminacija bilo kojeg od njih mijenja smisao situacije. Na primjer, ako uklonite pojam, situacija najma se transformira u situaciju kupovine i prodaje. S druge strane, ovi akti su dovoljni, jer u situaciji iznajmljivanja ne postoji zahtjev da se naznači iz kog razloga, gdje, kada i u koju svrhu je izvršeno. Iako su odgovarajući oblici riječi gramatički vezani uz glagol rent.

Drugim riječima, semantička valencija je određena brojem semantičkih aktanata. Dakle, glagol rent ima semantičku valenciju 5, budući da ima 5 semantičkih aktanata. Formalno, ova situacija se može napisati kao predikat P (x1, x2, x3, x4, x5), gdje je x1 „ko“, x2 je „šta“, x3 je „ko ima“, x4 je „plaćanje“, x5 je "termin".

Ne mogu se svi semantički aktanti definirati u rečenici; neki se jednostavno ne spominju ili uopće nemaju sintaktički izraz. Sintaktičke valencije određene su brojem sintaksičkih aktanata koji su direktno predstavljeni u tekstu (odnosno subjekata i objekata pridruženih glagolu) i zavise od konteksta.

Na primjer, semantička valencija glagola promašiti je 4, budući da ima 4 aktanta: ko (činilac), u šta/na šta (meta), iz čega (oružje - izborno) i sa čime (organ, sredstvo). Ali u većini konteksta samo je jedna valentnost izražena sintaktički, na primjer, u rečenici „Dugo je ciljao, ali je promašio“. Međutim, fraza "Promašio je prozor s flašom" nije sasvim tačna.

Sa formalne tačke gledišta, imamo konstrukciju opisanu u nastavku. Da ne bismo povezali poseban predikat sa svakim glagolom (i drugim riječima), razmotrit ćemo predikat čija je dimenzija veća za 1: P val(y, x1, x2, ..., xn), dok će y biti sama riječ, a x1, x2, ..., xn – njena valencija. Za razlikovanje između sintaktičkih i semantičkih aktanata, višeindeksi se mogu koristiti za označavanje aktanata navedenih u tekstu. Unos znači da su specificirani aktanti i1, i2, …, ik.
Konkretno, ako su dati svi aktanti, onda dobijamo. Neke varijante (skupova sa više indeksa) možda neće biti važeće na jeziku. Ako je skup i1, i2, …, ik dopustiv, onda vrijedi implikacija

Štaviše, ako postoje dva skupa važećih više indeksa I , tako da (i1, i2, …, ik) Ê (i1", i2", ..., je"), onda vrijedi slična implikacija

Eksplanatorni kombinatorni rečnik jedan je od glavnih teorijskih izuma I.A. Melchuk.
U određenom smislu, jezički model koji je predložio I.A. Melchuk, predstavlja jezik kao skup rječničkih natuknica sa ogromnom količinom različitih informacija; Kod takvog rječnika, gramatička pravila igraju prilično sporednu ulogu. Eksplanatorni kombinatorni rečnik odražava, pre svega, netrivijalnu kompatibilnost leksema. O jeziku možemo razmišljati kao o vrlo velikom modelu u kojem su definirani leksički predikati koji djeluju na gore opisan način.

Zapis u eksplanatornom kombinatornom rječniku nosi informaciju o valentnostima određene riječi, što je istinito ne samo u njenim okvirima, već iu okviru cijelog jezika u cjelini. Valencija odgovara predikatu, gdje su semantički aktanti riječi cx, n je valencija riječi cx. Na primjer, u rečenici Petya čita knjigu, cx = čitam, n = 2: y1 = Petya, y2 = knjiga, odnosno možemo uslovno napisati P val (cx, y1, y2) = 1.

Skup natuknica u eksplanatorno-kombinatornom rječniku može se smatrati određenim podmodelom originalnog modela, a to je jezik. Leksički predikati, koji su sada definirani na užem skupu, djelovat će slično.

Označimo sa F skup pravilno konstruisanih fraza prirodnog jezika L i j O F – fraza iz ovog skupa; – riječ cx je uključena u frazu j, a cx O L. Neka je cx imenica ili pridjev. Označimo sa Predikatom skup predikata definiranih na L. Jedan od elemenata ovog skupa je prethodno uvedeni valentni predikat P val (cx, y1, …, yn).

Slično, možemo pretpostaviti da postoje i drugi predikati:

– predikat roda riječi Rod, gdje je O (g1, g2, g3), g1 = ženski; g2 = muško; g3 = prosječno;

– predikat predloga, gde je Î (pr1, ..., prk) – skup predloga u kombinaciji sa datom rečju;

– padežni predikat Padeži, pri čemu – padež riječi cx; za različite jezike broj padeža je različit: na primjer, u ruskom jeziku postoji šest padeža, dakle Î (case1, case2, case3, case4, case5, case6), case1 = im.p.; slučaj2 = rod; case3 = datum; case4 = vin.p.; case5 = kreativni; case6 = klauzula; u njemačkom postoje četiri slučaja, tako da Î (slučaj1, slučaj2, slučaj 3, slučaj4), gdje je slučaj1 = Nom; case2 = Gen; case3 = Datum; case4 = Akk.

Rječnički unos eksplanatorno-kombinatornog rječnika sadrži glavnu riječ, leksičke predikate povezane s njom i informacije o valentnosti ove riječi. Informacija o valenciji uključuje broj koji označava broj aktanata, a za svaki aktant - naznaku u kojim se padežima i s kojim prijedlozima koriste riječi koje odgovaraju ovom aktantu. U nekim slučajevima može biti naznačen i rod riječi.

Gore navedeno može biti predstavljeno skupom predikata u obliku

gdje je xi slobodna varijabla koja odgovara i-tom aktantu.

Teorija „Značenje Û teksta“ kreirana je od samog početka za upotrebu u primijenjenim problemima automatskog prevođenja. Prema I.A. Melchuk je uz njegovu pomoć, za razliku od tradicionalnih nerigoroznih teorija, trebalo osigurati izgradnju „radnog“ modela jezika. Teorija „značenja Û teksta“ je zaista korišćena u nekim sistemima mašinskog prevođenja razvijenim u Rusiji, posebno u englesko-ruskom sistemu automatskog prevođenja ETAP, koji je kreirala grupa koju je predvodio Yu.D. Apresyan. Svi ovi sistemi su eksperimentalni, odnosno njihova industrijska upotreba nije moguća. Iako sadrže mnogo jezički korisnih informacija, sve u svemu, nijedna od njih još nije donijela napredak u kvaliteti prijevoda.

Po mišljenju autora, glavna vrijedna ideja ove teorije je da su značenja riječi povezana ne direktno s okolnom stvarnošću, već s idejama izvornog govornika o ovoj stvarnosti (ponekad se nazivaju konceptima). Priroda koncepata zavisi od specifične kulture; sistem pojmova svakog jezika formira takozvanu “naivnu sliku svijeta”, koja se u mnogim detaljima može razlikovati od “naučne” slike svijeta, koja je univerzalna. Zadatak semantičke analize vokabulara u teoriji “Značenje Û teksta” je upravo otkrivanje “naivne slike svijeta” i opis njenih glavnih kategorija. Drugim riječima, važna uloga ove teorije je da opiše ne samo objektivnu, već i subjektivnu sliku svijeta.

Uprkos činjenici da je interesovanje za teoriju I.A. Melčuk blijedi, označavanje sintaksičkog korpusa „Nacionalni korpus ruskog jezika“ vrši jezički procesor ETAP-3, zasnovan na principima teorije „Značenje Û Tekst“.

Kao što je već pomenuto, Yu.D. je učestvovao u razvoju ETAP procesora. Apresyan. Njegove ideje se donekle razlikuju od ideja I.A. Melchuk. Centralno mjesto u istraživanju Yu.D. Apresyan je okupiran novom vrstom rječnika sinonima. Za ovaj rečnik razvijena je detaljna šema za opisivanje sinonimnih serija, gde je svaki element serije okarakterisan u smislu semantike, sintakse, kompatibilnosti i drugih svojstava. Rječnik prikuplja i sažima maksimalnu količinu informacija o jezičkom ponašanju ruskih sinonima.

Konceptualni dijagrami zavisnosti

Konceptualna i analiza slučaja

U fazi morfološke i semantičko-sintaksičke analize tekstova glavne jedinice koje označavaju pojmove su riječi. U pravilu se vjeruje da se značenje fraza i fraza može izraziti kroz značenja riječi koje su u njima sastavljene. Samo ograničen broj stabilnih fraza – idioma – smatra se izuzecima. Ovaj pristup se zasniva na pretpostavci da se kombinacije riječi koje se nalaze u jeziku mogu podijeliti na “slobodne” i “neslobodne”.

Drugi pristup se zasniva na činjenici da su najstabilnije (nedjeljive) jedinice značenja kategorije i pojmovi, koji se ne sastoje od nezavisnih riječi, već od fraza. Takve kategorije i koncepti nazivaju se konceptima. Ovim pristupom „neslobodne“ fraze nisu samo idiomatski izrazi, već i sve stabilne frazeološke jedinice jezika i govora (u razvijenim jezicima ih ima na stotine miliona).

Ideja konceptualne analize kao sastavne komponente semantičke analize nalazi se i u studijama V.Sh. Rubaškin i D.G. Lahuti. U ovom dijelu ukratko se izlažu pogledi na pitanje koje probleme treba rješavati pomoću konceptualne semantičke analize.

Unos semantičke komponente mora primiti sintaktički označen tekst. Označeni tekst treba da sadrži različite informacije: identifikatore pojmova koji odgovaraju riječi (terminu); indikacija sintaksičkog hosta (svi alternativni hostovi) i tipa sintaksičke veze, itd.

Prije prelaska na semantičku komponentu također se moraju identificirati pojmovi i fraze, objediniti prikaz numeričkih informacija, identificirati vlastita imena itd. U stvarnim projektima, svi ovi problemi se rješavaju s različitim stupnjevima aproksimacije. Može se smatrati da je stručna zajednica postigla saglasnost najmanje oko sljedećih pitanja.

Semantička analiza, sa stanovišta korištenih metoda i sredstava, treba da obuhvati dvije faze: a) fazu interpretacije gramatički izraženih (sintaktičkih i anaforičnih) veza i b) fazu prepoznavanja veza koje nemaju gramatički izraz. .

Dvosmislenosti treba rješavati samim procesom analize – prema kriteriju stepena semantičkog zadovoljstva rezultata dobivenog u svakoj opciji.

Ključna tačka sistema semantičke analize je efikasna podrška rečniku.
U tom smislu, svaki sistem semantičke analize je orijentisan na tezaurus. Postupci semantičke analize u svim slučajevima, bez izuzetka, zasnovani su na funkcionalnosti konceptualnog rečnika. Rječnik koji podržava semantičku analizu mora raditi sa značenjima i, prema tome, opisivati ​​svojstva i odnose pojmova, a ne riječi. Ovo je konceptualni rečnik. U određenom smislu, ulogu konceptualnog rječnika mogu obavljati semantičke mreže, koje su opisane u sljedećem odjeljku.

U semantičkom interpretatoru, prije svega, potrebno je precizirati tipove semantičkih odnosa koji se razlikuju u tekstu: uloga (odnosi prema valentnosti predikata), subjekt-asocijativni (odnosi između objekata, procesa, značajni u subjektu). oblast - biti dio, imati mjesto, biti namijenjen, biti glavni grad itd.) itd.

Prihvaćeni su sljedeći osnovni postulati za tumačenje sintaktičkih veza.

1. Tip semantičkog odnosa koji se uspostavlja određen je semantičkim klasama i
u određenim slučajevima detaljnije semantičke karakteristike sintaktičkih „gospodar“ i „sluga“.

2. Prijedlozi se ne smatraju nezavisnim objektom tumačenja, već dodatnom (semantičko-gramatičkom) karakteristikom veze između sintaksičkog „vlasnika“ prijedloga i značajne riječi koju on kontrolira.

3. Da bi razriješio leksičku i sintaksičku homonimiju koju je zabilježio parser, semantički interpretator koristi sistem empirijski utvrđenih preferencija. Da bi se olakšalo upoređivanje preferencija opcija tumačenja, dodijeljeni su im numerički rangovi. Na nivou tipova semantičkih odnosa uspostavlja se sledeći redosled preferencija (redoslijed navođenja odgovara smanjenju prioriteta odnosa):

– funkcionalne veze i veze koje utvrđuju činjenicu semantičke redundancije;

– veze uloga, definisane kao obavezne, u prisustvu semantički konzistentnog aktanta;

– koreferentne veze;

– veze uloga, definisane kao opcione;

– navedene subjekt-asocijativne veze;

– subjekt-asocijativne veze nisu specificirane.

Specificirane sintaktičke veze su one koje interpretator može leksikalizirati sa specifičnom relacijom u predmetnom području (lučki objekti ® strukture smještene u luci); Prema tome, nespecificirane veze su one za koje tumač ne može ponuditi takvu specifikaciju i koje se tumače općim konceptom povezanog.

Ako se otkrije sintaktička homonimija koordinirajućih veza, preferencije se određuju stepenom konzistentnosti semantičkih karakteristika učesnika u sintaksičkoj vezi.

Leksičke i lokalne sintaktičke nejasnoće (prisustvo alternativnih domaćina za riječ) obrađuju se u jednom mehanizmu nabrajanja. Globalne opcije za raščlanjivanje rečenice razmatraju se u mehanizmu nabrajanja sljedećeg nivoa. U ovom slučaju se upoređuju ukupne težine interpretacije svih veza u rečenici.

Prilikom uspostavljanja različitih vrsta odnosa, tumačenje je određeno sljedećim odredbama.

Prilikom uspostavljanja odnosa uloga značajne su sljedeće gramatičke karakteristike učesnika u sintaksičkoj vezi i moraju se uzeti u obzir (u odnosu na ruski jezik):

– semantičko-sintaksički tip predikata (karakteristika rječnika);

– gramatički oblik predikata;

– aktantski padež, mogućnost pridjevskog oblika za aktant prema datoj valentnosti;

– mogućnost predloške kontrole aktanta i sposobnost prijedloga koji formira sintaksičku vezu da izrazi odnos prema datoj valentnosti; informacije o sposobnosti prijedloga da služi kao indikator uloge za datu valenciju pohranjene su u rječniku opisa prijedloga.

Operativno, postupak određivanja moguće uloge aktanta određen je gramatikom veza uloga, uspostavljajući korespondenciju tipa

(Rf, GFP, TSEMU) ® VAL,

gdje je Rf naziv sintaksičke veze; GFP – gramatički oblik predikata; TSEMU – semantičko-sintaktički tip predikata; VAL je naziv moguće valencije ili referenca na funkciju uloge prijedloga.

Zatim se provjerava usklađenost semantičkih karakteristika aktanta sa semantičkim uvjetom popunjavanja valencije predikata (provjerava se volumetrijska kompatibilnost odgovarajućeg para koncepata).

Za uspostavljanje koreferentne relacije neophodni su i dovoljni sledeći uslovi:

– “gospodar” i “sluga” pripadaju semantičkoj kategoriji Objekt;

– pojmovi koji odgovaraju pojmovima „gospodar” i „sluga” su u odnosu volumetrijske kompatibilnosti;

– u slučaju predloške veze provjerava se sposobnost datog prijedloga da izrazi koreferentni odnos.

Za uspostavljanje određenih subjekt-asocijativnih odnosa neophodni su i dovoljni sledeći uslovi:

– pojmovi koji odgovaraju pojmovima „gospodar” i „sluga” su u odnosu volumetrijske nespojivosti, ili (ako su kompatibilni) ovi pojmovi su sintaktički povezani preko predloga koji nije u stanju da izrazi koreferentni odnos;

– uz par pojmova “gospodar – sluga” leksički je povezana neka subjektna relacija
(<автомобиль, кузов>® imaju dio) i/ili (ako je veza predloška) odnos subjekta je povezan s prijedlogom i padežom.

Za uspostavljanje nespecificiranih subjekt-asocijativnih odnosa neophodna je i dovoljna istinitost prvog i netačnost drugog uslova.

Analiza "po uzorku" (precedentna analiza), zasnovana na korištenju korpusa unaprijed označenih tekstova, postaje sve važnija. Razumno izgrađen sistem analize treba da obezbedi ne samo izvlačenje znanja iz konkretnog teksta, već i akumulaciju rezultata na sintaksičkom i semantičkom nivou – za njihovu dalju upotrebu kao presedan.

Jedan od najobimnijih i najznačajnijih projekata koji se trenutno realizuje je stvaranje Nacionalnog korpusa ruskog jezika. U njemu učestvuje velika grupa lingvista iz Moskve, Sankt Peterburga, Kazanja, Voronježa, Saratova i drugih naučnih centara Rusije.

Nacionalni korpus ruskog jezika je zbirka elektronskih tekstova opremljenih opsežnim lingvističkim i metatekstualnim informacijama. Korpus predstavlja čitavu raznolikost stilova, žanrova i varijanti ruskog jezika 19.–20. Nacionalni korpus ruskog jezika trenutno koristi pet tipova označavanja: metatekstualni, morfološki (flektivni), sintaktički, akcenatski i semantički. Nećemo detaljno razmatrati sve dostupne vrste markupa; fokusirat ćemo se samo na semantičko označavanje.

Uz semantičko označavanje, većini riječi u tekstu se pripisuje jedna ili više semantičkih i riječotvornih osobina, na primjer, "osoba", "supstancija", "prostor", "brzina", "kretanje" itd. Označavanje teksta se prenosi automatski se izbacuje pomoću programa Semmarkup (autor A.E. Polyakov) u skladu sa semantičkim rječnikom korpusa. Budući da je ručna obrada semantički označenih tekstova vrlo naporna, semantička homonimija u korpusu nije uklonjena: višeznačnim riječima se dodjeljuje više alternativnih skupova semantičkih karakteristika.

Semantička oznaka je zasnovana na klasifikacionom sistemu ruskog rečnika usvojenom u bazi podataka Leksikograf, koja se razvija od 1992. godine u Odeljenju za lingvistička istraživanja VINITI RAS pod rukovodstvom E.V. Paducheva i E.V. Rakhilina. Za korpus je značajno proširen vokabular, proširen sastav i poboljšana struktura semantičkih klasa, a dodane su i karakteristike tvorbe riječi.

Rečnik semantičkog rečnika zasniva se na morfološkom rečniku sistema „Biranje“ (ukupnog volumena od oko 120 hiljada reči), koji je proširenje gramatičkog rečnika ruskog jezika A.A. Zaliznyak. Trenutna verzija semantičkog rječnika uključuje riječi značajnih dijelova govora: imenice, pridjeve, brojeve, zamjenice, glagole i priloge.

Leksičko-semantičke informacije koje se pripisuju proizvoljnoj riječi u tekstu sastoje se od tri grupe oznaka:

– kategorija (na primjer, vlastita imenica, povratna zamjenica);

– stvarne leksičko-semantičke karakteristike (npr. tematska klasa lekseme, znaci uzročnosti, ocjene);

– derivacijske (rječotvorne) karakteristike (na primjer, „deminutiv“, „pridjevski prilog“).

Leksičko-semantičke informacije imaju različitu strukturu za različite dijelove govora. Osim toga, svaka od kategorija imenica – objektivne, neobjektivne i vlastite imenice – ima svoju strukturu imenica.

Stvarne leksičko-semantičke oznake grupisane su u sljedeća polja:

– taksonomija (tematska klasa leksema) – za imenice, prideve, glagole i priloge;

– mereologija (označavanje odnosa “dio – cjelina”, “element – ​​skup”) – za objektivne i neobjektivne nazive;

– topologija (topološki status označenog objekta) – za nazive subjekata;

– uzročnost – za glagole;

– status službe – za glagole;

– ocjenjivanje – za objektivne i neobjektivne nazive, prideve i priloge.

Tematske klase glagola

Studije E.V. također se smatraju posebnim smjerom u proučavanju semantike ruskog jezika. Paducheva. Najzanimljiviji su radovi koji se tiču ​​tematskih časova ruskih glagola. Tematska klasa kombinuje riječi sa zajedničkom semantičkom komponentom koja je centralna za njihovu semantičku strukturu. Tu su, na primjer, fazni glagoli, glagoli percepcije, glagoli znanja, glagoli emocija, glagoli odlučivanja, govornih radnji, pokreta, glasovni glagoli, egzistencijalni glagoli itd.

Riječi iste tematske klase imaju neku netrivijalnu zajedničku komponentu u tumačenju. Tematska nastava je važna iz više razloga. Prvo, tematska klasa često ima karakteristične manifestacije u sintaksi—na primjer, klasa obično ima karakterističnog člana.
Drugo, članovi iste tematske klase imaju tendenciju da imaju isti skup semantičkih derivata, odnosno pojmova zavisnih od njega.

Članak pruža najpotpuniju listu značenja privatnog aspekta nesvršenih glagola. Razlikuju se sljedeće vrste značenja: stvarno-dugotrajno (proces ili stanje traje u vrijeme posmatranja); procesno (odnosno, jednostavno u toku); konstantno-kontinuirano (značenje konstantnog svojstva ili odnosa); uobičajeno (značenje uobičajene, odnosno opšteprihvaćene, ponovljene radnje ili događaja); potencijal; višestruki (ali ne uobičajeni ili potencijalni); opšte činjenično neograničeno (značenje zaustavljenog stanja ili neograničenog procesa); opšta činjenična efektivnost (radnja je dostigla svoju granicu); generalno činjenično dvosmjerno (rezultat je postignut, ali je poništen suprotno usmjerenom radnjom); općenito činjenično nedjelotvoran (nije poznato da li je radnja dostigla svoj limit).

U radu se analiziraju predikatska imena, odnosno imenice nastale od glagola i prideva, kao što su borba, dolazak, očaj, škrtost. Kao rezultat, moguće je razlikovati procese, događaje, stanja i svojstva.

Na primjer, nazivi procesa su prihvatljivi u kontekstu glagola sa značenjem „nastaviti“, „ići“, odnosno „odviti se“ (vodi se razgovor, vrši se štrajk, vrši se ažuriranje mjesto). Posebna vrsta procesa su trajne radnje, odnosno svrsishodni procesi sa aktivnim subjektom, kao što su tuča, provjeravanje, ali ne kao što su plivanje, bježanje, pobuna, hodanje, spavanje, pušenje. Nazivi radnji su prihvatljivi u kontekstu glagola sa značenjem “proizvoditi”, “voditi”: nadzor je vršila grupa agenata; vrše prijem (zamjena, selekcija); mi istražujemo.

Svi nazivi procesa koriste se u kontekstu faznih glagola sa značenjem “početak”, “kraj”, “nastavak”: borba je počela (kiša, bitka); okončan progon neistomišljenika; Iskrcavanje (opsada) se nastavlja. Nazivi radnji su prihvatljivi u kontekstu faznih glagola sa značenjem “početak”, “kraj”, “nastavak”: ušao u pregovore; završio provjeru bilježnica; prekinuto čitanje; pokrenut, pokrenut, zaustavljen (izdavanje). Kontekst faznog glagola je dijagnostika naziva procesa, za razliku od naziva događaja.

Nazivi događaja koriste se u kontekstu glagola sa značenjem „dogodilo se“, „dogodilo se“: dogodio se potres. Događaji se razlikuju od procesa po tome što imaju retrospektivnog posmatrača. Posmatrač procesa je sinhroni, dakle, ako imamo proces, onda je glagol nesvršen, a ako imamo događaj, onda je savršen.

Izostavićemo mnoge druge detalje u vezi sa razlikama između procesa, događaja, stanja i svojstava, osim da napomenemo da potencijal primene ovih studija tek treba da se otkrije.

Ispod je lista glagola percepcije, koje je označio E.V. Padučeva kao jedan od najtemeljnije proučavanih tematskih časova. Čini se da je za utvrđivanje pripadnosti glagola tematskoj klasi percepcija dovoljno osigurati da njegova semantička formula uključuje komponentu „opažanja“. Međutim, nije sve tako jednostavno. Činjenica je da se perceptivna komponenta lako uključuje u semantiku glagola različitih klasa. Prava percepcija se uliva u mentalnu percepciju.

1. Glagoli kretanja i stanja koji pretpostavljaju posmatrača:

a) glagoli uočenog kretanja: bljesnuti, bljesnuti, pojaviti se, skliznuti;

b) glagoli posmatranog stanja: pobijeliti, stršiti, razboj; raširiti, stršiti, izbiti, raširiti se, otvoriti se, izvesti;

c) glagoli emisije svjetlosti, mirisa, zvuka: sjaj, treperenje, sjaj, miris, smrad, zvuk.

2. Glagol čuti sugeriše posmatraču (kao u zvono zvono), ali i sledeći glagoli imaju perceptivnu komponentu: zastoj, prigušiti, zasjeniti, ućutati, ućutati, stišati, spojiti (kao u tunici i sivim pantalonama skoro stopljeni sa zemljom).

3. Subjekt percepcije (ili posmatrač) je obavezan učesnik u situacijama izraženim uzročnim glagolima: izraziti, pokazati (pokazao mi je svoju naklonost); istaknuti, otkriti, zasjeniti, istaknuti, uhvatiti, nejasno, izložiti, označiti (granice), otvoriti, označiti, prikazati; i njihovi dekauzativi (izraziti, otkriti, izdvojiti, utisnuti, izložiti, identificirati, otvoriti).

4. Postoji mnogo glagola koji opisuju identifikaciju, što zahtijeva učešće osjetila: identificirati, razlikovati, prepoznati, razlikovati, identificirati, razlikovati (ocrtati), prepoznati, razabrati (kao u Ne razumijem drugo slovo).

5. Mnogi glagoli uključuju perceptivnu komponentu, ali označavaju vrlo specifičnu radnju ili aktivnost, kojoj je glavni cilj, a ne učešće percepcije u njegovom postizanju: pregledati („izvršiti inspekciju“), registrirati, pretražiti , pronaći, pronaći, tražiti, istražiti, prikazati, ocrtati, pratiti, pratiti, pratiti, čuvati, čekati, osvijetliti, sakriti, sakriti, špijunirati.

6. Svaki glagol za prenošenje i primanje informacija, na primjer, pisati ili čitati, pretpostavlja prisustvo signala koji mora biti percipiran osjetilima.

7. Glagoli show i hide, budući da njihova interpretacija uključuje perceptivnu komponentu, takođe se mogu klasifikovati kao glagoli percepcije.

8. Glagoli percepcije uključuju, između ostalog, slijepi - oslijepiti (i slijepi u jednom od značenja). Oni opisuju gubitak organa vida, što rezultira gubitkom sposobnosti da se vidi zauvijek. Međutim, ovo ne uključuje glagol probuditi se, koji označava privremeni gubitak sposobnosti percepcije s njenim kasnijim vraćanjem.

9. Neki stilski obojeni glagoli percepcije: buljiti, buljiti, hatch, buljiti, buljiti, vidjeti, uhvatiti, upaliti.

10. Tematska klasifikacija je vođena izvornim značenjima riječi. U međuvremenu, mnogi glagoli imaju perceptivno značenje kao derivat; posebno, bdjeti, suočiti se (problem), prodrijeti (tajna), progovoriti. Na primjer, bijele zgrade su iznenada izašle iz mraka.

11. Druge slične riječi u kojima je značenje percepcije izvedeno ili kontekstualno određeno, kao što su baciti (pogledati, pogledati), jurnuti (u oči), okrenuti (pogled, pažnja), protrčati (oči), blještati (pogled) , slajd (pogledaj).

12. Glagoli označenih načina radnje:

a) početak: pokazivati ​​se, pobijeliti, zvučati;

b) fifinitivi: gledati, slušati i špijunirati, prisluškivati;

c) zasićenje: dovoljno gledati, dovoljno se diviti, dovoljno slušati;

d) glagoli potpune apsorpcije u radnji: gledati - gledati, gledati - gledati;

e) posebno efektno: pazi - pazi, prati - prati, prati - prati;

f) povremeno omekšavanje: gledaj, gledaj; samoaktivan: pogledajte.

Glagoli percepcije, kao i drugi tematski razredi, imaju svoje modele semantičke derivacije, karakteristične za ovu klasu.

13. Karakteristična je semantička tranzicija – od percepcije do mentalnog značenja. Izvedeno mentalno značenje razvija se, na primjer, u glagolima vidjeti, pogledati, primijetiti, razmotriti (kao nagovještaj; a mi razmatramo vašu rečenicu), osjetiti, činiti se, otkriti, čuti, zamisliti, susresti, pratiti, pojaviti; predstavi se, vidimo se (ista dvosmislenost za imenicu look):

a) Sa pulta je imao jasan pogled na trem kluba (vizuelno značenje);

b) Ja to vidim ovako (mentalno značenje).

14. Glagol svjedočiti etimološki sugerira viziju, ali u kontekstu Ovo svjedoči o njegovom izuzetnom talentu ima mentalno značenje; Baciti svetlo znači „učiniti jasnijim“, iako je svetlost potrebna da bi se videlo. Glagol anticipirati generalno je izgubio komponentu povezanu sa percepcijom ukusa i postao je mentalni.

15. Izvedeno mentalno značenje javlja se i u kauzativnim glagolima. Dakle, pokazati je glagol percepcije, ali može imati i značenje „dokazati“, mentalno. Zanimljivo je da među izvedenicama od see postoje i glagoli znanja i glagoli mišljenja:

a) Vidim da ćutiš (znanje);

b) on to vidi kao prepreku (mišljenje).

16. Glagol pojaviti kombinuje perceptivno značenje (Nije bio tu) sa mentalnim (Ispostavilo se da je zdrav).

17. Izvedeno značenje govora razvija glagol primijetiti; manifestuje se u kombinaciji s prilozima: pravilno si primijetio („pravilno si rekao”).

18. Glagole slušati, slušati, poslušati, paziti karakteriše višeznačnost „opažiti“ – „podvrgnuti se“.

19. Semantička tranzicija look ® relate je takođe regularna, odnosno ponovljena: gledam jednostavno (jednostavno tretiram); zatvoriti oči (prepustiti se); uprkos (bez obzira na).

20. Višeznačnost look ® relate je karakteristična za glagol škiljiti: a) (pogledati postrance, sa strane); b) (pogledati iskosa, odnositi se sa sumnjom, izraziti sumnjičav stav pogledom).

21. Prijelaz na vidjeti ® imati predstavljen je primjerima naći, izgubiti.

22. Prelaz iz percepcije u međuljudski kontakt bilježi se kod glagola sresti se, gledati (u svjetlo), vidjeti se.

23. Značenje viđenja može izbledeti do ideje jednostavnog kontakta sa objektom, odnosno biti na istom mestu (Ovi zidovi su videli mnogo; Krimu će uvek biti drago da vas vidi).

24. Glagole pojaviti i nestati karakteriše višeznačnost biti vidljiv – postojati. Slična je dvosmislenost u denotate – biti označen; izgubiti se: na primjer, Staza se izgubila u žbunju (prestala da se vidi) i živost pokreta se postepeno gubila (prestala da postoji); savršeni oblik ima ponor (iako nesavršeni oblik nestati znači samo ne biti vidljiv: gdje si bio?). Matematičkim jezikom, ako X postoji, onda X postoji.

25. Semantički koncept percepcije često koegzistira s pokretom: sudariti se, spotaknuti, naletjeti, naletjeti; biti uhvaćen (imam belu pečurku).

Posljedica kretanja može, naprotiv, biti napuštanje vidnog polja, kao kod skrivanja, bježanja, ozljeđivanja.

Zanimljivo je da je za glagole koji izražavaju glavne tipove percepcije – vid, sluh, miris, dodir, ukus – moguće identificirati jednu paradigmu semantičkih izvedenica izvorne lekseme, koja će biti suštinski ista za mnoge jezike, što ukazuje na drevnost ovog vokabulara i dizajna podataka.

Bitna je u ovom pristupu ideja podjele jezičkih koncepata u određene semantičke grupe, uzimajući u obzir činjenicu da ti koncepti imaju neku netrivijalnu zajedničku semantičku komponentu. Elementi takvih grupa imaju tendenciju da imaju isti skup zavisnih koncepata. Rječnik koji podržava semantičku analizu mora raditi sa značenjima i, prema tome, opisivati ​​svojstva i odnose pojmova, a ne riječi. Ostaje pitanje kako pravilno strukturirati i prezentirati informacije u takvim rječnicima kako bi pretraživanje po njima bilo zgodno i brzo, a uz to je moguće uzeti u obzir promjene u prirodnom jeziku (nestanak starih i nastanak novih pojmova). ).

Kada se raspravlja o problemima semantike, često se pominje princip kompozicije. On tvrdi da je značenje složenog izraza određeno značenjima njegovih sastavnih dijelova i pravilima koja se primjenjuju na njihovu kombinaciju. Budući da se rečenica sastoji od riječi, ispada da se njeno značenje može predstaviti skupom značenja riječi uključenih u nju. Ali to nije tako jednostavno. Značenje rečenice se također oslanja na red riječi, frazu i odnose između riječi u rečenici, odnosno uzima u obzir sintaksu.

Kao što vidimo, konceptualni dijagrami zavisnosti sugerišu da je u nekim slučajevima narušen princip kompozicije. Pogrešno je tvrditi da se značenje fraza i fraza može izraziti kroz značenja njihovih konstitutivnih riječi. To nije uvijek tačno. Međutim, glavni problem ovog pristupa je taj što je identifikacija tematskih časova i sastavljanje semantičkih rječnika izuzetno naporan proces, koji u velikoj mjeri ovisi o individualnoj percepciji i interpretaciji pojmova od strane određene osobe.

Mrežni modeli predstavljanja znanja

Tezaurusi, semantičke mreže, okvirni i ontološki modeli

Tezaurus je vrsta rječnika opšteg ili specijalnog vokabulara, koji ukazuje na semantičke odnose između leksičkih jedinica. Za razliku od eksplanatornog rječnika, tezaurus vam omogućava da identificirate značenje ne samo uz pomoć definicije, već i povezivanjem riječi s drugim pojmovima i njihovim grupama, zbog čega se može koristiti za popunjavanje baza znanja umjetne inteligencije. sistemima.

Tezauri obično koriste sljedeće osnovne semantičke odnose: sinonimi, antonimi, hiponimi, hiperonimi, meronimi, holonimi i paronimi.

Sinonimi su riječi istog dijela govora, različite po zvuku i pravopisu, ali imaju slično leksičko značenje (hrabar - hrabar, neustrašiv).

Antonimi su riječi istog dijela govora, različite po zvuku i pravopisu, koje imaju direktno suprotna leksička značenja (dobro - zlo).

Hiponim je pojam koji izražava određeni entitet u odnosu na drugi, opštiji pojam (životinja - pas - buldog).

Hipernim je riječ sa širim značenjem, koja izražava opći, generički pojam, naziv klase predmeta, svojstava ili karakteristika (buldog - pas - životinja).

Hipernim je rezultat operacije logičke generalizacije, dok je hiponim ograničenje.

Meronim je koncept koji je sastavni deo drugog (automobil - motor, točak, hauba).

Holonim je koncept koji je u celini iznad ostalih koncepata (motor, točak, hauba - automobil).

Meronimija i holonimija kao semantičke relacije su međusobno inverzne jedna drugoj, baš kao i hiponimija i hiperonimija.

Paronimi su riječi koje su slične po obliku, ali različite po značenju (indijski - indijski).

Primjer tezaurusa je WordNet. Osnovna jedinica vokabulara WordNeta je sinonimni niz (synset), koji kombinuje reči sa sličnim značenjima. Sinsetovi se sastoje od riječi koje pripadaju istom dijelu govora kao izvorna riječ. Svaki sinset prati mala izjava (definicija) koja objašnjava njegovo značenje. Sinsetovi su međusobno povezani različitim semantičkim odnosima, na primjer hiponimija, hiperonimija itd. Primjer sa riječju pero (olovka) prikazan je na slici 1. Vidi se da u rječniku postoji pet različitih značenja za ovu riječ, tj. pripada kategoriji oruđa za pisanje i ima sedam srodnih reči: olovka, marker, kreda za tablu, kreda od voska itd.

WordNet sadrži približno 155 hiljada različitih leksema i fraza, organizovanih u 117 hiljada sinsetova. Cijela baza podataka podijeljena je na tri dijela: imenice, glagoli i pridjevi/prilozi. Riječ ili fraza može biti u više od jednog sinseta i pripadati više od jedne kategorije govora. Detaljnije informacije o broju jedinstvenih riječi, sinsetova i parova riječ-sinset u bazi podataka WordNet date su u Tabeli 1.

Prednosti WordNeta u odnosu na druge slične resurse su njegova otvorenost, pristupačnost i prisustvo velikog broja različitih semantičke veze između sinsetova. WordNetu se pristupa direktno pomoću pretraživača (lokalno ili putem Interneta) ili C biblioteka.

Postoje WordNet implementacije za druge jezike (oko 16). Na primjer, EuroWordNet je kreiran za evropske jezike, veza između različitih jezičkih verzija se vrši preko posebnog međujezičkog indeksa. WordNet se takođe razvija za ruski jezik. Treba napomenuti da postoje metode za predmetnu klasifikaciju WordNet sinsetova, odnosno određivanje oblasti znanja u kojima se koriste. Takve informacije mogu naknadno poslužiti za smanjenje broja mogućih značenja riječi ako je poznat predmet dokumenta koji se obrađuje, čime se može smanjiti vrijednost greške pri prihvatanju pogrešnog značenja riječi.

Semantička mreža je model predmetnog područja koji ima oblik usmjerenog grafa, čiji vrhovi odgovaraju objektima predmetne oblasti, a lukovi (ivice) definiraju odnose između njih. Objekti mogu biti koncepti, događaji, svojstva, procesi. Dakle, semantička mreža odražava semantiku predmetnog područja u obliku pojmova i odnosa. Štaviše, koncepti mogu biti ili instance objekata ili njihovi skupovi.

Semantičke mreže su se pojavile kao pokušaj vizualizacije matematičkih formula. Iza vizuelnog prikaza semantičke mreže u obliku grafa nalazi se matematički model u kojem svaki vrh odgovara elementu skupa subjekta, a luk predikatu. Slika 2 prikazuje primjer semantičkog weba preuzet sa Wikipedije.

Terminologija koja se koristi u ovoj oblasti je raznolika. Da bi se postigla određena homogenost, čvorovi povezani lukovima obično se nazivaju grafovi, a struktura u kojoj postoji čitavo gnijezdo čvorova ili gdje postoje odnosi različitih redova između grafova naziva se mreža. Pored terminologije koja se koristi za objašnjenje, razlikuju se i metode prikazivanja. Neki koriste krugove umjesto pravokutnika; neki pišu tipove relacija iznad ili ispod lukova, zatvarajući ih ili ne zatvarajući ih u ovale; neki koriste skraćenice poput O ili A za označavanje agenta ili objekta; neki koriste različite vrste strelica.

Prve semantičke mreže razvijene su kao posrednički jezik za sisteme mašinskog prevođenja. Najnovije verzije semantičkih mreža postaju moćnije i fleksibilnije i takmiče se sa sistemima okvira, logičkim programiranjem i drugim jezicima za predstavljanje znanja.

Unatoč različitoj terminologiji, raznolikosti metoda za predstavljanje općih i egzistencijalnih kvantifikatora i logičkih operatora, različitim načinima manipuliranja mrežama i pravilima zaključivanja, možemo identificirati značajne sličnosti svojstvene gotovo svim semantičkim mrežama:

– čvorovi semantičkih mreža predstavljaju koncepte objekata, događaja, stanja;

– različiti čvorovi istog koncepta odnose se na različite vrijednosti, osim ako nisu označeni da pripadaju istom konceptu;

– lukovi semantičkih mreža stvaraju odnose između konceptnih čvorova, oznake iznad lukova označavaju tip odnosa;

– neki odnosi između pojmova predstavljaju semantičke uloge, kao što su “agent”, “objekat”, “primalac” i “alat”; drugi označavaju vremenske, prostorne, logičke odnose i odnose između pojedinačnih rečenica;

– koncepti su organizovani u nivoe prema stepenu opštosti, slično hijerarhiji hiperonima u WordNetu, na primer, entitet ® živo biće ® životinja ® mesožder.

Imajte na umu da među semantičkim odnosima koji se koriste za opisivanje mreža mogu postojati ne samo semantički odnosi koji se koriste u tezaurusima, već i drugi tipovi relacija: funkcionalni (obično definirani glagolima proizvodi, utiče, ...), kvantitativni (više od, manje od, jednako, ... ), prostorno (daleko od, blizu, ispod, iznad, ...), vremensko (ranije, kasnije, tokom, ...), atributivno (imaju svojstvo, imaju vrijednost ), logički (I, ILI, NE) itd.

Na primjer, semantika rečenice Ivanov ima crni BMW može se predstaviti u obliku semantičke mreže prikazane na slici 3.

Uprkos nekim razlikama, mreže se lako čitaju i obrađuju pomoću računara, te su vizuelno i prilično univerzalno sredstvo za predstavljanje semantike prirodnog jezika. Međutim, njihova formalizacija u specifičnim modelima predstavljanja, upotrebe i modifikacije znanja pokazuje se kao prilično radno intenzivna, posebno u prisustvu višestrukih odnosa između njegovih elemenata.

Zamislite, na primjer, neku mrežu koja opisuje izjavu Nastja je od Daše tražila knjigu. Recimo da datim objektima možemo pripisati svojstva: Nastja – „marljiva“, Daša – „radoznala“. Postoji veza između ovih objekata (kroz knjigu). Ali, osim ovoga, postoje mnoge druge veze koje postoje u stvarnom svijetu: društveni status (studenti, djevojke – ne nužno među sobom), porodični odnosi (svako ima roditelje i/ili druge rođake) itd. Ispostavilo se da čak i za tako jednostavan primjer, mreža može narasti do velike veličine i, kao rezultat, traženje izlaza u njoj će biti preteško.

U složenim semantičkim mrežama, uključujući mnoge koncepte, proces ažuriranja čvorova i praćenje veza između njih, kao što vidimo, komplikuje proceduru obrade informacija. Želja za otklanjanjem ovih nedostataka dovela je do pojave posebnih tipova semantičkih mreža, kao što su modeli okvira.

Okvirne modele predstavljanja znanja predložio je M. Minsky.

Okvir je struktura za opisivanje pojma ili situacije, koja se sastoji od karakteristika ove situacije i njihovog značenja. Okvir se može smatrati fragmentom semantičke mreže namijenjene opisu koncepata s cijelim skupom njihovih svojstava. Posebnost okvirnih modela predstavljanja znanja je da su svi koncepti opisani u svakom od čvorova modela određeni skupom atributa i njihovih vrijednosti, koje se nalaze u slotovima okvira.< имя фрейма, слот 1, слот 2, …, слот N >. Grafički, ovo izgleda slično semantičkoj mreži, ali fundamentalna razlika je u tome što svaki čvor u modelu okvira ima generaliziranu strukturu koja se sastoji od mnogo slotova, od kojih svaki ima ime, pokazivač nasljeđivanja, pokazivač tipa podataka i vrijednost .

Slot je atribut povezan s čvorom u modelu zasnovanom na okviru; dio je okvira. Ime slota mora biti jedinstveno unutar okvira. Pokazivač nasljeđivanja pokazuje koje informacije o atributima o priključcima u okviru najviše razine nasljeđuju priključci s istim imenom u okviru niže razine. Indikator tipa podataka sadrži informacije o vrsti podataka uključenih u slot. Obično se koriste sljedeći tipovi podataka: pokazivač na ime okvira najviše razine, realni broj, cijeli broj, tekst, lista, tabela, priložena procedura, itd. Vrijednost slota može biti instanca atributa, drugi okvir ili faset, i mora odgovarati specificiranom tipu podataka i nasljeđivanju uvjeta. Pored određene vrijednosti, slot može pohraniti procedure i pravila koja se pozivaju kada je potrebno izračunati ovu vrijednost. Dakle, slot može sadržavati ne samo određenu vrijednost, već i naziv procedure koja omogućava da se izračuna pomoću datog algoritma, kao i jedan ili više proizvoda uz pomoć kojih se ta vrijednost određuje. Slot može sadržavati više od jedne vrijednosti. Ponekad ovaj slot uključuje komponentu zvanu facet, koja specificira raspon ili listu njegovih mogućih vrijednosti. Faseta također specificira granične vrijednosti popunjavanja utora. Najčešće su procedure za dodavanje i brisanje informacija povezane sa slotovima; oni mogu pratiti dodjelu informacija datom čvoru i provjeriti da li su poduzete odgovarajuće akcije kada se vrijednost promijeni.

Postoje okviri uzoraka (prototipovi) pohranjeni u bazi znanja i okviri instance koji su kreirani za prikaz stvarnih situacija na osnovu dolaznih podataka. Modeli okvira su prilično univerzalni, jer vam omogućavaju da odražavate cjelokupnu raznolikost znanja o svijetu kroz strukture okvira (za označavanje objekata i pojmova: zajam, zalog, račun), uloge okvira (menadžer, blagajnik, klijent), okvir -scenarije (stečaj, sastanak dioničara, proslave imendana), okvirne situacije (alarm, nesreća, način rada uređaja) itd. Za predstavljanje znanja u obliku mreže okvira, postoje posebni jezici i softver: FRL (Jezik za predstavljanje okvira), KRL (Jezik predstavljanja znanja), okvir Kappa shell, PILOT/2 i drugi.

Najvažnije svojstvo teorije okvira je nasljeđivanje svojstava pozajmljenih iz teorije semantičkih mreža. I u okvirima i u semantičkim mrežama, nasljeđivanje se događa preko ISA. ISA slot ukazuje na okvir na višoj razini hijerarhije, iz kojeg se vrijednosti sličnih slotova implicitno nasljeđuju, odnosno prenose.

Glavna prednost okvira kao modela za predstavljanje znanja je njihova usklađenost sa savremenim idejama o organizaciji dugoročne memorije čovjeka, kao i njena fleksibilnost i jasnoća. Prednosti okvirnih modela predstavljanja znanja pojavljuju se kada se generičke veze rijetko mijenjaju i predmetno područje ima nekoliko izuzetaka.

Nedostaci okvirnih modela uključuju njihovu relativno visoku složenost, koja se očituje u smanjenju brzine mehanizma zaključivanja i povećanju radnog intenziteta unošenja promjena u formiranu hijerarhiju. Stoga se pri razvoju sistema okvira velika pažnja poklanja metodama vizuelnog prikaza i efikasnim sredstvima za uređivanje struktura okvira.

Može se primijetiti da je objektno orijentirani pristup razvoj okvirnog pogleda. U ovom slučaju, predložak okvira se može smatrati klasom, a instanca okvira objektom. Objektno orijentirani programski jezici pružaju alate za kreiranje klasa i objekata, kao i alate za opisivanje procedura za obradu objekata (metoda). Međutim, okvirni modeli ne dozvoljavaju organizovanje fleksibilnog mehanizma zaključivanja, tako da su sistemi okvira ili objektno orijentisane baze podataka ili zahtevaju integraciju sa drugim alatima za obradu znanja, na primer, logičkim modelima.

U inženjerstvu znanja, ontološki model se shvata kao detaljan opis određenog predmeta ili problematike, koji se koristi za formulisanje iskaza opšte prirode. Ontologije vam omogućavaju da predstavite koncepte u obliku pogodnom za mašinsku obradu.

U središtu većine ontologija su klase koje opisuju koncepte domena. Atributi opisuju svojstva klasa i instanci. Ovdje postoje analogije sa okvirnim pristupom formalizaciji znanja. Mnogi koncepti i principi implementacije, kao i grafički oblik reprezentacije u početnoj fazi strukturiranja, slični su ontologijama semantičkim mrežama. Glavna razlika je orijentacija ontologija za direktno korišćenje od strane računara, odnosno strukture podataka nisu opisane prirodnim jezikom (kao što je uobičajeno u semantičkim mrežama i tezaurusima), već posebnim formalnim jezikom. Ontologije takođe imaju mnogo zajedničkog sa tezaurusima. Ali za razliku od njih, neophodni zahtjevi za ontološke modele su unutrašnja potpunost, logička povezanost i konzistentnost korištenih koncepata. Tezauri možda ne ispunjavaju ove zahtjeve. Formalni jezici kao što su RDF, OWL, KIF, CycL, OCML i drugi se koriste za opisivanje ontologija.

Obično se razlikuju sljedeći glavni elementi ontologija:

– kopije;

– klase objekata (pojmova);

– atributi (opisuju svojstva klasa i instanci);

– funkcije (opisuju zavisnosti između klasa i instanci);

– aksiomi (dodatna ograničenja).

Specijalizovane (domenski orijentisane) ontologije predstavljaju bilo koju oblast znanja ili deo stvarnog sveta. Takva ontologija sadrži specifična značenja pojmova za ovu oblast. Na primjer, polje riječi u poljoprivreda znači komad zemlje, u fizici - jedna od vrsta materije, u matematici - klasa algebarskih sistema.

Opće ontologije se koriste za predstavljanje koncepata zajedničkih za veliki broj polja. Takve ontologije sadrže osnovni skup pojmova, glosar ili tezaurus, koji se koriste za opisivanje termina u domenu.

Savremeni ontološki modeli su modularni, odnosno sastoje se od mnogih međusobno povezanih ontologija, od kojih svaka opisuje zasebno predmetno područje ili zadatak. Ontološki modeli nisu statični, oni se stalno mijenjaju.

Ako se sistem koji koristi specijalizovane ontologije razvija, možda će biti potrebno spojiti ontologije. Glavni nedostatak ontoloških modela je teškoća njihovog kombinovanja. Ontologije čak i blisko povezanih polja mogu biti nekompatibilne jedna s drugom. Razlika može nastati zbog lokalne kulture, ideologije ili upotrebe drugog opisnog jezika. Spajanje ontologija se izvodi i ručno i poluautomatski. Sve u svemu, ovo je radno intenzivan, spor i skup proces.

Ontološki modeli se široko koriste u sistemima zasnovanim na znanju: ekspertnim sistemima i sistemima za podršku odlučivanju. Zanimljiv način predstavljanja znanja o vremenu uzimajući u obzir nesigurnost u ontologijama opisan je u radu A.F. Tuzovski.

Trenutno su tehnologije semantičkog veba prilično obećavajuće i široko se koriste u praksi tehnologije predstavljanja znanja. Centralni koncept semantičkog weba je ontologija – model predmetne oblasti, koji se sastoji od skupa koncepata, skupa instanci koncepata i skupa odnosa (osobina). Skup koncepata i odnosa između njih definira opću shemu za pohranjivanje podataka, predstavljenu kao skup iskaza o instancama koncepata, ili ontološkim aksiomima. Takve jednostavne izjave, koje se nazivaju trojke, imaju oblik „subjekt-predikat-objekat“. Skup pravila koje odredi korisnik učitava se u sistem zaključivanja, koji, na osnovu iskaza sadržanih u ontologiji, kreira nove instance koncepata i odnosa ontologije prema ovim pravilima.

Jedan od najznačajnijih problema, kako za reprezentaciju znanja u kontekstu vremena, tako i za reprezentaciju znanja uopšte, jeste reprezentacija znanja o vremenu i promenama znanja tokom vremena. Međutim, većina jezika za opis znanja koji se koriste u praksi temelji se na predikatskoj logici prvog reda i koristi unarne ili binarne relacije. Takvi jezici, na primjer, uključuju OWL i RDF. U ovom slučaju, za opisivanje binarnih relacija uzimajući u obzir vrijeme, potrebno je u relacije uvesti dodatni parametar koji odgovara vremenu. U ovom slučaju, binarni odnosi se pretvaraju u ternarne i nadilaze deskriptivne mogućnosti jezika.

Drugi važan zadatak je opisivanje znanja o vremenu, uzimajući u obzir moguću nepotpunost tog znanja. Na primjer, opis izjava poput: "događaj A će se dogoditi negdje u budućnosti." Ovaj problem se obično rješava u okviru modalnih vremenskih logika, kao što je LTL, korištenjem određenih modalnih operatora. Ali, pošto je jezik opisa znanja OWL zasnovan na deskriptivnoj logici, postaje nemoguće koristiti takvo rešenje za OWL ontologije.

U svom radu A.F. Tuzovski predlaže da se model za opisivanje znanja o vremenu predstavi u sljedećem obliku:

< TU, VU, TP, F, Rul >, Gdje

1) TU – skup trenutaka vremena TU = (T È (tØ)), gdje je T linearno uređen skup, koji ima snagu kontinuuma, na kojem je data binarna operacija oduzimanja T ´ T ® R+, a tØ je poseban element koji odgovara "neograničenom vremenu";

2) VU – skup varijabli koje označavaju elemente skupa TU, kao i posebna varijabla tN koja odgovara trenutnom trenutku vremena; vrijednost tN varijable se stalno mijenja, odražavajući protok vremena u nekom sistemu, da bi se opisao vremenski kontekst čiji se predloženi pristup koristi;

3) TP – skup vremenskih intervala; vremenski interval odgovara uređenom paru t =< ti1, ti2 >, gdje su ti1 i ti2 elementi skupa VU takvi da ((ti1 £ ti2) Ù (ti1 ¹ tØ) Ù (ti2 ¹ tØ)) Ú (ti1 = tØ) Ú
(ti2 = tØ); Dakle, određenom području na vremenskoj skali odgovara vremenski period, a njegova granica može biti određeni trenutak u vremenu, trenutni trenutak u vremenu (varijabla tN) ili neodređeni trenutak u vremenu tØ, dok vremenski period sa poklapanje granica (ti1 = ti2) odgovara određenoj tački u vremenu;

4) F – skup predikata koji opisuju svojstva vremenskih intervala, kao i kvalitativne odnose među njima;

5) Rul – skup pravila oblika (G ® H) i (G « H), koji opisuju osnovne mehanizme logičkog zaključivanja, uključujući ograničenja na vrijednosti predikata F, kao i sigurnost granica vremenskih intervala.

Koncept vremenskog intervala je potreban za opisivanje određenih vremenskih intervala, čije su tačne granice nepoznate sve dok se ne pojavi određeno stanje modela. Možemo reći da svaki vremenski period opisuje određeni vremenski interval čije su tačne granice još uvijek nepoznate. U tom slučaju mogu biti dostupne informacije o granicama u kojima se ovaj interval garantuje na vremenskoj skali, a tačne granice intervala opisanog vremenskim periodom mogu postati poznate u budućnosti. Stoga se uvode dvije vrste granica vremenskih intervala: tačne i garantirane. Za definisanje dve vrste granica koriste se predikati EL (tačno levo), ER (tačno desno), GL (zagarantovano levo) i GR (zagarantovano desno), definišući tačne leve/desne i garantovane leve/desne granice vremenskog perioda, respektivno. Na primjer, predikat EL (ti, ti1) odgovara izjavi "tačna lijeva granica intervala ti je trenutak vremena ti1." Radi jednostavnosti, tip granice vremenskog intervala može se označiti različitim zagradama: potpuno definisan interval (obe njegove granice su tačne); interval .

Agent je pokretač animiranja i kontrolor akcije.

Adresar – primalac poruke (može se kombinovati sa korisnikom).

Korisnik (Primalac, Posjednik) je učesnik čiji su interesi indirektno pogođeni tokom situacije (primi korist ili štetu).

Instrument je stimulans emocije ili učesnik uz pomoć kojeg se neka radnja izvodi.

Izvor je mjesto odakle dolazi do kretanja.

Suprotna strana je sila ili okruženje protiv koje se vrši akcija.

Objekat je učesnik koji se pomera ili menja tokom događaja.

Pacijent je učesnik koji prolazi kroz značajne promjene.

Rezultat je učesnik koji se pojavljuje kao rezultat događaja.

Stimulus je vanjski uzrok ili objekt koji uzrokuje ovo stanje.

Cilj je mjesto do kojeg se kreće kretanje.

Doživljavač je učesnik koji doživljava unutrašnje stanje koje ne dovodi do vanjskih promjena (nosilac osjećaja i percepcija).

Efektor je neživi učesnik, često prirodna sila, koja uzrokuje promjenu stanja pacijenta.

U skladu sa brojem argumenata i njihovim semantičkim svojstvima, skup verbalnih leksema može se podijeliti na klase. Na primjer, uzmite u obzir sljedeće vrste glagola uloga: glagole fizičkog utjecaja (sjeckati, pilati, sjeći); glagoli percepcije (vidjeti, čuti, osjetiti); glagoli govora (vikati, šaputati, mrmljati). Unutar svakog razreda postoji preciznija podjela. Među glagolima fizičkog utjecaja, glagoli oblika glagola (Agent, Alat, Objekat) imaju sličnu semantičku strukturu predikata-argumenata: break - break, bend - saviti, fold - savijati, razbiti - razbiti na komade, crack - rascijepiti, itd. Još jedna predikatsko-argumentna struktura karakteristična za glagole oblika glagola (Agent, Alat, Cilj): udariti - udariti, šamariti - šamariti, udariti - udariti, udariti - udariti (o nečemu), udariti - udariti itd.

Može se primijetiti da postoje korelacije između morfoloških padeža, prijedloga, sintaktičkih uloga, s jedne strane, i semantičkih uloga, s druge strane, na primjer, rezati nožem, raditi s Ivanom, prskati bojom. Osim toga, treba uzeti u obzir da jedna predikatska riječ ne može imati dva aktanta s istom semantičkom ulogom. Razlike u skupovima uloga utječu uglavnom na periferne semantičke uloge (izvođač, stimulans, izvor) ili se svode na objedinjavanje/fragmentaciju ključnih uloga (agent naspram agenta i efektora; adresat naspram primaoca, primaoca i korisnika; pacijent/tema/objekat naspram pacijenta, teme i rezultata).

C. Fillmore je u svom radu čak predložio pravilo za indirektno preslikavanje semantičkih uloga u sintaktičke: ako među argumentima postoji Agent, on postaje subjekt; u odsustvu agenta, ako postoji instrument, on postaje subjekt; u odsustvu agenta i instrumenta, subjekt postaje objekat. Odavde prirodno proizilazi hijerarhija semantičkih uloga. Najpoznatije hijerarhije semantičkih uloga su: Agent > Instrument > Pacijent; Agent > Izvor > Cilj > Instrument > Subjekt > Mjesto; Agent > Korisnik > Experiencer > Alat > Tema > Mjesto i neke druge Hijerarhija semantičkih uloga je konstruirana na način da je moguće odraziti stepen tematske pripadnosti argumenata (tematizam) tako da pragmatički najvažnije semantičke uloge nalaze se na lijevom kraju hijerarhije, a na desnom – semantičke uloge koje ne karakteriše visoka aktuelnost.

U početku, semantičke uloge trebale su se smatrati primitivnim, ne podliježući daljoj analizi koja bi mogla otkriti njihovu unutrašnju strukturu. Međutim, u ovom slučaju se javlja niz problema. Prvo, kao rezultat sve pažljivije semantičke i sintaktičke analize, dolazi do neograničenog povećanja liste uloga. Drugo, nestrukturirane liste uloga ne dozvoljavaju nam da predvidimo moguće tipove uloga glagola ili da objasnimo odsustvo nepotvrđenih tipova. Stoga je teorija semantičkih uloga predložila definiranje uloga u smislu distinktivnih karakteristika ili proto-uloga. Na primjer, D. Doughty predlaže da se istakne sljedeća svojstva protorole agenta: dobrovoljno uključen u događaj ili stanje; je svjestan i/ili percipirajući učesnik; inicira događaj ili promjenu stanja za drugog učesnika; kreće (u odnosu na tačku u prostoru ili drugog učesnika); postoji nezavisno od događaja označenog glagolom.

Nažalost, trenutno nije moguće uspostaviti korespondenciju jedan-na-jedan između semantičkih uloga i padeža, odnosno, sa funkcionalne tačke gledišta, kategorija padeža je heterogena. Situacija je dodatno komplicirana činjenicom da su same uloge netrivijalno povezane jedna s drugom, a u prirodnim jezicima su uobičajene generativne tehnike poput metafore i metonimije, koje daju mnoga nova značenja i, u principu, ne mogu odražavati u statičkom leksikonu.

Logički modeli predstavljanja znanja

Osnovna ideja pristupa pri izgradnji logičkih modela predstavljanja znanja je da se sve informacije potrebne za rješavanje primijenjenih problema smatraju skupom činjenica i iskaza koji se u nekoj logici predstavljaju u obliku formula. Znanje se reflektuje skupom ovakvih formula, a sticanje novih znanja svodi se na implementaciju procedura logičkog zaključivanja. Logički modeli predstavljanja znanja zasnovani su na konceptu formalne teorije, definisanoj torkom S =< B, F, A, R>, gdje je B prebrojiv skup osnovnih simbola (abeceda); F – skup koji se zove formule; A – odabrani podskup a priori istinitih formula (aksioma); R je konačan skup odnosa između formula, koji se nazivaju pravila zaključivanja.

Glavni pristup predstavljanju značenja u računarskoj lingvistici uključuje kreiranje reprezentacije značenja u formalnom obliku. Takva reprezentacija se može nazvati jezikom za predstavljanje značenja. Reprezentativni jezik je neophodan da bi se premostio jaz između prirodnog jezika i opšteg znanja o svetu. A budući da je ovaj jezik namijenjen da se koristi za automatsku obradu teksta iu kreiranju sistema umjetne inteligencije, potrebno je uzeti u obzir računske zahtjeve semantičke obrade, kao što je potreba da se utvrdi istinitost iskaza, zadrži jednoznačnost iskaza. predstavljanje, predstavljanje izjava u kanonskom obliku, pružanje logičkog zaključivanja i izražavanje.

Prirodni jezici imaju širok spektar tehnika koje se koriste za prenošenje značenja. Među najvažnijim je sposobnost prenošenja strukture predikat-argument. Uzimajući u obzir gore navedeno, nalazimo da je predikatska logika prvog reda dobro prikladna kao alat za predstavljanje značenja iskaza. S jedne strane, relativno ga je lako razumjeti od strane ljudi, s druge strane, dobro je pogodno za (računarsko) obradu. Koristeći logiku prvog reda, mogu se opisati važne semantičke klase, uključujući događaje, vrijeme i druge kategorije. Međutim, treba imati na umu da izjave koje odgovaraju konceptima kao što su vjerovanja i želje zahtijevaju izraze koji uključuju modalne operatore.

Semantičke mreže i okviri o kojima se raspravljalo u prethodnom odeljku mogu se razmatrati u okviru predikatske logike prvog reda. Na primjer, značenje rečenice Imam knjigu može se napisati na četiri različita načina, koristeći četiri različita jezika za predstavljanje značenja (vidi sliku 4, numeracija odgovara redoslijedu na slici): 1) konceptualna ovisnost dijagram; 2) okvirno predstavljanje; 3) semantička mreža; 4) predikatski račun prvog reda.

Iako su sva ova četiri pristupa različita, na apstraktnom nivou predstavljaju opšteprihvaćenu fundamentalnu oznaku da se reprezentacija značenja sastoji od struktura sačinjenih od mnogih simbola. Ove simboličke strukture odgovaraju objektima i odnosima između objekata. Sva četiri prikaza sastoje se od simbola koji odgovaraju „govorniku“, „knjigi“ i skupu odnosa koji označavaju posedovanje jednog od drugog. Ovdje je važno da sve ove četiri ideje omogućavaju povezivanje, s jedne strane, izražajnih osobina prirodnog jezika, a s druge strane stvarnog stanja stvari u svijetu.

Logički modeli predstavljanja znanja imaju niz prednosti. Prvo, ovdje se kao „temelj“ koristi klasični aparat matematičke logike, čije su metode prilično dobro proučene i formalno opravdane. Drugo, postoje prilično efikasne procedure za izvođenje sintaksički ispravnih iskaza. Treće, ovaj pristup vam omogućava da pohranite samo skup aksioma u baze znanja, a sva ostala znanja (uključujući činjenice i informacije o ljudima, objektima, događajima i procesima) mogu se dobiti iz ovih aksioma prema pravilima zaključivanja.

Jezik za predstavljanje značenja, kao i svaki jezik, ima svoju sintaksu i semantiku. Slika 5 daje opis gramatike bez konteksta za predikatski račun prvog reda predložen u .

Razmotrite prezentaciju značenja kategorija, događaja, vremena, aspekata i vjerovanja datih u knjizi.

Prezentacija kategorije. Pod kategorijom se podrazumijeva grupa riječi ujedinjenih zajedničkim obilježjem, slično kako je organizirana u tezaurusima. Riječi sa semantikom sličnom predikatu često sadrže ograničenja selekcije, koja se obično izražavaju u obliku semantičkih kategorija, gdje svaki član kategorije ima skup relevantnih karakteristika.

Najjednostavniji način predstavljanja kategorija je kreiranje unarnog predikata za svaku kategoriju. Međutim, tada će biti teško davati izjave o samim kategorijama. Razmotrite sljedeći primjer. Recimo, koristeći jezik predikatske logike prvog reda, trebate predstaviti značenje izjave: “Harry Potter” je najpopularnija knjiga za djecu. Odnosno, morate pronaći objekt kategorije koji se najčešće pojavljuje u obliku MostPopular (HarryPotter, ChildrensBook). Ova formula nije prava logička formula prvog reda, budući da argumenti u predikatima, po definiciji, moraju biti termini, a ne drugi predikati. Da bi se riješio ovaj problem, svi koncepti koji sudjeluju u iskazu mogu se predstaviti kao punopravni objekti, odnosno kategorija ChildrensBook može biti predstavljena kao objekt u rangu s HarryPotterom. Članstvo u takvoj kategoriji će biti naznačeno ISA relacijom (HarryPotter, ChildrensBook). Relacija ISA (je a) ukazuje na odnos između objekata i kategorija kojima ti objekti pripadaju. Ova tehnika se može koristiti za kreiranje hijerarhije kategorija. Na primjer, koristimo relaciju AKO (dječja knjiga, knjiga). Ovdje relacija AKO (vrsta) označava uključivanje jedne kategorije u drugu. Naravno, radi veće pouzdanosti, kategorije moraju biti okarakterisane velikim skupom činjenica, odnosno kategorije moraju biti definisane kao skupovi.

Predstavljanje događaja. Da bismo zamislili značenje događaja, dovoljno ga je razmotriti u obliku predikata iz skupa argumenata koji obavljaju određene uloge i potrebni su za opisivanje situacije. Primjeri takvih predikata dati su u prvom dijelu (tamo su dobiveni iz leksičkih funkcija koje je predložio I. A. Melchuk). Drugi primjer: Rezervacija (Hearer, Danas, 20:00, 2). Ovdje su argumenti objekti kao što su osoba, restoran, dan, vrijeme i broj mjesta za rezervaciju u restoranu. Za glagole, takav prikaz se može dobiti ako pretpostavimo da argumenti odgovaraju sintaksičkim aktantima. Postoje četiri problema sa ovim pristupom:

– određivanje tačnog broja uloga za svaki događaj;

– predstavljanje činjenica o ulogama povezanim sa događajem;

– potreba da se osigura da se svi tačni zaključci mogu dobiti direktno iz takvog prikaza događaja;

– potreba da se osigura da se iz prikaza događaja ne može izvesti netačan zaključak.

Na primjer, glagol "jest" može imati od jednog do četiri aktanta, ovisno o situaciji opisanoj rečenicom. Stoga nije unaprijed jasno kakav bi trebao biti lokalitet predikata. Na kraju krajeva, u predikatskom računu prvog reda broj argumenata mora biti fiksiran.

Jedno rješenje je pretpostaviti da se takve situacije obrađuju na sintaksičkom nivou. Moguće je razmotriti zasebne potkategorije za svaku od konfiguracija argumenata. Semantički analog ove metode je stvaranje što više predikata, od kojih će svaki odgovarati pojedinačnim situacijama. Ime predikata je isto, ali je broj argumenata drugačiji:
Eating1 (w) – jeo sam; Eating2 (w, x) – pojeo sam sendvič; Eating3 (w, x, y) – Jedem sendvič za ručak; Eating4 (w, x, y, z) – Pojeo sam sendvič za ručak kod kuće. Stoga se smatraju različitim. Ovaj pristup će zaobići problem broja argumenata, ali nije efikasan. Osim predloženih naziva predikata, ništa ih ne spaja u jedan događaj, iako je njihov logički odnos očigledan. Ispada da se neke logičke veze ne mogu dobiti na osnovu predloženih predikata. Štaviše, morat ćete potražiti ove logičke veze u bazi znanja.

Ovaj problem se može riješiti korištenjem semantičkih postulata. Oni eksplicitno povezuju semantiku predikata. Na primjer, " w, x, y, z Eating4 (w, x, y, z) Þ Eating3 (w, x, y).

Predikati mogu odražavati morfološke, sintaksičke i semantičke informacije. Primjeri takvih semantičkih postulata su formule koje sadrže neke leksičke predikate iz prvog odjeljka. Dati su semantički postulati koji sadrže morfološke i sintaktičke karakteristike građenja riječi i rečenica u ruskom jeziku. Primjeri semantičkih postulata koji nose semantičko opterećenje nalaze se u prethodnom dijelu.

Imajte na umu da ne treba brkati semantiku iskaza u prirodnom jeziku i semantiku predikata koji uvodimo kako bismo odražavali semantiku iskaza. Semantički postulati odražavaju semantiku predikata, odnosno semantičke veze između predikata koje smo uveli.

Jasno je da je ovaj pristup za otkrivanje semantičkih odnosa između predikata pogodan za male domene i ima probleme s skalabilnosti. Bilo bi zgodnije reći da se ovi predikati odnose na jedan predikat čiji argumenti nedostaju na nekim pozicijama. U ovom slučaju možete bez semantičkih postulata. Ali ova metoda ima i nedostatak. Na primjer, ako uzmemo u obzir predikat Eating (w, x, y, z) i pretpostavimo da jedna od riječi iz skupa (doručak, ručak, večera) mora biti prisutna kao treći argument, tada je kvantifikator postojanja dodijeljen drugom varijabla će značiti postojanje specifične hrane povezane sa svakim obrokom, što nije tačno.

Pogledajmo prikladan primjer. Napišimo tri tvrdnje (pojeo sam ručak, jeo sam kod kuće i pojeo sam sendvič za ručak kod kuće) koristeći logiku prvog reda:

$w, x jelo (govornik, w, ručak, x)

$w, x jelo (zvučnik, w, x, dom)

$ w Ishrana (zvučnik, w, ručak, dom).

Pretpostavimo da je potrebno dobiti treću formulu iz prve dvije formule koje se odnose na jedan događaj. Nezavisni događaji Ručao sam i jeo sam kod kuće ne dopuštaju da zaključimo da sam ručao kod kuće. Kao i kod reprezentacije kategorije, ovaj problem možemo riješiti tretiranjem događaja kao objekata, tako da se mogu kvantifikovati i povezati s drugim objektima koristeći skupove specificiranih odnosa. Sada će se prema ovom pristupu dobiti sljedeći prikaz.

Za ponudu sam ručala

$ w ISA (w, Eating) Ù Eater (w, zvučnik) Ù Eater (w, Runch).

Za rečenicu koju sam jeo kod kuće

$ w ISA (w, Eating) Ù Eater (w, zvučnik) Ù Mjesto (w, Dom).

Za rečenicu sam pojeo sendvič za ručak kod kuće

$ w ISA (w, Eating) Ù Eater (w, Speaker) Ù Jeo (w, sendvič) Ù ObrokEaten (w, Runch) Ù Mjesto (w, Home)

Prikazani pristup nam omogućava da se oslobodimo potrebe za specificiranjem fiksnog broja argumenata u predikatu, bez obzira na uloge i druge aktante. Nema drugih uloga koje nisu spomenute u rečenici, a logičke veze između semantički povezanih predikata ne zahtijevaju korištenje semantičkih postulata.

Reprezentacija vremena. Vremenska logika se koristi za opisivanje nizova događaja i njihovih odnosa u vremenskoj liniji. U prirodnim jezicima, takav alat je glagolsko vrijeme. Može se smatrati da jedan događaj prethodi drugom ako tok vremena vodi od prvog do drugog događaja. Tu nastaju naši poznati koncepti prošlosti, sadašnjosti i budućnosti.

Temporalna logika koristi dvije vrste operatora: logičke i modalne. Kao logički operatori koriste se uobičajeni operatori logike propozicionog računa: konjunkcija, disjunkcija, negacija i implikacija. Modalni operatori su definirani na sljedeći način.

N j – Sljedeće: j mora biti istinito u stanju neposredno nakon datog.

F j – Budućnost: j mora postati istinito u barem jednom stanju u budućnosti.

G j – Globalno: j mora biti istinito u svim budućim stanjima.

A j – Sve: j se mora izvršiti na svim granama počevši od ove.

E j – postoji: postoji barem jedna grana na kojoj se j izvršava.

j U y – Do (jako): y se mora izvršiti u nekom stanju u budućnosti (moguće u trenutnom), svojstvo j se mora izvršiti u svim stanjima do jednog naznačenog (ne uključujući).

j R y – Otpuštanje: j oslobađa y ako je y istinito sve dok prvi put j ne postane istinito (ili uvijek, ako se takav trenutak ne dogodi). Inače, j mora postati istinito barem jednom prije nego što y postane istinito prvi put.

Reprezentacija aspekata. Glagoli se koriste za opisivanje radnji u prirodnim jezicima. Američki filozof Z. Vendler je 1957. godine predložio model za podjelu glagola prema leksičkim aspektima. On je identifikovao četiri klase:

– statisi (stanja) – glagoli koji opisuju statična stanja koja nemaju krajnju tačku (na primjer, “znati”, “voliti”);

– aktivnosti (aktivnosti) – glagoli koji opisuju stanja koja su dinamična i nemaju krajnju tačku (na primjer, “trčati”, “voziti”);

– postignuća (postignuća) – glagoli koji opisuju događaje koji imaju krajnju tačku i postupni su (na primjer, „naslikati sliku“, „izgraditi kuću“);

– postignuća (dostignuća) – glagoli koji opisuju događaje koji imaju krajnju tačku i događaju se trenutno (na primjer, “prepoznati”, “obavijestiti”).

Tabela 2 prikazuje uporednu tablicu Wendlerovih klasa za Engleski glagoli, preuzeto iz rada.

Kao što vidite, nastavak djelovanja karakterističan je za aktivnosti i postignuća i izostaje u akcijama i postignućima. Možete reći da je ključalo (aktivnost) i pisao sam pismo (obaveza), ali ne možete reći da je postojalo (izjava) i da sam pronalazio knjigu (dostignuće). Postignuća se ne kombinuju sa okolnostima trajanja. Možete reći da je postojao dva sata (izjava), ali ne možete reći da sam ga našao dva sata (dostignuće).

Postignuća i postignuća opisuju svrsishodne akcije, kombinovane su sa okolnostima datuma završetka, za razliku od izjava i aktivnosti. Možete reći da sam napisao pismo za dva sata (obaveza), ali ne možete reći da sam prošetao za dva sata (aktivnost).

Predstavlja uvjerenja, želje i namjere. Da bi se izrazio stav govornika prema informacijama koje se saopštavaju u izjavama na prirodnom jeziku, koriste se reči kao što su verovati, želeti, verovati, zamisliti, itd. Takve izjave ne opisuju objektivnu sliku svijeta, već karakteristike govornikove lične percepcije, njegove „unutrašnje“ ideje o svijetu. Uzmite u obzir izjavu za koju vjerujem da John čita “Harry Potter”. Pogrešno je pokušati predstaviti njegovo značenje koristeći predikatsku logiku: Vjerovanje (govornik, čitanje (John, HarryPotter). Ovdje drugi argument mora biti termin, a ne formula. Ova sintaktička greška podrazumijeva semantičku. U logici prvog reda , predikati povezuju objekte, a ne odnos između njih. Standardni način za prevazilaženje ovog problema je dodavanje operatora koji nam omogućavaju da napravimo izjave koje su nam potrebne. Ako uvedemo operator Believes, koji uzima formule kao argumente, dobićemo sljedeću reprezentaciju :

Vjeruje (Speaker, $ x ISA (x, Reading) Ù Reader (x, John) Ù Read (x, HarryPotter)).

Ne može se reći da je takav prikaz napisan u terminima predikatskog računa prvog reda, ali je potvrda da u jeziku postoji grupa glagola koja ima posebnu ulogu u semantičkoj analizi. U automatizovanim sistemima analize ponekad je potrebno pratiti uverenja i namere korisnika. Situacija je komplikovana činjenicom da se verovanja, želje i namere mogu promeniti tokom dijaloga.

Uneseni operator naziva se modalni. Postoje različiti modalni operatori. Temporalni modalitet je već spomenut nešto ranije kada se govorilo o reprezentaciji vremena u iskazima. Pored temporalnog, postoji prostorni modalitet, logika znanja („zna se da“), logika dokazivosti („to je moguće dokazati“) i druge. Logika proširena modalnim operatorima naziva se modalna logika. Trenutno u ovoj oblasti ostaju mnoga složena neistražena pitanja. Kako zaključivanje funkcionira u prisustvu specifičnih modalnih operatora? Na koje se vrste formula mogu primijeniti određeni operatori? Kako modalni operatori komuniciraju s kvantifikatorima i logičkim vezama? Ova i druga pitanja tek treba istražiti. Nećemo se ovdje zadržavati na njima.

Izvođenje sintaksički ispravnih iskaza u logičkim modelima predstavljanja znanja zasniva se na pravilu rezolucije koji je razvio J. Robinson 1965. godine. U njemu se navodi da ako je grupa izraza koji formiraju premisu istinita, onda primjena pravila zaključivanja garantuje da će proizvesti istinit izraz kao zaključak. Rezultat primjene pravila rezolucije naziva se rezolventa.

Metoda razrješenja (ili pravilo za eliminisanje kontradikcija) omogućava vam da dokažete istinitost ili netačnost iznesene pretpostavke kontradikcijom. U metodi razlučivanja, skup propozicija se obično smatra složenim predikata, koji sadrži nekoliko predikata povezanih logičkim funkcijama i kvantifikatorima postojanja i univerzalnosti. Budući da predikati s istim značenjem mogu imati različite oblike, rečenice se prvo moraju dovesti u jedinstveni oblik (disjunktivni ili konjunktivni normalni oblik), u kojem se uklanjaju kvantifikatori postojanja, univerzalnosti, simboli implikacije, ekvivalencije itd. Pravilo razrješenja sadrži konjunkciju disjunkata na lijevoj strani. Stoga je dovođenje premisa koje se koriste za dokaz u oblik koji predstavlja konjunkcije disjunkti neophodan korak u gotovo svakom algoritmu koji implementira logičko zaključivanje na osnovu metode rezolucije.
Sljedeći koraci se slijede u procesu zaključivanja koristeći pravilo rezolucije.

1. Operacije ekvivalencije i implikacije su eliminirane:

A « B = (A ® B) Ù (B ® A);

A ® B = Ø A Ú B.

2. Operacija negacije se kreće unutar formula koristeći De Morganove zakone:

Ø (A Ù B) = Ø A Ú Ø B;

Ø (A Ú B) = Ø A Ù Ø B.

3. Logičke formule su svedene na disjunktivni oblik:

A Ú (B Ù C) = (A Ú B) Ù (A Ú C).

U logici predikata, da bi se primijenilo pravilo rezolucije, potrebno je izvršiti složeniju transformaciju logičkih formula kako bi se svele na sistem disjunkti. To je zbog prisutnosti dodatnih elemenata sintakse, uglavnom kvantifikatora, varijabli, predikata i funkcija.
Algoritam za objedinjavanje predikatnih logičkih formula sastoji se od sljedećih koraka.

1. Eliminacija operacija ekvivalencije.

2. Eliminacija operacija implikacije.

3. Uvođenje operacija negacije unutar formula.

4. Eliminacija kvantifikatora postojanja. To se može dogoditi u trećem koraku zbog primjene De Morganovih zakona, naime, negacija $ mijenja se u ", ali može doći i do obrnute zamjene. Zatim, da biste eliminirali $, postupite na sljedeći način: sva pojavljivanja neke varijable pridružene sa egzistencijalnim kvantifikatorom, na primjer ($ x), zamjenjuju se u formuli novom konstantom, na primjer a. Ova konstanta predstavlja neku (nepoznatu) vrijednost varijable x za koju je tačan iskaz napisan ovom formulom. važno je da će za sva mjesta na kojima je x prisutno biti zamijenjena ista vrijednost a, čak i ako je u ovom trenutku nepoznata.

5. Opšti kvantifikatori se stavljaju na prvo mjesto u formulama. Ovo također nije uvijek jednostavna operacija; ponekad uključuje preimenovanje varijabli.

6. Otkrivanje veznika uhvaćenih unutar disjunkcija.

Nakon što završite sve korake opisanog algoritma objedinjavanja, možete primijeniti pravilo rezolucije.

Bilo je to pravilo rezolucije koje je poslužilo kao osnova za kreiranje programskog jezika Prolog.
U Prologu su činjenice opisane u obliku logičkih predikata sa specifičnim vrijednostima. Pravila zaključivanja su opisana logičkim predikatima uz definiciju pravila zaključivanja u obliku liste predikata nad bazama znanja i postupcima obrade informacija. Prolog interpreter sam implementira izlaz sličan onom gore opisanom. Da bi se inicirali proračuni, prema bazi znanja se izvršava poseban upit, na koji sistem logičkog programiranja generiše „tačne“ i „netačne“ odgovore.

Metoda rezolucije je jednostavna za programiranje, to je jedna od njenih najvažnijih prednosti, ali je primjenjiva samo u ograničenom broju slučajeva, jer za njenu primjenu dokaz ne bi trebao imati veliku dubinu, a broj potencijalnih rezolucija ne bi trebao biti veliko.

Da bi alat za predikatski račun prvog reda bio fleksibilniji, može se proširiti lambda računom. Lambda račun je jezik višeg reda od predikatskog računa prvog reda. U njemu lambda funkcija može raditi ne samo s varijablama, već i s predikatima kao argumentima. Međutim, upotreba lambda izraza formalno ne povećava izražajnu moć logike prvog reda, budući da se bilo koja konstrukcija koja sadrži lambda izraz može pretvoriti u ekvivalentan oblik bez njega.

Nakon što je Prolog jezik stekao veliku popularnost, početkom 80-ih godina prošlog veka pojavio se termin „računari pete generacije“. Tada se očekivalo stvaranje nove generacije računara fokusiranih na distribuirano računarstvo. Istovremeno se vjerovalo da će peta generacija postati osnova za stvaranje uređaja sposobnih da imitiraju proces ljudskog razmišljanja. Istovremeno se javila ideja o stvaranju hardverske podrške za paralelne relacione baze podataka Grace i Delta i paralelnog logičkog zaključivanja (Parallel Inference Engine, PIE), na osnovu principa Prolog jezika. Svaki blok zaključivanja signalizirao je svoje trenutno radno opterećenje tako da se rad može prenijeti na blok zaključivanja s najmanjim opterećenjem. Ali, kao što znamo, takvi pokušaji nisu omogućili stvaranje umjetne inteligencije, već su samo poslužili kao još jedna potvrda da ljudsko razmišljanje još nije dovoljno proučeno.

Logički modeli predstavljanja znanja omogućavaju vam da provjerite sintaksičku ispravnost iskaza. Međutim, koristeći pravila koja definišu sintaksu jezika, nemoguće je utvrditi istinitost ili netačnost određene izjave. Izjava se može sintaktički ispravno konstruirati, ali se ispostavi da je potpuno besmislena. Osim toga, logičke modele je teško koristiti prilikom dokazivanja obrazloženja koje odražava specifičnosti određenog predmetnog problema, zbog visokog stepena uniformnosti.

Sistemi sa komponentama semantičke analize

U sklopu projekta Open Cognition razvija se analizator Link Grammar Parser, koji je odgovoran za obradu prirodnog jezika. Link Grammar Parser je počeo da se razvija 1990-ih. na Univerzitetu Carnegie Mellon. Ovaj pristup se razlikuje od klasične teorije sintakse. Sistem rečenici dodjeljuje sintaksičku strukturu koja se sastoji od skupa označenih veza (konektora) koji povezuju parove riječi. Link Grammar Parser koristi informacije o tipovima veza između riječi.

Analizator poseduje rečnike koji sadrže oko 60.000 rečničkih oblika. Omogućava vam da raščlanite veliki broj sintaktičkih struktura, uključujući brojne rijetke izraze i idiome. Link Grammar Parser je prilično robustan, može preskočiti dio rečenice koji ne razumije i odrediti strukturu za ostatak rečenice. Analizator može raditi s nepoznatim vokabularom i praviti razumna nagađanja (na osnovu konteksta i pravopisa) o sintaksičkoj kategoriji nepoznatih riječi. Ima podatke o vlastitim imenima, brojčanim izrazima i raznim interpunkcijskim znacima.

Analiza u sistemu se odvija u dvije faze.

1. Konstrukcija više sintaksičkih prikaza jedne rečenice. U ovoj fazi razmatraju se sve opcije za veze između riječi i one koje zadovoljavaju kriterij projektivnosti (veze se ne bi trebale ukrštati) i kriterij minimalne povezanosti (rezultirajući graf mora sadržavati najmanji broj komponenta povezivanja; Povezana komponenta grafa - određeni skup vrhova grafa takav da za bilo koja dva vrha iz ovog skupa postoji put od jednog do drugog i ne postoji put od vrha ovog skupa do vrha koji nije iz ovog skupa. set).

2. Naknadna obrada. Dizajniran za rad sa već izgrađenim alternativnim rečeničnim strukturama.

Rezultirajući dijagrami su u suštini analogi podređenih stabala. U stablima subordinacije možete postaviti pitanje od glavne riječi u rečenici do sporedne. Dakle, riječi su raspoređene u strukturi stabla. Parser može proizvesti dvije ili više shema raščlanjivanja za istu rečenicu. Ova pojava se naziva sintaktička sinonimija.

Glavni razlog zašto se analizator naziva semantičkim sistemom je jedinstveno kompletan skup veza (oko 100 glavnih, od kojih neke imaju 3-4 opcije).
U nekim slučajevima, pažljiv rad na različitim kontekstima naveo je autore sistema da pređu na gotovo semantičke klasifikacije izgrađene isključivo na sintaksičkim principima. Tako se razlikuju sljedeće klase engleskih priloga: situacijski prilozi, koji se odnose na cijelu rečenicu u cjelini (klauzalni prilog); prilozi vremena (vremenski prilozi); uvodni prilozi, koji se nalaze na početku rečenice i odvojeni zarezom (otvarači); prilozi koji modificiraju pridjeve, itd.

Među prednostima sistema treba istaći da je organizacija procedure za pronalaženje varijanti sintaksičke reprezentacije veoma efikasna. Konstrukcija ne ide odozgo prema dolje (top-down), a ne odozdo prema gore (bottom-up), već se sve hipoteze odnosa razmatraju paralelno: prvo se grade sve moguće veze pomoću formula rječnika, a zatim moguće podskupovi ovih veza su identifikovani. Ovo, prvo, dovodi do algoritamske neprozirnosti sistema, jer je veoma teško pratiti sve odnose odjednom, a drugo, ne dovodi do linearne zavisnosti brzine algoritma od broja reči, već na eksponencijalni, budući da je skup svih varijanti sintaksičkih struktura u rečenici riječi u najgorem slučaju, ekvivalentan skupu svih osnovnih stabala kompletnog grafa sa vrhovima.

Posljednja karakteristika algoritma prisiljava programere da koriste tajmer kako bi brzo zaustavili proceduru koja je predugo pokrenuta. Međutim, svi ovi nedostaci su više nego nadoknađeni jezičkom transparentnošću sistema, u kojem su valencije riječi propisane s jednakom lakoćom, a redoslijed prikupljanja valencija unutar algoritma nije fundamentalno preciziran, veze se grade kao da se paralelno, što je u potpunosti u skladu s našom jezičkom intuicijom.

Za svaku riječ, u rječniku se bilježi kojim konektorima se može povezati s drugim riječima u rečenici. Konektor se sastoji od naziva vrste veze u koju dotična jedinica analize može ući. Postoji više od 100 samo glavnih, najvažnijih priključaka. Za označavanje smjera veze, znak “+” je pričvršćen na desnoj strani konektora, a znak “–” na lijevoj strani. Levoruki i desni konektori istog tipa čine vezu. Jednoj riječi može se dodijeliti formula konektora, sastavljena korištenjem određenih veznika.

Napomenimo i nedostatke Link Grammar Parser.

1. Praktično testiranje sistema pokazuje da je pri analizi složenih rečenica čija dužina prelazi 25–30 riječi moguća kombinatorna eksplozija. U ovom slučaju, rezultat rada analizatora je „panični“ graf, obično slučajna varijanta sintaktičke strukture koja je neadekvatna sa lingvističke tačke gledišta.

2. Primjena gore opisanih ideja je teška za flektivne jezike kao što je ruski zbog značajnog povećanja obima rječnika koji nastaju zbog morfološkog razvoja flektivnih jezika. Svaki morfološki oblik mora biti opisan posebnom formulom, pri čemu indeks konektora uključenog u njega mora pružiti proceduru podudaranja. To dovodi do složenijeg skupa konektora i povećanja njihovog broja.

Projekat Open Cognition, u okviru kojeg se razvija Link Grammar Parser, otvoren je i besplatan, što je velika prednost za istraživanje. Prilično detaljan opis i izvorni kod mogu se naći na web stranici. Open Cognition nastavlja da se razvija i danas, što je takođe važno jer ima priliku da komunicira sa programerima. Uz Link Grammar, razvija se i RelEx analizator, koji vam omogućava da izdvojite semantičke odnose zavisnosti u izjavama na prirodnom jeziku, a kao rezultat toga, rečenice su predstavljene u obliku stabala zavisnosti. Koristi nekoliko skupova pravila za ponovnu izgradnju grafa uzimajući u obzir sintaktičke odnose između riječi. Nakon svakog koraka, prema skupu pravila podudaranja, tagovi strukturnih karakteristika i odnosa između riječi se dodaju na rezultirajući graf. Međutim, neka pravila, naprotiv, mogu smanjiti graf. Ovako se graf transformiše. Ovaj proces primjene niza pravila liči na metodu koja se koristi u gramatikama ograničenja. Glavna razlika je u tome što RelEx radi sa prikazom grafa, a ne jednostavnim skupovima oznaka (koji označavaju odnose). Ova funkcija vam omogućava da primijenite apstraktnije transformacije prilikom analize tekstova. Drugim riječima, osnovna ideja je korištenje prepoznavanja obrazaca za transformaciju grafova. Za razliku od drugih parsera koji se u potpunosti oslanjaju na sintaksičku strukturu rečenice, RelEx je više fokusiran na predstavljanje semantike, posebno, to se tiče entiteta, poređenja, pitanja, rezolucije anafora i leksičke dvosmislenosti riječi.

Sistem biranja

„Biranje“ je automatski rusko-engleski sistem prevođenja koji je razvijen od 1999. do 2002. godine. u okviru projekta Automatska obrada teksta (AOT). IN drugačije vrijeme U radu na sistemu učestvovala su 22 specijalista, od kojih su većina bili poznati lingvisti.
Osnova sistema „Biranje“ bio je francusko-ruski sistem automatskog prevođenja (FRAP), razvijen u Sveruskom centru za obrazovanje i nauku zajedno sa Moskovskim državnim pedagoškim institutom po imenu. M. Thorez 1976–1986, i sistem za analizu političkih tekstova na ruskom „Polytext“, razvijen u Centru za istraživanje informacija 1991–1997.

Sistem Polytext je bio usmjeren na analizu službenih dokumenata na ruskom jeziku i sadržavao je kompletan lanac analizatora teksta: grafičke, morfološke, sintaksičke i djelimično semantičke. U sistemu „Biranje“ grafematska analiza je delimično pozajmljena, ali prilagođena novim programskim standardima. Program morfološke analize napisan je iznova jer je brzina rada bila mala, ali se sam morfološki aparat nije mijenjao.

Na grafičkom nivou, konstante su grafematski deskriptori. Na primjer, LE (leksema) - dodjeljuje se sekvencama koje se sastoje od ćiriličkih znakova; ILE (strana leksema) – dodjeljuje se nizovima latiničnih znakova; CC (digitalni kompleks) – dodjeljuje se nizovima koji se sastoje od brojeva; CBC (digitalno-slovni kompleks) - dodjeljuje se sekvencama koje se sastoje od brojeva i slova, itd.

Na morfološkom nivou, gramame se koriste za notaciju - gramatičke karakteristike koje povezuju oblik riječi sa određenom morfološkom klasom. Različiti grami iste kategorije se međusobno isključuju i ne mogu se izraziti jednom riječju. Na primjer, zhr - ženski rod, tv - instrumentalni padež, pl - množina, ali - neživi, ​​sv - savršeni oblik, dst - aktivni glas, ne - prolaznost glagola, pvl - imperativ glagola, nst - sadašnje vrijeme od glagola, itd. d.

Analiza fragmentacije ima za cilj podijeliti rečenicu na neodvojive fragmente (sintaktičke jedinstva), veće fraze ili jednake njima (sintaksička grupa), te uspostaviti djelomičnu hijerarhiju na skupu tih jedinstava. Moguće vrste fragmenata: glavne rečenice, podređene rečenice kao dio složenih, participalnih, priloških i drugih izolovanih fraza. Za svaki fragment je poznato koji su fragmenti direktno ugniježđeni u njemu, a u koji je direktno ugniježđen.

FRAP sistem je sadržavao kompletan lanac analize teksta do semantičke analize, koja je samo djelimično implementirana. U sistemu FRAP razvijen je i testiran semantički aparat na osnovu kojeg je kreirana posebna metoda semantičke analize u sistemu „Biranje“ – metoda kompletnih opcija. FRAP nije sadržavao mehanizme za strukturnu procjenu semantičke reprezentacije, odnosno metode ne samo za jedno pojavljivanje tekstualnog elementa, već za cijelu strukturu u cjelini. Ideja metode potpunih opcija je da analiza treba jasno odvojiti opcije analize koje se pojavljuju različite faze, i deklarativnim lingvističkim pravilima (djelimični modeli) koji konstruiraju i procjenjuju pojedinačne varijante. Ovaj pristup, koji se ranije koristio samo za predsemantičke analizatore, sada je, zbog razvoja računarske moći, postalo moguće preneti na semantiku, čime se povećava nivo razdvajanja proceduralnih i deklarativnih delova sistema. Proceduralni dio semantičke analize idealno se svodi na petlje koje kruže kroz različite jezičke opcije. Tako je postalo moguće pojednostaviti lingvističke modele zbog povećane brzine računara.

Glavne komponente semantičkog aparata koji se koristi u biranju su semantičke relacije (SR) i semantičke karakteristike (SC). Primjeri semantičkih odnosa: INSTRU – „alat“, LOK – „lokacija, lokacija“, PRINADL – „pripadanje“, REZLT – „rezultat“ itd. Oni su prilično univerzalni i imaju sličnosti s predikatima o kojima se govori u prvom dijelu i semantičkom uloge, spomenute u trećem dijelu. Semantičke karakteristike vam omogućavaju da gradite formule koristeći logičke spojeve "i" i "ili". Svakoj riječi je dodijeljena određena formula koju čine semantičke karakteristike. Semantički rečnik „Biranje“ sadrži oko 40 semantičkih karakteristika. Primeri semantičkih karakteristika: ABST - apstraktna imenica ili pridev, STVAR - naziv hemijske supstance ili nečega što se može meriti težinom ili zapreminom; GEOGR – geografski objekat; MOVE – glagoli kretanja; INTEL – radnje povezane sa mentalnom aktivnošću; COMMUNIK – glagoli govora; NOSINF – nosioci informacija; ORG – organizacija; SOBIR – sve što označava skup objekata istog tipa; EMOC – pridevi koji izražavaju emocije itd. Neke karakteristike su kompozitne jer se mogu izraziti u terminima drugih. Postoje karakteristike koje su antonimi. Njihova upotreba u istoj kombinaciji je zabranjena. Postoje karakteristike koje su varijacije drugih. Semantičke karakteristike, uz gramatičke karakteristike, omogućavaju provjeru slaganja riječi pri tumačenju veza u tekstu.

U ovom trenutku, svi alati razvijeni u okviru AOT projekta (uključujući i sistem biranja) su besplatni cross-platformski softver. Demo i detaljna dokumentacija dostupni su na web stranici.

Ekstrakcija informacija i sistemi predstavljanja znanja

Postoje i drugi sistemi koji sadrže komponente semantičke analize. Međutim, oni imaju značajne nedostatke za istraživanje: teško je pronaći opise koji nisu besplatni i slobodno distribuirani ili ne rade s tekstovima na ruskom jeziku. To uključuje OpenCalais (http://www.opencalais.com/opencalais-api/), RCO (http://www.rco.ru/?page_id=3554), Abbyy Compreno (https://www.abbyy.com /ru-ru/isearch/compreno/), SemSin (http://www.dialog-21.ru/media/1394/
kanevsky.pdf), DictaScope (http://dictum.ru/), itd.

Vrijedi spomenuti sistem za izdvajanje podataka iz nestrukturiranih tekstova Pullenti (http://semantick.ru/). Zauzela je prvo mjesto u stazama T1, T2, T2-m i drugo mjesto u T1-l na konferenciji Dialog 2016 u takmičenju FactRuEval. Na web stranici programera Pullenti sistema nalazi se i demo verzija semantičkog analizatora koji vam omogućava da izgradite semantičku mrežu na osnovu rečenice.

Okruženje DECL alata (http://ipiranlogos.com/) je razvijeno kasnih 90-ih i korišćeno za izgradnju ekspertnih sistema (ES), školjki za ES, logičko-analitičkih sistema (LAS), lingvističkih procesora (LP), koji obezbeđuju obradu i automatsko izvlačenje znanja iz tokova neformalizovanih dokumenata na prirodnom jeziku.

Sistem za mašinsko prevođenje "ETAP-3" je dizajniran za analizu i prevođenje tekstova na ruskom i engleskom jeziku. Sistem koristi transformaciju tekstova prirodnog jezika u njihovu semantičku reprezentaciju u univerzalnom mrežnom jeziku. Kao što je ranije pomenuto, označavanje sintaksičkog korpusa „Nacionalni korpus ruskog jezika” obavlja ETAP-3 jezički procesor, zasnovan na principima teorije „Značenje Û teksta”.

U posljednje vrijeme pojavljuje se sve više sistema za predstavljanje baza znanja u obliku grafova. Pošto se obim informacija stalno povećava neverovatnom brzinom, takvi sistemi moraju automatski podržavati izgradnju i ažuriranje baza znanja. Automatska konstrukcija baza znanja može se izvršiti na osnovu strukturiranih izvora podataka.

Primjeri takvih sistema: Yago (http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/), DBpedia (http://wiki.dbpedia .org/), Freebase (https://developers.
google.com/freebase/), Googleov grafikon znanja (https://developers.google.com/knowledge-graph/), OpenCyc (http://www.opencic.org/). Drugi pristup vam omogućava da izvučete informacije iz otvoreni resursi na Internetu bez ljudske intervencije: ReadTheWeb (http://rtw.ml.cmu.edu/rtw/), OpenIE (http://nlp.stanford.edu/
software/openie.html), Google Knowledge Vault (https://www.cs.ubc.ca/~murphyk/Papers/kv-kdd14.pdf). Takvi sistemi su eksperimentalni, svaki od njih ima svoje karakteristike. Na primjer, Trezor znanja pokušava da uzme u obzir nesigurnosti; svakoj činjenici se dodjeljuje koeficijent povjerenja i porijeklo informacije. Dakle, sve tvrdnje se dijele na one za koje postoji velika vjerovatnoća da su istinite i one koje mogu biti manje vjerovatne. Predviđanje činjenica i njihovih svojstava vrši se metodama mašinskog učenja na osnovu velikog broja tekstova i postojećih činjenica. Trezor znanja trenutno sadrži 1,6 milijardi činjenica. NELL sistem, razvijen kao dio projekta ReadTheWeb na Univerzitetu Carnegie Mellon, sadrži više od 50 miliona izjava s različitim stepenom pouzdanosti. Oko 2 miliona 800 hiljada činjenica ima visok stepen pouzdanosti. Proces NELL obuke također još nije završen.

Hajde da izvučemo sledeće zaključke. Sa razvojem kompjuterska tehnologija i stalni rast
obima tekstualnih informacija, istraživanja u oblasti automatske obrade teksta fokusirana su na primenjeni aspekt. Mogućnosti većine alata su ograničene na morfološku i sintaksičku analizu u kombinaciji sa metodama iz teorije vjerovatnoće i matematičke statistike. Dakle, samo odabrani dio je najviše jednostavni zadaci ispostavilo se da je riješeno. Ostale probleme još treba riješiti.

Kao što smo vidjeli, postoji mnogo razloga za to. Na primjer, postoji mišljenje da svako pravilo u sintaksi ima svoj analog u semantici. Ovaj postulat se naziva hipoteza od pravila do pravila. U stvari, ova prepiska nije jedan na jedan, i to je glavna poteškoća. Zaista, svako sintaksičko pravilo (stablo raščlanjivanja) može biti povezano sa semantičkim pravilom (parse stablo), ali ono neće biti jedino. U suprotnom smjeru, slično semantičkom pravilu, uspoređuje se sintaktičko pravilo, ali ne nužno i jedino. Upravo ta nejasnoća dovodi do trenutno nerešivih problema u oblasti automatske obrade teksta. U vezi sa ovim obrazloženjem postavlja se pitanje izbora željenog poređenja iz velikog broja mogućih opcija.

Iz svega navedenog može se izvući još jedan vrlo važan zaključak. Procese generisanja i tumačenja iskaza ne treba posmatrati odvojeno, oni su neraskidivo povezani
sebe. Kada izražava svoje misli, osoba se fokusira na to da li će ga sagovornik razumjeti. U procesu generisanja izjave, osoba se, takoreći, „provjerava“ modelirajući kako će sagovornik percipirati informaciju. Sličan mehanizam je prisutan i kod tumačenja iskaza. Kada shvatimo ono što smo čuli ili pročitali, ponovo „provjeravamo“ svojim znanjem i idejama o svijetu. Samo zahvaljujući tome uspijevamo odabrati odgovarajuće značenje.

Savremeni istraživači su skloni mišljenju da se željeni izbor može napraviti uz dodatnu bazu znanja o svijetu. Takva baza znanja treba da sadrži opće semantičke informacije o konceptima i odnosima između njih, tako da se prilikom pristupanja automatski može odrediti odgovarajući kontekst iskaza. Pomoglo bi da se uzme u obzir akumulirano znanje o svijetu, koje nije eksplicitno prisutno u određenom iskazu, ali direktno utiče na njegovo značenje.

Književnost

  1. Melchuk I.A. Iskustvo u teoriji lingvističkih modela “Značenje-tekst”. M.: Jezici ruske kulture, 1999. 346 str.
  2. Lahuti D.G., Rubashkin V.Sh. Semantički (konceptualni) rječnik za informacijske tehnologije // Znanstvene i tehničke informacije. 2000. br. 7. str. 1–9.
  3. Paducheva E.V. Dinamički modeli u semantici vokabulara. M.: Jezici slavenska kultura, 2004. 608 str.
  4. Tuzov V.A. Računarska semantika ruskog jezika. Sankt Peterburg: Izdavačka kuća St. Petersburg State University, 2003. 391 str.
  5. Nacionalni korpus ruskog jezika. URL: http://www.ruscorpora.ru/ (datum pristupa: 22.08.2016.).
  6. Apresyan V.Yu. i dr. Novi objašnjavajući rečnik sinonima ruskog jezika. M. – Beč: Jezici slovenske kulture – Bečki slavenski almanah, 2004. 1488 str.
  7. Khoroshilov A.A. Metode za automatsko utvrđivanje semantičke sličnosti dokumenata na osnovu njihove konceptualne analize // Elektronske biblioteke: obećavajuće metode i tehnologije, elektronske zbirke: tr. XV Sveruski naučnim konf. RCDL" 2013. Jaroslavlj: Izdavačka kuća YarSU, 2013. str. 369–376.
  8. Rubashkin V.Sh. Predstavljanje i analiza značenja u inteligentnim informacionim sistemima. M.: Nauka, 1989. 189 str.
  9. Lahuti D.G., Rubashkin V.Sh. Sredstva i postupak konceptualne interpretacije ulaznih poruka na prirodnom jeziku // Izv. Akademija nauka SSSR-a. Ser. Technical cybern. 1987. br. 2. str. 49–59.
  10. Rubashkin V.Sh. Semantička komponenta u sustavima razumijevanja teksta // KII-2006. Tr. 10 nacionalnih konf. prema vještačkom obavještajne službe sa međunarodnim dio. 2006. URL: http://www.raai.org/resurs/papers/kii-2006/#dokladi (datum pristupa: 23.08.2016).
  11. Paducheva E.V. Semantika tipa i polazište // Izv. Akademija nauka SSSR: Ser. lit. i jezik 1986. T. 45. br. 5. str. 18–25.
  12. Paducheva E.V. Imena predikata u leksikografskom aspektu // Znanstveno-tehnički. inf. 1991. Ser. 2. br. 5. str. 21–31.
  13. WordNet. Leksička baza podataka za engleski jezik. URL: http://wordnet.princeton.edu/ (pristupljeno 23.08.2016.).
  14. Semantic Web. URL: https://ru.wikipedia.org/wiki/Semantic_net (datum pristupa: 23.08.2016.).
  15. Minsky M. Teorija sistema okvira Minskyja // Zbornik radova s ​​radionice Teorijska pitanja u obradi prirodnog jezika (TINLAP "75). 1975, str. 104–116.
  16. Khabarov S.P. Predstavljanje znanja u informacionim sistemima: bilješke sa predavanja. URL: http://www.habarov.spb.ru/bz/bz07.htm (datum pristupa: 23.08.2016.).
  17. Lutsenko E.V. Zastupljenost znanja u informacionim sistemima: elektronika. udžbenik priručnik za studente. Krasnodar: Izdavačka kuća KubGAU, 2010. 428 str.
  18. Konstantinova I.S., Mitrofanova O.A. Ontologije kao sistemi za skladištenje znanja // Vseros. konkurentan selekcija stat. po prioritetu smjer "Informacioni i telekomunikacioni sistemi." 2008. 54 str.
  19. Razin V.V., Tuzovski A.F. Reprezentacija znanja o vremenu uzimajući u obzir nesigurnost u semantičkim WEB ontologijama // Dokl. Tomsk State Univerzitet za upravljačke sisteme i radioelektroniku. 2013. br. 2 (28). str. 157–162.
  20. Patel-Schneider P.F., Horrocks I. et al. SWRL: Jezik pravila semantičkog veba koji kombinuje OWL i RuleML // World Wide Web Consortium (W3C). 2004. URL: http://www.w3.org/Submission/SWRL (datum pristupa: 18.08.2016).
  21. Fillmore Ch. Slučaj za slučaj. Proc. Texas Symp. o jezičkim univerzalijama, 1967, 134 str.
  22. Fillmore Ch. Slučaj slučaja // Novo u stranoj lingvistici. M.: Progres, 1981. str. 369–495.
  23. Dowty D. Tematske proto-uloge i odabir argumenata // Jezik, 1991, sv. 67, br. 3, str. 547–619.
  24. Norvig P., Russell S. Umjetna inteligencija: moderan pristup. M.: Williams, 2007. 1408 str.
  25. Jurafsky D., Martin J. Obrada govora i jezika: Uvod u obradu prirodnog jezika, računarsku lingvistiku i prepoznavanje govora. 2008, 1024 str.
  26. Batura T.V., Murzin F.A. Mašinski orijentisane logičke metode za prikaz semantike teksta na prirodnom jeziku: monografija. Novosibirsk: Izdavačka kuća NSTU, 2008. 248 str.
  27. Vremenska logika. URL: https://ru.wikipedia.org/wiki/Temporal_logic (datum pristupa: 23.08.2016.).
  28. Vendler Z. Glagoli i vremena. The Philosophical Review, 1957, vol. 66, br. 2, str. 143–160.
  29. Paducheva E.V. Leksička aspektualnost i klasifikacija predikata prema Maslov-Vendleru // Pitanja lingvistike. 2009. br. 6. str. 3–21.
  30. Zaključak u logičkim modelima. Metoda rezolucije. URL: http://www.aiportal.ru/articles/knowledge-models/method-resolution.html (datum pristupa: 11.08.2016.).
  31. Boral H., Redfield S. Database Machine Morphology. Proc. 11th Intern. Konf. Veoma velike baze podataka, 1985, str. 59–71.
  32. Fushimi S., Kitsuregawa M., Tanaka H. Pregled sistema paralelne mašine za relacione baze podataka GRACE. Proc. 12th Intern. Konf. Veoma velike baze podataka, 1986, str. 209–219.
  33. Tanaka H. Parallel Inference Engine. IOS Press Publ., 2000, 296 str.
  34. Open Cognition. URL: http://opencog.org/ (datum pristupa: 23.08.2016.).
  35. Link Grammar Parser. AbiWord, 2014. URL: http://www.abisource.com/projects/link-grammar/ (datum pristupa: 20.08.2016.).
  36. Parser prirodnog jezika CMU Link Grammar. URL: https://github.com/opencog/link-grammar/ (datum pristupa: 22.08.2016.).
  37. RelEx Dependency Relationship Extractor. OpenCog. URL: http://wiki.opencog.org/wikihome/index.php/Relex (datum pristupa: 22.08.2016.).
  38. Sokirko A.V. Semantički rječnici u automatskoj obradi teksta (na osnovu materijala iz sistema DIALING). Diss. ...cand. one. Sci. M.: MGPIIYA, 2001. 120 str.
  39. Automatska obrada teksta. URL: http://www.aot.ruhttp://aot.ru/ (datum pristupa: 23.08.2016.).
  40. Prószéky G. Mašinsko prevođenje i hipoteza od pravila do pravila. Novi trendovi u prevoditeljskim studijama (U čast Kinge Klaudy). Budimpešta: Akademiai Kiadó, 2005, str. 207–218.

Metoda semantičkog polja

Ideje i principi semantičke analize jezika, koji su kasnije objedinjeni pod opštim konceptom metode semantičkog polja, razvijali su se postepeno i datiraju iz kraja 19. i početka 20. veka. Među onima koji su se približili formulisanju ovih ideja i principa su, na primer, A. A. Potebnja, M. M. Pokrovski, R. Mejer, G. Šperber, G. Ipsen i drugi.

Pokušavajući da pronađe sistematizirajući princip u smislenoj organizaciji jezika, akademik M.M. Pokrovski je 1895. godine u svom djelu „Semasiološka istraživanja u oblasti drevnih jezika“ napisao: „Riječi i njihova značenja ne žive odvojeno jedna od druge, već su sjedinjeni u našoj duši, bez obzira na našu svijest, u različite grupe, a osnova za grupisanje je sličnost ili direktna suprotnost u osnovnom značenju.”

Richard Meyer u svom djelu iz 1910. godine razlikuje tri tipa semantičkih sistema (klasa): 1) prirodni (nazivi drveća, životinja, dijelova tijela itd.), 2) umjetni (nazivi vojnih činova, komponenti mehanizama itd. .), 3) vještačke (nazivi vojnih činova, komponenti mehanizama itd.), 3) poluvještačke (terminologija lovaca i ribolovaca, nazivi etičkih pojmova itd.).

Principi metode semantičkog polja formulisani su 30-ih godina 20. veka, a nemački naučnik Jost Trier se s pravom smatra njenim osnivačem.

Neki od najvažnijih postulata koji su činili osnovu metode Trierovog semantičkog polja svode se na sljedeće:

1. Slijedeći F. de Saussurea, Trier polazi od činjenice da je jezik određenog perioda stabilan i relativno zatvoren sistem u kojem riječi imaju značenja ne u izolovanom obliku, već u onoj mjeri u kojoj su obdarene drugim susednim rečima. do prvog.

2. Opšti sistem jezika čine dva tipa polja koja su međusobno povezana: a) pojmovna polja, podeljena na elementarne jedinice - pojmove, i b) verbalna polja, takođe podeljena na elementarne jedinice - reči.

3. Jedinice verbalnih polja u potpunosti pokrivaju odgovarajuća konceptualna polja, stvarajući svojevrsni mozaik.

4. Semantička polja su međusobno povezana po principu hijerarhijske podređenosti (šire i uže). S vremenom, semantička polja mijenjaju svoju strukturu, čime se mijenja i leksički sistem jezika u cjelini.

Slijedeći W. Humboldta, jezik se ne tumači kao bitka objektivne stvarnosti, već kao svjetonazor koji karakterizira samodovoljna vrijednost i rasparčavanje stvarnosti na svoj način.

Jedan od klasičnih primjera semantičkog polja je polje pojmova u boji, koje se sastoji od nekoliko serija boja ( crvenarozeružičastagrimizno; plavaplavaplavičastotirkizno itd.): zajednička semantička komponenta ovdje je „boja“.

Semantičko polje ima sljedeća osnovna svojstva:

1. Semantičko polje je intuitivno razumljivo izvornom govorniku i za njega ima psihološku realnost.

2. Semantičko polje je autonomno i može se identifikovati kao nezavisni podsistem jezika.

3. Jedinice semantičkog polja povezane su jednim ili drugim sistemskim semantičkim odnosima.

4. Svako semantičko polje je povezano sa drugim semantičkim poljima jezika i zajedno sa njima čini jezički sistem.

Teorija semantičkih polja zasniva se na ideji postojanja određenih semantičkih grupa u jeziku i mogućnosti da jezičke jedinice uđu u jednu ili više takvih grupa. Konkretno, vokabular jezika (leksis) može se predstaviti kao skup zasebnih grupa riječi ujedinjenih različitim odnosima: sinonim ( pohvaliti sepohvaliti se), antonim ( govoritićuti) i tako dalje.

O mogućnosti takvog predstavljanja vokabulara u obliku kombinacije mnogih posebnih sistema riječi raspravljalo se već u lingvističkim radovima 19. stoljeća, na primjer u radovima M. M. Pokrovskog (1868/69–1942). Prvi pokušaji da se identifikuju semantička polja učinjeni su prilikom kreiranja ideografskih rečnika, ili tezurusa - na primer, P. Rogera. Sam izraz "semantičko polje" počeo se aktivno koristiti nakon objavljivanja radova J. Triera i G. Ipsena. Ovakva reprezentacija leksičkog sistema prvenstveno je lingvistička hipoteza, a ne aksiom, pa se stoga često koristi kao metoda provođenja jezičnog istraživanja, a ne kao cilj.

Elementi posebnog semantičkog polja povezani su regularnim i sistemskim odnosima, te su, shodno tome, sve riječi polja međusobno suprotstavljene. Semantička polja se mogu ukrštati ili potpuno ulaziti jedno u drugo. Značenje svake riječi je najpotpunije određeno samo ako su poznata značenja drugih riječi iz istog područja. Uporedimo dvije serije boja crvenaroze I crveno – roze – ružičasto. Ako se fokusirate samo na prvi red boja, tada se istom leksemom može označiti nekoliko različitih nijansi boja roze. Druga serija boja nam daje detaljniju podjelu nijansi boja, tj. iste nijanse boja će biti u korelaciji sa dvije lekseme - roze I ružičasta.

Zasebna jezička jedinica može imati više značenja i stoga se može svrstati u različita semantička polja. Na primjer, pridjev crvena mogu se uključiti u semantičko polje pojmova boja i istovremeno u polje čije su jedinice objedinjene generalizovanim značenjem „revolucionarno“.

Semantičko obilježje koje leži u osnovi semantičkog polja također se može smatrati određenom konceptualnom kategorijom, na ovaj ili onaj način u korelaciji sa stvarnošću koja okružuje osobu i s njenim iskustvom. Odsustvo oštre suprotnosti između semantičkih i konceptualnih pojmova navodi se u radovima J. Triera, A. V. Bondarka, I. I. Meščanjinova, L. M. Vasiljeva, I. M. Kobozeve. Ovo razmatranje integralnog semantičkog obilježja nije u suprotnosti s činjenicom da izvorni govornici percipiraju semantičko polje kao neku nezavisnu asocijaciju koja je u korelaciji s jednim ili drugim područjem ljudskog iskustva, tj. psihološki realan.

Najjednostavniji tip semantičkog polja je polje paradigmatskog tipa, čije su jedinice lekseme koje pripadaju istom dijelu govora i koje su u značenju objedinjene zajedničkom kategorijalnom semom. Takva polja se često nazivaju i semantičkim klasama ili leksičko-semantičkim grupama.

Kao što su primetili I. M. Kobozeva, L. M. Vasiljev i drugi autori, veze između jedinica zasebnog semantičkog polja mogu se razlikovati po „širini“ i specifičnosti. Najčešći tipovi veza su veze paradigmatskog tipa (sinonimne, antonimske, rod-vrste itd.).



Na primjer, grupa riječi drvo, grana, prtljažnik, list itd. može formirati i nezavisno semantičko polje, ujedinjeno odnosom "dio - cjelina", i biti dio semantičkog polja biljaka. U ovom slučaju leksema drvo služiće kao hiperonim (generički koncept) za lekseme kao što su npr. breza, hrast, dlan itd.

Semantičko polje glagola govora može se predstaviti kao kombinacija sinonimnih nizova ( razgovaratirazgovaratikomunicirati – ...; grditigrditikritikovati...; zadirkivatiismijavatiismijavati- ...) itd.

Primjer minimalnog semantičkog polja paradigmatskog tipa može biti sinonimna grupa, na primjer, određena grupa istih glagola govora. Ovo polje formiraju glagoli govoriti, reci, chat,brbljanje itd. Elemente semantičkog polja glagola govora objedinjuje integralna semantička osobina „govora“, ali njihovo značenje nije identično. Jedinice ovog semantičkog polja razlikuju se po diferencijalnim karakteristikama, na primjer, „međusobna komunikacija“ ( razgovarati), "jednosmjerna komunikacija" ( izvještaj, izvještaj). Osim toga, razlikuju se po stilskim, uobičajenim, derivacijskim i konotativnim komponentama značenja. Na primjer, glagol grditi, pored seme „govoriti“, ima i dodatno konotativno značenje – negativnu ekspresivnost.

Opšte semantičko obeležje koje objedinjuje elemente određenog semantičkog polja može delovati kao diferencijalno obeležje u drugim semantičkim poljima istog jezika. Na primjer, semantičko polje „glagola komunikacije“ će uključivati ​​polje glagola govora zajedno sa leksemama kao što su telegraf, pisati itd. Integralna semantička karakteristika za ovo polje biće znak „prenosa informacija“, a „kanal prenosa informacija“ – usmeni, pismeni itd. – će delovati kao diferencijalno obeležje.

Za identifikaciju i opisivanje semantičkih polja često se koriste metode analize komponenti i asocijativnog eksperimenta. Grupe riječi dobivene kao rezultat asocijativnog eksperimenta nazivaju se asocijativnim poljima.

Sam pojam "semantičko polje" danas se sve više zamjenjuje užim jezičkim terminima: leksičko polje, sinonimski niz, leksičko-semantičko polje itd. Svaki od ovih pojmova jasnije definira vrstu jezičnih jedinica uključenih u polje i/ili vrstu veze između njih. Ipak, u mnogim se radovima i izraz „semantičko polje” i specijalizovanije oznake koriste kao terminološki sinonimi.

Metode lingvističko-stilske analize – ovo je skup različitih tehnika za analizu teksta (i njegovih jezičkih sredstava), uz pomoć kojih se formira znanje u stilistici o obrascima funkcionisanja jezika u različitim sferama komunikacije; metode teorijskog razvoja onoga što se posmatra i otkriva tokom istraživačkog procesa. Uz korištenje općih lingvističkih metoda, stilistika razvija i vlastitu, koja odgovara predmetu istraživanja i ciljevima analize. Postoje pravila za korištenje metoda, kao i njihove sastavne tehnike metodologija stilska analiza. Osim toga, koncept M. s. A. kao i opštiji koncept „metode lingvističke analize“) povezan je sa konceptima aspekt, koncept I metodologija, međutim, ne podudara se po značenju ni sa jednim od njih u potpunosti.

Aspekt istraživanja je „ugao gledanja“, ugao razmatranja“ predmeta stvarnosti, na primer, dijakronija i sinhronija, paradigmatika i sintagmatika, jezik i govor u ukupnosti metoda i tehnika koje se koriste u njihovom proučavanju. (lat. conceptio - razumevanje, sistem) - određeni način razumevanja, tumačenja bilo koje pojave, ideja vodilja za njihovo osvetljavanje, vodeći koncept, konstruktivni princip različitih vrsta aktivnosti.Shodno tome, koncept predodređuje mogući postupak implementacije. (praktična provjera) vlastitih temeljnih odredbi.U tom smislu stilistika kao određeni način sagledavanja jezičkih pojava ne samo da na svoj način koristi postojeće metode u lingvistici, već i predlaže (razvija) svoje.

Metodološka osnova stilske analize u ruskoj lingvistici od 19. stoljeća. temeljne su odredbe o povezanosti jezika i mišljenja, jezika i društva, o društvenoj suštini jezika i njegovih funkcija (djela V. Humboldt, A.A. Potebny, F. de Saussure, B. De Courtenay, M.M. Bahtin, L.S. Vigotski, B.A. Serebrennikova, A.A. Leontjeva, G.P. Shchedrovitsky i sl.).

Sa registracijom funkcionalan stilistika problemi sistematičnosti predmeta koji se proučava, društvene funkcije jezika, razlika između jezika i govora, s naglaskom na problem upotrebe (upotrebe) jezika u različitim oblastima komunikacija povezana različitim vrstama aktivnosti i oblicima svijesti. S tim u vezi, proširuje se metodološka osnova stilistike, oslanjajući se na znanja srodnih humanističkih nauka – filozofije, epistemologije, psihologije, psiholingvistike, naučnih studija itd.

Upotreba određene metode u određenoj istraživačkoj praksi zavisi od svrhe studije. Ako, najopćenitije, pod stilistika razumjeti lingvističku nauku o sredstvima govorne izražajnosti i obrascima jezičnog funkcionisanja, determiniranim odgovarajućom upotrebom jezičnih jedinica u zavisnosti od sadržaja iskaza, ciljeva, situacije, sfere komunikacije i drugih ekstralingvističkih faktora, tada treba prepoznati realnost postojanja različitih ciljeva stilskog istraživanja, od kojih svaki formira određeni metodološki stilski pravac, aspekt istraživanja. Danas postoji šest takvih oblasti koje se razlikuju po metodama (metodologiji) analize predmeta proučavanja: stil resursa , (uključujući praktične ), funkcionalni stil , stil teksta , stilistika književnog teksta , dijahronijska i komparativna stilistika kao ogranci (varijeteti) od stilskih resursa i funkcionalnih. stilistika. Istovremeno, principi funkcionalnog stilistika - kao metodološki širi pravac - prožima sve ostale stilove. pravci: u okviru funkcionalno-stilskog istraživanja mogu se postaviti ciljevi i rešiti problemi koji se odnose na bilo koji od pravaca ili više njih odjednom. konceptualni okvir, ciljni početak će i dalje ostati funkcionalan. stilistika. Teorijska osnova funkcionalni stil je ideja o jedinstvu jezika sa čitavim kompleksom nejezičkih (ekstralingvističkih) faktora koji prate intelektualnu i duhovnu aktivnost osobe i utječu na proces i specifičnosti govorne produkcije. Stoga je predmet njenog istraživanja organizacija govora(konzistentnost govora), tj. ne struktura jezika, ne sama jezička sredstva, već principe njihovog odabira i kombinovanja u različitim oblastima delovanja, u zavisnosti od specifičnih komunikativnih uslova komunikacije i ekstralingvističkih stiloformatora.

IN stil resursa glavna metoda i put analize je od sredstava do funkcija; one. Ovdje je glavni cilj utvrditi da li kao određena stilska jezička sredstva(jedinice i njihovi slojevi sa stilskim bojama) koristi se u tekstovima pojedinačnih radova, autori, žanrovi itd., koji specifične stilske funkcije oni to rade.

U funkciji U stilistici, kao jednom od središnjih pravaca stilistike, opći pristup i metodologija istraživanja su suprotni – od funkcije do sredstva; one. centralna svrha analize je utvrđivanje koje lingvističke i govorna sredstva ostvaruju se osnovne funkcije govornih varijeteta(funkcionalni stilovi, podstilovi, žanrovi), kako ekstralingvistička osnova stilova utiče na formiranje govorne organizacije, govornu sistematičnost stilova. Ovo uzima u obzir interakciju sredstava ne samo iste stilske boje ili jednog nivoa jezika, već interakciju višerazinskih sredstava.

Dakle, funkcija pristup (metoda), Prvo, znači analizu jedinica različitih nivoa jezika, i to ne toliko njihovo strukturno-sistemsko proučavanje koliko komunikacijsko-sistemsko, vodeći računa o ciljevima i ciljevima komunikacije. Drugo, za funkciju stilistiku karakterizira funkcionalna metoda čije je značenje u utvrđivanju značaja pojedinih obrazaca funkcionisanja jezičkih sredstava za specifičnosti govorne sistematičnosti stila i njegovih varijeteta(tekstovi). Treće, funkcionalno-stilska metoda je usko povezana s idejom jedinstva jezičnog i ekstralingvističkog aspekta govora. Ova ideja, pak, predodređuje važnost za funkcionalnu stilistiku principa konzistentnosti, kada se govorna jedinica razumije kao određena komponenta međuzavisnosti u nizu drugih sličnih jedinica, kao i u odnosu ove serije s ekstralingvističkim faktorima. stila. Na osnovu ovog principa, jezičke pojave se razmatraju u funkcionalnom smislu. stilistiku sa stanovišta njihove tekstotvorne uloge. Četvrto, funkcionalno-stilski metod se zasniva na prepoznavanju aktivne prirode jezika (jezika kao intelektualno-emocionalne aktivnosti), pa samim tim i u okviru funkcionalnog. stilistika dobija poseban značaj antropocentrični pristup proučavanju jezičkih fenomena. U ovom slučaju potrebna je i koristi se kompleksna/interdisciplinarna metoda, tj. na osnovu znanja srodnih disciplina (epistemologija, psihologija, psiholingvistika, naučne studije itd.) utvrđuje se kako i koji su ekstralingvistički faktori, a pre svega osnovni (svrha oblika svesti, tip mišljenja koji odgovara na vrstu aktivnosti u društvu, ciljeve i ciljeve komunikacije i sl.), utiču na obrasce funkcionisanja jezičkih sredstava, formirajući specifičnosti stila i njegove govorne organizacije na nivou mikroteksta i makroteksta. Ovo su osnovni principi funkcionalno-stilskog pristupa proučavanju jezika (govora), koji omogućavaju prepoznavanje konstruktivnih metoda za formiranje funkcionalnog. stilova, obrazaca formiranja teksta u svakom od njih itd.

Pored ovih osnovnih, osnovnih principa istraživanja, u funkcionalnim. U stilistici postoje i uzimaju se u obzir sekundarni i derivati ​​od njih. To su: 1) princip jedinstva forme i sadržaja. Formalno-jezičke karakteristike teksta neraskidivo su povezane s njegovim sadržajem, stoga proučavanje specifičnosti funkcionisanja pojedinih jedinica može biti objektivno samo na osnovu prepoznavanja međuzavisnosti površinske (strukturno-jezičke) i unutrašnje (sadržajno-semantički) nivoi teksta. Istovremeno, funkcija stilistika ne analizira površinski nivo teksta sa formalne (gramatičke), već sa funkcionalne i komunikativne strane; 2) princip koordinacije opšteg i pojedinačnog. Ovaj princip uključuje razmatranje posebne stvari - leksičke jedinice, iskaza, složene sintaksičke cjeline ili cijelog teksta - bilo kao jedinice cjeline, koja odražava sva svojstva i karakteristike ove cjeline (na primjer, određeni funkcionalni stil kao što je poseban sistem), tj. u pogledu tipologije; ili kao jedinica krajnje specifične prirode (npr. osobine individualnog stila pisca, naučnika, zakonodavca, publiciste itd.), koja se nalazi u rodno-vrstskom odnosu sa celinom, čiji su „otisci” ipak zadržava.

Na osnovu ovih konceptualnih principa funkcionalne. stilistike, njene najvažnije, osnovne metode analize su: 1) funkcionalna metoda, koja se, za razliku od strukturalne, zasniva, kao što je već rečeno, na pažnji na funkcionalnost. aspekt jezika/govora, kada se jezička sredstva proučavaju sa stanovišta njihove uloge u procesu formiranja i izražavanja misli, pojmova, kompozicija, žanrova itd. Ovdje fokus nije na statičkim svojstvima jezika/govora, već na procesu formiranja govornog teksta. To, pak, predodređuje stvarni komunikativni pristup funkcije. stilistika za objašnjenje jezika, tj. uzimajući u obzir ciljeve, ciljeve, situaciju, uslove komunikacije itd. sve do društvenih i individualnih karakteristika komunikanata; 2) sveobuhvatan metod proučavanja jezika/govora, tj. široko rasprostranjena (i ciljana) upotreba podataka iz različitih nauka – posebno filozofije, psihologije, nauke, logike, sociologije, teorije komunikacije, pragmatike i drugih. drugi – da u procesu naučne interpretacije objasne činjenice dobijene eksperimentom ili posmatranjem; 3) višedimenzionalna analiza odnosa među jezičkim jedinicama na više nivoa u procesu njihovog funkcionisanja, utvrđivanje obrazaca ovog funkcionisanja, specifičnosti funkcionalnog. stilova.

Više privatne metode funkcionalan stilistika - međutim, za nju ništa manje važna u teorijskom smislu - jeste semantički (ili semantičko-semantički), stilostatistički I komparativno-dijahronijski metoda zasnovana na komparativnoj istorijskoj analizi iskaza/tekstova. Istovremeno, semantička metoda se može smatrati vodećim u ovoj grupi specifičnijih tipova stilova. analiza, koja je povezana sa posebnom pažnjom na funkcije. stilistika na problem adekvatnosti izraza u iskazu/tekstu različitih nijansi značenja.

dakle, semantička metoda povezana sa analizom određenih jezičkih (govornih/tekst) elemenata sa stanovišta njihov sadržaj i semantičko značenje u okolnom kontekstu ili cijelom djelu, kao i sa stanovišta definicije specifičnosti interakcije između spoljašnjih i unutrašnjih članova iskaza. Stilostatistička metoda koristi se za određivanje stilske specifičnosti kao posledica uticaja pojedinih ekstralingvističkih faktora na ovaj stil. Korišćenjem komparativna metoda analize u stilistici se utvrđuje specifičnost svakog govornog stila, njihova funkcionalna, jezička, kompoziciona i semantičko-semantička originalnost u međusobnom odnosu. Uporedno-dijahronijska metoda dizajniran da pomogne u proučavanju procesa formiranja funkcija. stilova u vezi sa promenama društveno-istorijskih uslova ljudskog života i, posledično, ekstralingvističkih faktora jezika. Ova metoda se koristi kada se proučavaju specifičnosti funkcionisanja pojedinih jedinica u jeziku/govoru/tekstu bilo kojeg vremenskog perioda, kao i kada se proučavaju obrasci formiranja stilskog i funkcionalnog sistema. stilova unutar lit. jezik.

Pored navedenih početnih, opštih metoda i principa funkcionalno-stilske analize, danas u stilistici postoji niz specifičnih praktičnih metoda, odnosno tehnika za neposredno sprovođenje stilskog proučavanja jezika. Mogu se podijeliti na:

1) opšte naučne, među kojima se ističu

a) metoda direktnog posmatranja,

b) deskriptivna metoda sa posebnim tehnikama kao što su posmatranje, poređenje, klasifikacija, eksperiment, rekonstrukcija, generalizacija, interpretacija,

c) metoda modeliranja

; 2) opšte filološke, uključujući tehniku ​​interpretacije i komparativnu analizu jezičkog materijala;

3) opštelingvističke metode prikazane u stilističkim studijama

a) strukturnu, posebno strukturno-semantičku analizu,

b) statističku analizu,

c) metoda konstruisanja lingvističkih paradigmi,

d) metoda strukturiranja polja,

e) kompleksna analiza;

4) privatni lingvistički, uklj. vlasničkih metoda, ujedinjenje

a) analiza diskursa,

b) analiza distribucije,

c) analiza komponenti,

d) metod postupne identifikacije objekta istraživanja,

e) kontekstualna ili kontekstuološka analiza,

e) pragmatičan,

g) porodična analiza,

h) strukturnu i semantičku analizu materijala,

i) analiza diskursa i neke. itd.

Specifična primjena M. s. A. određena ciljevima, zadacima, metodološkim i konceptualnim smjernicama studije, kao i pripadnosti naučnika određenoj lingvističkoj školi. U tom smislu, metode poput analize diskursa, kompleksne analize i metode strukturiranja polja donekle su modificirane u okviru funkcionalnog. stilistika. dakle, metod strukturiranja polja koristi se za sistematizaciju identifikovanih stilskih sredstava (ne samo predtekstualnih, već i tekstualnih) u smislu njihove blizine/udaljenosti (centralnost/periferija) u smislu implementacije određene stilske karakteristike ili kategorije u tekstu. Metoda analize diskursa nije shvaćena kao analiza određenih strukturno-semantičkih konteksta cjeline – npr. fragmenti teksta koji sadrže ekspresivnost, imperativnost, potcenjivanje itd. - već kao analizirano ili drugo strukturno i semantičko obeležje teksta u njegovoj povezanosti sa ekstralingvističkim osnovama komunikacije određene govorne sfere. Sveobuhvatna analiza u okviru funkcija. stilistika ne uključuje jednostavno kombiniranje različitih vrsta i tehnika istraživanja (kao, na primjer, u drugim disciplinama), već, uglavnom, uzimanje u obzir veze između specifičnih činjenica funkcionisanja jezika u određenoj sferi komunikacije s različitim proučavanim ekstralingvističkim pojavama. u drugim naukama. Štaviše, oslanjanje na podatke iz drugih nauka - filozofije, logike, sociologije, naučnih studija, psihologije, psiholingvistike, pragmatike, semiotike, teorije komunikacije, kulturoloških studija, itd. - deluje kao objašnjavajuća osnova za proučavanje obrazaca funkcionisanja jezika (govora ).

Osim toga, u okviru funkcije primaju se posebni sadržaji. stilistika metoda interpretacije , povezano s objašnjenjem i interpretacijom funkcija. specifičnost ne toliko predtekstualnih jedinica, koliko tekstualnih, sa pristupom interpretaciji cijelog teksta = djela.

Uzimajući u obzir ciljeve, podciljeve i zadatke komunikacije u procesu kognitivne i govorno-mentalne aktivnosti koji se ogledaju u tekstu, dok identifikujući njihovu projekciju na određeni tekst, njegove sadržajno-semantičke jedinice i govorne žanrove, moguće je odrediti strukturu. i kompozicija teksta na nivou mikroteksta, primarni govorni žanrovi kao odraz dinamike govorne i misaone aktivnosti. Istovremeno, stilostatistička i kvantitativna, odnosno kvalitativna (uzimajući u obzir semantiku) kvantitativna metoda (radi O. Sirotinina, M.A. Kormilitsyna, V.V. Odintsova, O.A. Krylova, Yu.A. Škrebneva, N.M. Razinkina, E.A. Bazhenova, V.A. Salimovski, N.A. Kupina, V.V. Dementieva, K.F. Sedova, I.A. Sternina i sl.).

Posebna grupa Gospođa. A. predstavljaju tehnike koje se koriste za analizu književni tekst(x.t). Studija x. tj. polazi od principa opće slikovitosti, jedinstva forme i sadržaja, te implementacije estetske funkcije jezika u ovoj sferi komunikacije. Glavni metod (pristup) analize predmeta koji se proučava je da se utvrdi kako je cjelokupna struktura govora pojedinog umjetnika. kontekst, djelo (niz tekstova pisca, književni pokret i sl.) i njegove pojedinačne jezičke i tekstualne cjeline (stilska sredstva, kompozicija i sl.) doprinosi izražavanju idejnog i figurativnog sadržaja djela, implementira to u tekstu" autorska slika" .

Jedna od najranijih metoda analize korišćenih u ruskoj stilistici je metoda „explication du text“, koju je razvio i primenio L.V. Shcherboy kada analizira umjetnost. i karakteristike kreativnih radova. Suština ove metode je da se utvrdi interakcija jezičke organizacije (osobine arhitektonike, specifične sintaktičke strukture, tehnike i principi rasporeda i rasporeda riječi, oblici i vrste intonacijske podjele iskaza itd.) sa idejnim, umjetničkim i emocionalni sadržaj teksta. Interakcija se u ovom slučaju posmatra kao konstruktivni međusobni uticaj, kojim se stvara (materijalizuje, izražava) estetski koncept autora dela u celom delu.

A.M. Peshkovsky je razvio metodu stilskog eksperimenta, koja se sastoji od zamjene sinonima za određenu riječ u djelu (ili uklanjanja bilo koje riječi iz njega) i određivanja estetskog značaja autorove riječi/izraza, njenog konceptualnog, figurativnog i semantičkog opterećenja u odnosu na eksperimentalni tekstovi. sri Koncept "opće slike" koji je uveo naučnik, a sastoji se u činjenici da su sve jezičke jedinice jedne ili druge zaista umjetničke. tekstovi su usmjereni na izraz određenog umjetnika. slike i stoga su strogo estetski i stilski motivisane, tj. jedini mogući načini izražavanja date estetske misli.

Umjetnička analiza prikazani su tekstovi i pristup njima B.A. Larin, čiji je cilj otkrivanje sistemskih odnosa riječi sa drugim umjetničkim riječima. cjelinu kada se izražava tzv. end-to-end poetska misao-ideja (ili lajtmotiv) djela, umjetnika. slika. To je odlika umjetnika. naučnik je imenovao reči "kombinatorno povećanje značenja", pojavljujući se jednom riječju u dinamici sadržajno-konceptualnog razvoja svih x. t. (cjelina), kao i idiostil pisca. Blizu tome je i ideja G.O. Vinokura o "unutrašnji oblik umjetničke riječi", koji se sastoji u tome da se leksička sredstva jezika i njihova značenja pojavljuju u x. odnosno osnova od koje umjetnik stvara poetsku riječ – metaforu, u potpunosti „orijentisanu“ na temu i ideju djela. Istovremeno, smisao i svrha umjetnosti. Metafore se mogu razumjeti tek nakon čitanja cijelog djela, odnosno proizilaze iz estetske cjeline.

Uopšteno govoreći, sve ove metode mogu se uslovno kombinovati u opštiju metodu nazvanu „riječ i slika” i fokusirati se na identifikaciju u x. t. Sistemi jezičkih sredstava za ostvarivanje figurativno-estetičkih funkcija umjetnički stil govori. Ova metoda ima za cilj postizanje što adekvatnijeg čitanja autorovog teksta; u aspektu jedinstva riječi i slike otkriva se priroda individualnog stila pisca, književnog pravca, tj. Rješavaju se različiti problemi interpretacije x. t. sri. u vezi s tim, koju je razvio V.V. Vinogradovljeva načela izučavanja umjetničkog jezika. književnost kao umjetnost poetske riječi, umjetnički jezik. rad, individualni autorski stil i sam koncept „imidža autora“, kao i razvoj ovih ideja u radovima V.V. Odintsova, N.A. Kozhevnikova, L.A. Novikova, V.P. Grigorieva, D.N. Shmeleva, I.Ya. Chernukhina i drugi.

U području stilska analiza X. tj. najčešće metode su asocijativno-konceptualna analiza poetskog (umjetničkog) teksta , otkrivajući njegova dominantna značenja. Ova analiza kombinuje sledeće specifične istraživačke aktivnosti: komponentnu analizu, kontekstuološku analizu, estetsku i stilsku analizu, kulturološku analizu koja povezuje tekstualna značenja sa informacijama iz opšteg kulturnog fonda. Proučava se i hemijska tehnologija tematsko-klasifikacione, semantičke, formalno-kognitivne vrste analize, usmjeren na proučavanje strukturnih i sadržajnih obilježja pojedinog pojma u x. T .; konceptualnu analizu, osmišljen da identifikuje ideje pojmova kao normativno-vrednosnih činjenica u poetskom (umjetničkom) stvaralaštvu; metoda strukturno-fragmentalnog opisa , zasnovan na konceptu sistematskog x. tj. i obezbjeđivanje odabira pojedinačnih fragmenata u svrhu poređenja; komparativna i stilska analiza , koji vam omogućava da uporedite početni (nacrt) teksta sa njegovom konačnom verzijom kako biste identifikovali karakteristike autorovog rada na konceptu dela; metoda jezičko-poetske interpretacije , koji podrazumeva tumačenje sadržaja teksta na osnovu otkrivanja sistemsko-semantičkih odnosa jezičkih jedinica različitih nivoa. Osim toga, prilikom proučavanja č.t. je u širokoj upotrebi poslednjih godina sveobuhvatna analiza , kombinujući različite vrste ne samo lingvističke, već i književne analize.

Komunikativni stil književnog teksta koji se pojavio posljednjih godina zaslužuje posebnu pažnju. U vezi sa posebnim istraživačkim zadacima, komunikativna stilistika x. t. razvija sopstvene metode (tehnike) analize, koje se generalno mogu predstaviti u tri varijante: metoda asocijativnog polja, “regulatorno strukturiranje” i metoda informatičke i semantičke analize .

Metoda asocijativnog polja na osnovu identifikacije u x. tj. asocijativne veze između riječi. U ovom slučaju, analiza leksema se odvija na različitim nivoima, kada se istovremeno uzimaju u obzir njihov fonemski izgled i gramatička priroda, morfemska struktura i leksičko značenje, stilska markacija i tematska i situaciona korelacija itd. Upravo zahvaljujući svojim asocijativnim vezama riječ postaje „dirigent“ autorovog estetskog koncepta, izraženog u cijelom djelu, te doprinosi definisanju autorove konceptualne i jezičke slike svijeta i njegovog idiostila.

Metoda "regulatornog strukturiranja".„podrazumeva prepoznavanje regulatornih struktura (regulativa) u tekstu koji stimulišu različite komunikativne efekte i predstavljaju tekstualne strukture-stimuluse. Potonje se shvataju kao metode organizovanja tekstualnih mikrostruktura u korelaciji sa opštom komunikativnom strategijom teksta. Regulatori se identifikuju i formiraju na osnova leksičkih sredstava koreliranih u percepciji čitaoca po principu asocijativnih veza, stoga psiholingvistički eksperiment i kontekstualna analiza ovdje služe kao pomoćne metode analize.

Korišćenjem informaciono-semantički metod Provodi se analiza semantičkog razvoja teksta u cilju proučavanja procesa formiranja značenja na osnovu informacija predstavljenih u umjetnosti. rad. Ispod informacije ovdje spoznaju o svijetu oličenu u tekstu razumijemo sa stanovišta određenog estetskog ideala autora. Rezultat refleksije ove informacije u svijesti adresata je značenje teksta, koji se shvaća kao struktura lingvistički formiranih semantičkih fragmenata teksta koji koreliraju sa stvarnim svijetom, tj. semantička struktura teksta. Specifične tehnike ove metode su a) eksperimentalna analiza, koja omogućava da se identifikuju ključni elementi leksičkog sistema teksta i značenja koja se njime aktuelizuju, da se prouči mehanizam postepenog formiranja značenja u umu adresata u procesu njegove kognitivne aktivnosti, utvrditi individualnu autorsku specifičnost u razvoju estetskog značenja, osobine ovog procesa u tekstovima različitih tipova zbog različitih komunikacijskih strategija i sl. b) kontekstualna analiza; c) analizu komponenti; d) modeliranje tekstualnih paradigmi i asocijativnih semantičkih polja pojmova.

Treba napomenuti da je u modernoj funkcionalnosti. stilistika - posebno u vezi sa prelaskom na proučavanje čitavog teksta - koristi se precizno kompleksna metodologija istraživanja kako sa stanovišta kombinovanja različitih vrsta analize u okviru konkretnog dela, tako i sa stanovišta komplementarne kombinacije stvarnih jezičkih i ekstralingvističkih planova intelektualne i duhovne delatnosti. U funkciji stilistika Kompleksan pristup proučavanje govornog tkiva teksta nije samo jedna od metoda, već je osnova funkcionalno-stilske analize.