Skip Navigation Linksdomov > napredno iskanje > rezultati > izpis
Zapis SUTRS

VRSTA GRADIVAanalitična raven (sestavni del), tekstovno gradivo, tiskano, 1.01 - izvirni znanstveni članek
DRŽAVA IZIDASlovenija
LETO IZIDA2002
JEZIK BESEDILA/IZVIRNIKAslovenski
PISAVAlatinica
AVTORVilar, Polona - avtor
ODGOVORNOSTMaver, Jasna - avtor
NASLOVKrnjenje slovenskih besedil s področja bibliotekarstva
V PUBLIKACIJIKnjižnica. - ISSN 0023-2424. - ǂLeto ǂ46, ǂšt. ǂ1/2 (2002), str. 111-136.
KRATKA VSEBINAPrispevek predstavlja pripravo algoritma za krnjenje slovenskih besedil s področja bibliotekarstva, ki je potekal v treh fazah: učni, testni in evalvacijski. Predstavljena je priprava oz. učenje Optimalnega algoritma za krnjenje bibliotekarskih besedil, njegovo testiranje in primerjava z dvema drugima algoritmoma za krnjenje, imenovanima Popovičev in Generični. Za učenjeje bil uporabljen korpus 790.000 besed s področja bibliotekarstva. Zgrajeni so bili seznami krnov, besednih končnic ter blokiranih besed. Testna faza je obsegala testiranje algoritma, predvsem zgrajenih sestavnih delov, z dodatnim korpusom, obsegajočim 167.000 besed. V evalvacijski fazi je bila izvedena primerjava delovanja omenjenih treh algoritmov na istem korpusu. Rezultati delovanja algoritmov so primerjani z intelektualno pripravljenim kontrolnim rezultatom. V njem so množice semantično povezanih besed, zastopane s krni.Spremljano je premalo natančno krnjenje - koliko krnov za semantično povezane besede izdela posamezen algoritem. Rezultati so statistično obdelani s Kruskal-Wallisovim testom. Optimalni algoritem daje najboljše rezultate. Največkrat doseže popolno ujemanje s kontrolnim rezultatom in hkrati izdela najmanj krnov za en pomen. Sledi Popovičev z majhnim odstopanjem. Najmanj natančen je Generični. Opisani postopki lahko predstavljajo izhodišče za nadaljnjo gradnjo orodij za avtomatsko indeksiranje dokumentov s področja bibliotekarstva in poizvedovanje po njih.
OPOMBEBibliografija: str. 135-136 // Izvleček ; Abstract
PREDMETNE OZNAKE// avtomatsko krnjenje // algoritmi // slovenski jezik // bibliotekarstvo
UDK001.4:02:004.021

izvedba, lastnina in pravice: NUK 2010