VRSTA GRADIVA | analitična raven (sestavni del), tekstovno gradivo, tiskano, 1.02 - pregledni znanstveni članek |
DRŽAVA IZIDA | Slovenija |
LETO IZIDA | 2004 |
JEZIK BESEDILA/IZVIRNIKA | slovenski |
PISAVA | latinica |
AVTOR | Erjavec, Tomaž - avtor |
ODGOVORNOST | Vintar, Špela - avtor |
NASLOV | Korpus kot podpora slovarju informacijskega izrazja slovenskega jezika |
V PUBLIKACIJI | Uporabna informatika. - ISSN 1318-1882. - ǂLetn. ǂ12, ǂšt. ǂ2 (apr./maj/jun. 2004), str. 97-106. |
KRATKA VSEBINA | Prispevek predstavi uporabo zbirke besedil (jezikovnega korpusa) pri izdelavi terminološkega slovarja. Spletni slovar informacijskega izrazja slovenskega jezika nastaja pri jezikovni sekciji Slovenskega društva informatika (SDI), društvo pa organizira tudi letne konference "Dnevi slovenske informatike" (DSI) s tiskanimi zborniki. V prispevku najprej predstavimo slovar, nato pa se osredotočimo na izgradnjo korpusa s področja informatike, ki trenutno zajema zbornik konference DSI 2003. Izdelava korpusa temelji na uporabi tehnologij XML in je sestavljena iz pretvorbe prispevkov v zborniku iz izvornega zapisa (Microsoft Word) v osnovni zapis XML, nato pa v obliko, primerno za spletno iskanje. Manjši del korpusa je dvojezični in vsebuje slovenske in angleške stavčno poravnane povzetke prispevkov. Izvorni namen izdelave korpusa DSI je slovaropisni, saj bi z njim po eni strani želeli sodelujočim olajšati izdelavo slovarja SDI, po drugi strani pa ponuditi uporabnikom dodatni vir primerov za iskani termin. V članku opišemo postopke izdelave korpusa in računalniško podprtega iskanja izrazov, pri katerih so sodelovali tudi študentje prevajalstva na Filozofske fakultete Univerze v Ljubljani. Prispevek obravnava tudi načrte za nadaljnje delo, ki poleg razširitve korpusa predvidevajo tudi oblikoskladenjsko označevanje in lematizacijo besed v korpusu ter avtomatsko luščenje področnih terminov. |
OPOMBE | Bibliografija: str. 106 // Povzetek ; Abstract |
PREDMETNE OZNAKE | // strojno prevajanje // računalniške tehnologije // računalniška lingvistika // korpusi |
UDK | 004:81'25 |