Skip Navigation Linksdomov > napredno iskanje > rezultati > izpis
Zapis SUTRS

VRSTA GRADIVAanalitična raven (sestavni del), tekstovno gradivo, tiskano, 1.02 - pregledni znanstveni članek
DRŽAVA IZIDASlovenija
LETO IZIDA2004
JEZIK BESEDILA/IZVIRNIKAslovenski
PISAVAlatinica
AVTORErjavec, Tomaž - avtor
ODGOVORNOSTVintar, Špela - avtor
NASLOVKorpus kot podpora slovarju informacijskega izrazja slovenskega jezika
V PUBLIKACIJIUporabna informatika. - ISSN 1318-1882. - ǂLetn. ǂ12, ǂšt. ǂ2 (apr./maj/jun. 2004), str. 97-106.
KRATKA VSEBINAPrispevek predstavi uporabo zbirke besedil (jezikovnega korpusa) pri izdelavi terminološkega slovarja. Spletni slovar informacijskega izrazja slovenskega jezika nastaja pri jezikovni sekciji Slovenskega društva informatika (SDI), društvo pa organizira tudi letne konference "Dnevi slovenske informatike" (DSI) s tiskanimi zborniki. V prispevku najprej predstavimo slovar, nato pa se osredotočimo na izgradnjo korpusa s področja informatike, ki trenutno zajema zbornik konference DSI 2003. Izdelava korpusa temelji na uporabi tehnologij XML in je sestavljena iz pretvorbe prispevkov v zborniku iz izvornega zapisa (Microsoft Word) v osnovni zapis XML, nato pa v obliko, primerno za spletno iskanje. Manjši del korpusa je dvojezični in vsebuje slovenske in angleške stavčno poravnane povzetke prispevkov. Izvorni namen izdelave korpusa DSI je slovaropisni, saj bi z njim po eni strani želeli sodelujočim olajšati izdelavo slovarja SDI, po drugi strani pa ponuditi uporabnikom dodatni vir primerov za iskani termin. V članku opišemo postopke izdelave korpusa in računalniško podprtega iskanja izrazov, pri katerih so sodelovali tudi študentje prevajalstva na Filozofske fakultete Univerze v Ljubljani. Prispevek obravnava tudi načrte za nadaljnje delo, ki poleg razširitve korpusa predvidevajo tudi oblikoskladenjsko označevanje in lematizacijo besed v korpusu ter avtomatsko luščenje področnih terminov.
OPOMBEBibliografija: str. 106 // Povzetek ; Abstract
PREDMETNE OZNAKE// strojno prevajanje // računalniške tehnologije // računalniška lingvistika // korpusi
UDK004:81'25

izvedba, lastnina in pravice: NUK 2010