Skip Navigation Linksdomov > napredno iskanje > rezultati > izpis
Zapis SUTRS

VRSTA GRADIVAanalitična raven (sestavni del), tekstovno gradivo, tiskano, 1.01 - izvirni znanstveni članek
DRŽAVA IZIDASlovenija
LETO IZIDA2000
JEZIK BESEDILA/IZVIRNIKAslovenski
PISAVAlatinica
ODGOVORNOSTSepesy Maučec, Mirjam - avtor // Brest, Janez - avtor // Kačič, Zdravko - avtor // Žumer, Viljem - avtor
NASLOVStatistično modeliranje naravnega jezika pri avtomatskem razpoznavanju govora z uporabo heterogenega računalniškega sistema = On solving statistical language modeling for speech recognition using a heterogeneous computing system
V PUBLIKACIJIElektrotehniški vestnik. - ISSN 0013-5852. -ǂLetn. ǂ67, ǂšt. ǂ1 (2000), str. 55-61.
KRATKA VSEBINAV članku obravnavamo verjetnostno modeliranje naravnega jezika. Najprej predstavimo splošno zasnovo jezikovnih modelov. Vmodele vključimo posebno strukturo - razred. Tako omilimo problem določanjaverjetnosti iz razpršenih podatkov. V nadaljevanju opišemo postopek za avtomatsko generiranje razredov. Časovna zahtevnost teh postopkov hitro narašča. V drugem delu članka podamo nekaj izboljšav. Algoritme za razvrščanje besed v razrede paraleliziramo in jih izvajamo na heterogenem računalniškem sistemu. Da je izvajanje programov na heterogenem računalniškem sistemu čim hitrejše, uporabimo še dinamično razvrščanje opravil. Teoretično razmišljanje podkrepimo z eksperimentalnimi rezultati. V sklepu podamo smernice za nadaljnje delo. // In this article we discuss probabilistic language modeling. We explain the basic principles of building an n-gram language model. We define metrics of model quality, called perplexity. We introduce a certain type of structure into a languagemodel by using the concept of word equivalence classes. Using classes enables to reduce the problem of sparse date, because the number of model parameters is much smaller in the case of class-based models than in thecase word based models. In the secon part we describe some futrher improvements of clustering algorithm. The main idea is to improve the clustering algorithm. Therefore, we introduce the randomized version of algorithms. Secondly, we paralelized algorithms to execute on a heterogeneous computing system.
OPOMBEBesedilo samo v slov. // Bibliografija: str. 61 // Povzetek
PREDMETNE OZNAKE// naravni jeziki // modeliranje // procesiranje // govor
UDK004.4:621.391

izvedba, lastnina in pravice: NUK 2010