VRSTA GRADIVA | analitična raven (sestavni del), tekstovno gradivo, tiskano, 1.01 - izvirni znanstveni članek |
DRŽAVA IZIDA | Slovenija |
LETO IZIDA | 2002 |
PISAVA | latinica |
AVTOR | Leskovar, Robert T. - avtor |
ODGOVORNOST | Györkös, József - avtor // Rozman, Ivan - avtor |
NASLOV | Gradnja hierarhične strukture konceptov iz nestrukturiranih tekstovnih dokumentov |
V PUBLIKACIJI | Uporabna informatika. - ISSN 1318-1882. - ǂLetn. ǂ10, ǂšt. ǂ2 (apr/maj/jun 2002), str. 102-112. |
KRATKA VSEBINA | Metode za iskanje po obsežnih bazah dokumentovin za klasificiranje dokumentov pogosto uporabljajo za učinkovitejše delovanje vnaprej pripravljene opise področnih kategorij. V prispevku je predstavljena izvirna metoda za samodejno gradnjo hierarhičnie strukture vsebinskih konceptov, ki jih določi z analizo množice dokumentov. Strukturaomogoča učinkovito brskanje in iskanje po vsebinskih konceptih ter zelo poenostavi oblikovanje opisa področnih kategorij za poljubno množico dokumentov. Metoda je zasnovana neodvisno od jezika, v katerem je zapisana vsebina dokumentov. Predstavljeni sta tudi razširitvi za semantično povezovanje konceptov in za pospešitev delovanja metode. // Document retrieval methods, implemented for large document collections and document classification methods often use predefined description of subject categories to improve their efficiency. In the article the original method for automated construction of a hierarchical concept structure is presented. The structure is built through an analysis of the documents in acollection. Such a structure makes efficient concept browsing and searchingfeasible and simplifies defining of subject category descriptions for arbitrary document collections. The method is independent of language used in documents. Two improvements are introduced as well, aiming at connectingthe concepts semantically and improving a processing capacity of the method. |
OPOMBE | Povzetek // Bibliografija: str. 111-112 |
OSTALI NASLOVI | Construction of a hierarchical concept structure from unstructured text documents |
PREDMETNE OZNAKE | // indeksiranje // vsebinska obdelava // hierarhična struktura // matematični modeli |
UDK | 007 |