Detail publikace
Nalezení slovních kořenů v češtině
CHMELAŘ Petr, HELLEBRAND David, HRUŠECKÝ Michal a BARTÍK Vladimír. Nalezení slovních kořenů v češtině. CEUR Workshop Proceedings, roč. 2011, č. 802, s. 12. ISSN 1613-0073. Dostupné z: http://www.ceur-ws.org/Vol-802
Název anglicky
Czech Stemming Algorithm
Typ
článek v časopise
Jazyk
čeština
Autoři
Chmelař Petr, Ing. (UIFS FIT VUT)
Hellebrand David, Ing. (FIT VUT)
Hrušecký Michal (MFF UK)
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT)
Hellebrand David, Ing. (FIT VUT)
Hrušecký Michal (MFF UK)
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT)
URL
Abstrakt
Cílem bylo vytvořit stematizační algoritmus pro český jazyk
založený na gramatických pravidlech jako doplněk k metodám používa-
jícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje
základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů.
Hlavním přínosem této práce je Snowball implementace stematizačního
algoritmu českého jazyka na základě kompletní sady všech předpon a
přípon, které se mohou v českém jazyce vyskytovat.
Rok
2011
Strany
12
Časopis
CEUR Workshop Proceedings, roč. 2011, č. 802, ISSN 1613-0073
Kniha
Selected papers from the 10th annual Czech and Slovak knowledge technology conference (Znalosti 2011)
Vydavatel
Aachen University of Technology
Místo
Aachen, DE
BibTeX
@ARTICLE{FITPUB9952, author = "Petr Chmela\v{r} and David Hellebrand and Michal Hru\v{s}eck\'{y} and Vladim\'{i}r Bart\'{i}k", title = "Nalezen\'{i} slovn\'{i}ch ko\v{r}en\r{u} v \v{c}e\v{s}tin\v{e}", pages = 12, booktitle = "Selected papers from the 10th annual Czech and Slovak knowledge technology conference (Znalosti 2011)", journal = "CEUR Workshop Proceedings", volume = 2011, number = 802, year = 2011, location = "Aachen, DE", publisher = "Aachen University of Technology", ISSN = "1613-0073", language = "czech", url = "https://www.fit.vut.cz/research/publication/9952" }