Detail produktu

Český stemmer v jazyce Snowball

Vznik: 2010

Název anglicky
Czech Snowball Stemmer
Typ
software
Licence
K využití výsledku jiným subjektem je vždy nutné nabytí licence
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje licenční poplatek
Autoři
Hellebrand David, Ing.
Chmelař Petr, Ing.
Klíčová slova

Lemmatizace, stematizace, Snowball, český jazyk, gramatika.

Popis

Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat.

Dokumentace jazyka Snowball na adrese snowball.tartarus.org a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473.

Umístění
Licenční podmínky

Copyright (C) 2010 Vysoké učení technické v Brně

Stažením, kopírováním, instalováním, nebo používáním souhlasíte s GNU General Public License (přiložena).

Soubory
Projekty
Rozpoznávání a prezentace informací z multimediálních dat, VUT, Vnitřní projekty VUT, FIT-S-10-2, 2010, zahájení: 2010-04-01, ukončení: 2010-12-31, ukončen
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Pracoviště
Nahoru