Detail předmětu
Zpracování přirozeného jazyka
ZPD Ak. rok 2014/2015 zimní semestr
Východiska počítačového zpracování přirozeného jazyka, jazyková data v korpusech, roviny: fonetika, fonologie, morfologie, syntax, sémantika, pragmatika, klasické a formální gramatiky: reprezentace morfologických a syntaktických struktur, reprezentace významu, bezkontextové gramatiky a jejich kontextová rozšíření, gramatiky DCG (Definite Clause Grammars), algoritmus CKY (Cocke-Kasami-Younger), chart-parsing, problém víceznačnosti, počítačové slovníky: reprezentace znalostí o lexikálních jednotkách, typy slovníků, lexikální sémantika, reprezentace významu věty, princip kompozicionality: skládání významů, sémantické klasifikace: valenční rámce, predikáty, ontologie, transparentní intenzionální logika a její aplikace na analýzu významů vět přirozeného jazyka, pragmatika: sémantická a pragmatická povaha jmenných skupin, struktura promluvy, deiktické výrazy, kontexty, porozumění jazyku: význam, inference a reprezentace znalostí.
Garant předmětu
Jazyk výuky
Zakončení
Zajišťuje ústav
Získané dovednosti, znalosti a kompetence z předmětu
Studenti se seznámí s metodami, postupy a nástroji, které se používají v oblasti zpracování přirozeného jazyka, budou schopni navrhovat programy pro komunikaci v přirozeném jazyce, analyzátory a jednoduché odvozovací systémy pracující s přirozeným jazykem.
Cíle předmětu
Porozumět počítačovému zpracování přirozeného jazyka a naučit se aplikovat základní algoritmy a metody v této oblasti. Seznámit se s algoritmickým popisem jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické a se zdroji jazykových dat - korpusy. Pochopit základní principy reprezentace znalostí, inference a vztahů k umělé inteligenci. Na každé rovině se vždy seznámit s teoretickými východisky, ale i používaným algoritmickým popisem a nástroji. Seznámit se s možnostmi kombinace těchto nástrojů do složitějších systémů.
Požadované prerekvizitní znalosti a dovednosti
Nejsou žádné prerekvizity.
Literatura studijní
- Hajičová, E., Panevová, J., Sgall, P., Úvod do teoretické a počítačové lingvistiky, sv. I., Teoretická lingvistika, Praha: Karolinum, 2002, ISBN 8024604701.
- Mařík,V., Štěpánková,O., Lažanský, J. a kol.: Umělá inteligence (4), ACADEMIA Praha, 2003, ISBN 80-200-1044-0.
Literatura referenční
- Allen, J., Natural language understanding. 2nd ed. Redwood City : Benjamin/Cummings Publishing Company, 1995. ISBN 0-8053-0334-0.
- Manning, C. D., Schütze, H., Foundations of Statistical Natural Language Processing, MIT Press, 1999, ISBN 0-262-13360-1.
Osnova seminářů
- Pokročilé metody kategorizace textů, podobnost dokumentů
- Morfologická analýza na počítači, flektivní a derivativní morfologie, struktura trie pro uložení slovníku
- Syntaktická analýza přirozeného jazyka pro jazykové modelování
- Pravděpodobnostní syntaktická analýza, automatické zarovnávání textů, strojový překlad
- Lexikální sémantika, slovníky vs. encyklopedie, princip kompozicionality
- Technologie sémantického webu, ontologie, OWL
Průběžná kontrola studia
Hodnocení studia je založeno na bodovacím systému. Pro úspěšné absolvování předmětu je nutno dosáhnout 50 bodů.
Kontrolovaná výuka
Výuka není kontrolována.