Detail předmětu
Zpracování přirozeného jazyka
ZPJ Ak. rok 2014/2015 zimní semestr 5 kreditů
Východiska počítačového zpracování přirozeného jazyka, jazyková data v korpusech, roviny: fonetika, fonologie, morfologie, syntax, sémantika, pragmatika, klasické a formální gramatiky: reprezentace morfologických a syntaktických struktur, reprezentace významu, bezkontextové gramatiky a jejich kontextová rozšíření, gramatiky DCG (Definite Clause Grammars), algoritmus CKY (Cocke-Kasami-Younger), chart-parsing, problém víceznačnosti, počítačové slovníky: reprezentace znalostí o lexikálních jednotkách, typy slovníků, lexikální sémantika, reprezentace významu věty, princip kompozicionality: skládání významů, sémantické klasifikace: valenční rámce, predikáty, ontologie, transparentní intenzionální logika a její aplikace na analýzu významů vět přirozeného jazyka, pragmatika: sémantická a pragmatická povaha jmenných skupin, struktura promluvy, deiktické výrazy, kontexty, porozumění jazyku: význam, inference a reprezentace znalostí.
Garant předmětu
Jazyk výuky
Zakončení
Rozsah
Zajišťuje ústav
Získané dovednosti, znalosti a kompetence z předmětu
Studenti se v rámci předmětu seznámí s problematikou počítačového zpracování přirozeného jazyka a naučí se aplikovat základní algoritmy a metody v této oblasti. Porozumí algoritmickému popisu jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické a práci se zdroji jazykových dat - korpusy. Pochopí rovněž základní principy reprezentace znalostí, inference a vztahů k umělé inteligenci.
Studenti se naučí řešit týmové projekty. Zdokonalí se v praktickém užívání programátorských nástrojů.
Cíle předmětu
Porozumět počítačovému zpracování přirozeného jazyka a naučit se aplikovat základní algoritmy a metody v této oblasti. Seznámit se s algoritmickým popisem jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické a se zdroji jazykových dat - korpusy. Pochopit základní principy reprezentace znalostí, inference a vztahů k umělé inteligenci. Na každé rovině se vždy seznámit s teoretickými východisky, ale i používaným algoritmickým popisem a nástroji. Seznámit se s možnostmi kombinace těchto nástrojů do složitějších systémů.
Požadované prerekvizitní znalosti a dovednosti
Základní znalost programování v C/C++ nebo v některém skriptovacím jazyce (Perl, Python, Ruby)
Literatura studijní
- Hajičová, E., Panevová, J., Sgall, P., Úvod do teoretické a počítačové lingvistiky, sv. I., Teoretická lingvistika, Praha: Karolinum, 2002, ISBN 8024604701.
- Mařík,V., Štěpánková,O., Lažanský, J. a kol.: Umělá inteligence (4), ACADEMIA Praha, 2003, ISBN 80-200-1044-0.
Literatura referenční
- Allen, J., Natural language understanding. 2nd ed. Redwood City : Benjamin/Cummings Publishing Company, 1995. ISBN 0-8053-0334-0.
- Manning, C. D., Schütze, H., Foundations of Statistical Natural Language Processing, MIT Press, 1999, ISBN 0-262-13360-1.
Osnova seminářů
- Úvod, historie oboru, aplikace a obory zpracování přirozeného jazyka
- Jak si postavit vyhledávač typu Google, kategorizace textů, podobnost dokumentů
- Morfologická analýza na počítači, flektivní a derivativní morfologie, struktura trie pro uložení slovníku
- Syntaktická analýza přirozeného jazyka, složkový a závislostní přístup, příznakové struktury, formáty specifikace gramatik
- Formalismy pro zápis gramatik, kategoriální gramatiky, systémy LFG, HPSG, LTAG
- Metody syntaktické analýzy, algoritmus CKY, chart-parsing
- Korpusová lingvistika, stromové korpusy, metoda TBL
- Pravděpodobnostní syntaktická analýza, automatické zarovnávání textů, strojový překlad
- Lexikální sémantika, slovníky vs. encyklopedie, princip kompozicionality
- Transparentní intenzionální logika pro popis významu promluv
- Pragmatika, kontextové vazby významu, dynamická sémantika
- Reprezentace znalostí, sémantika možných světů, inference
- Technologie sémantického webu, ontologie, OWL
Osnova ostatní - projekty, práce:
- Individuálně zadávané projekty
Průběžná kontrola studia
- Zpracování individuálního projektu
Kontrolovaná výuka
Kontrolovaná výuka zahrnuje půlsemestrální test, individuální projekt a písemnou zkoušku. Půlsemestrální test nemá náhradní termín, závěrečná zkouška má dva možné náhradní termíny.