Detail práce
Klasifikace vztahů mezi pojmenovanými entitami v textu
Tato diplomová práce se zabývá extrakcí vztahů mezi pojmenovanými entitami v textu. V teoretické části práce je rozebrána problematika reprezentace přirozeného jazyka pro strojové zpracování. Následně jsou definovány dvě dílčí úlohy extrakce vztahů, a to rozpoznávání pojmenovaných entit a klasifikace vztahu mezi nimi, včetně shrnutí dnešních nejmodernějších řešení. V praktické části práce je navržen systém pro automatickou extrakci vztahů mezi pojmenovanými entitami ze stažených webových stránek. Model pro klasifikaci vztahů mezi entitami je založen na předtrénovaném modelu sítě typu transfomers. V práci jsou porovnány čtyři předtrénované modely, a to BERT, XLNet, RoBERTa a ALBERT.
extrakce vztahů, rozpoznávaní pojmenovaných entit, transformers, BERT, ALBERT, RoBERTa, XLNet, dotrénování
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- Jakým způsobem byly využity dodatečné informace ke zvyšování přesnosti? (část bodu 2 ze zadání)
- Jakým způsobem bylo implementováno pravidelné rozšiřování extrahovaných dat na základě nově získávaných webových dat? (bod 3 ze zadání)
- Jak je na výstupu neuronové sítě, jestli je mezi entitami vztah, nebo ne?
- Jak rozpoznáte typ entity, o který se jedná?
- Vstup reprezentujete jako slova?
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Hrubý Martin, Ing., Ph.D. (UITS FIT VUT), člen
Kočí Radek, Ing., Ph.D. (UITS FIT VUT), člen
Rozman Jaroslav, Ing., Ph.D. (UITS FIT VUT), člen
@mastersthesis{FITMT22682, author = "Karel Ond\v{r}ej", type = "Diplomov\'{a} pr\'{a}ce", title = "Klasifikace vztah\r{u} mezi pojmenovan\'{y}mi entitami v textu", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2020, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/22682/" }