Detail práce

Klasifikace vztahů mezi pojmenovanými entitami v textu

Diplomová práce Student: Ondřej Karel Akademický rok: 2019/2020 Vedoucí: Smrž Pavel, doc. RNDr., Ph.D.
Název anglicky
Classification of Relations between Named Entities in Text
Jazyk práce
český
Abstrakt

Tato diplomová práce se zabývá extrakcí vztahů mezi pojmenovanými entitami v textu. V teoretické části práce je rozebrána problematika reprezentace přirozeného jazyka pro strojové zpracování. Následně jsou definovány dvě dílčí úlohy extrakce vztahů, a to rozpoznávání pojmenovaných entit a klasifikace vztahu mezi nimi, včetně shrnutí dnešních nejmodernějších řešení. V praktické části práce je navržen systém pro automatickou extrakci vztahů mezi pojmenovanými entitami ze stažených webových stránek. Model pro klasifikaci vztahů mezi entitami je založen na předtrénovaném modelu sítě typu transfomers. V práci jsou porovnány čtyři předtrénované modely, a to BERT, XLNet, RoBERTa a ALBERT.

Klíčová slova

extrakce vztahů, rozpoznávaní pojmenovaných entit, transformers, BERT, ALBERT, RoBERTa, XLNet, dotrénování

Ústav
Studijní program
Informační technologie, obor Inteligentní systémy
Soubory
Stav
obhájeno, hodnocení A
Obhajoba
16. července 2020
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky u obhajoby
  1. Jakým způsobem byly využity dodatečné informace ke zvyšování přesnosti? (část bodu 2 ze zadání)
  2. Jakým způsobem bylo implementováno pravidelné rozšiřování extrahovaných dat na základě nově získávaných webových dat? (bod 3 ze zadání)
  3. Jak je na výstupu neuronové sítě, jestli je mezi entitami vztah, nebo ne?
  4. Jak rozpoznáte typ entity, o který se jedná?
  5. Vstup reprezentujete jako slova?
Komise
Rogalewicz Adam, doc. Mgr., Ph.D. (UITS FIT VUT), předseda
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Hrubý Martin, Ing., Ph.D. (UITS FIT VUT), člen
Kočí Radek, Ing., Ph.D. (UITS FIT VUT), člen
Rozman Jaroslav, Ing., Ph.D. (UITS FIT VUT), člen
Citace
ONDŘEJ, Karel. Klasifikace vztahů mezi pojmenovanými entitami v textu. Brno, 2020. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2020-07-16. Vedoucí práce Smrž Pavel. Dostupné z: https://www.fit.vut.cz/study/thesis/22682/
BibTeX
@mastersthesis{FITMT22682,
    author = "Karel Ond\v{r}ej",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Klasifikace vztah\r{u} mezi pojmenovan\'{y}mi entitami v textu",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2020,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/22682/"
}
Nahoru