Detail produktu
Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení
Vznik: 2024
Stupňánek Bronislav (ÚJČ AV ČR)
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT)
Vondráková Alena, RNDr., Ph.D. (UPOL)
Voženílek Vít, prof. RNDr., CSc. (UPOL)
Nétek Rostislav, RNDr., Ph.D. (UPOL)
dialektologie, lingvistika, nářečí českého jazyka, dokumentace dialektů, nářeční výzkum, metoda rozhovoru, zvukový archiv, katalogizace nahrávek, archivace nahrávek, audiální data, textová data, dialektologická transkripce, folklorní transkripce, normalizace textů, digitalizace, automatické rozpoznávání řeči, strojové učení, tematická kartografie, zvuková mapa, interdisciplinární přístup
Metodika zpracovává problematiku přípravy a využití nářečních dat v dialektologii prostřednictvím moderních technologií strojového učení. Zaměřuje se na procesy konsolidace, standardizace a strukturování audiálních a textových materiálů, které tvoří základ pro vývoj automatických nástrojů pro transkripci řeči. Středobodem je představení postupů uplatnitelných při digitalizaci a normalizaci textových dat, obsahuje rovněž podrobný popis audiální dokumentace nářečí v terénu se zaměřením na různé explorační metody, a to včetně digitální archivace a katalogizace nahrávek. Metodika propojuje teoretické poznatky o sběru a zpracování nářečního materiálu s praktickými postupy, které zahrnují nasazení strojového učení. Důraz je kladen na interdisciplinární přístup, který kombinuje lingvistické znalosti s technologickými nástroji pro automatizaci práce. Součástí metodiky jsou také postupy vizualizace dialektologických dat pomocí tematické kartografie, vedoucí k tvorbě interaktivních zvukových map či webových atlasů. Dokument slouží nejen jako praktický průvodce pro přípravu specifického jazykového materiálu, ale i jako inspirace pro další výzkumné týmy, a to jak v oblasti dialektologie, tak v rámci širšího zapojení strojového učení do humanitních věd.
Národní úložiště šedé literatury