Detail publikace
End-to-End Open Vocabulary Keyword Search
keyword search, spoken term detection
V poslední době se neurální přístupy k vyhledávání mluveného obsahu stalyoblíbenými. Mají však tendenci být omezené ve své slovní zásoběnebo ve své schopnosti vypořádat se s nevyváženým nastaveními testů.Tyto restrikce omezují jejich použitelnost při vyhledávání klíčových slov,kde soubor dotazů není předem znám a kdesystém by měl vrátit nejen to, zda výrok obsahujedotaz, ale přesné umístění všech takových výskytů.V této práci navrhujeme model přímo optimalizovaný pro klíčová slovaVyhledávání. Model bere jako vstup dotaz a výroka vrátí sekvenci pravděpodobností pro každý snímekvyslovení dotazu, ke kterému došlo v tomto rámci. Experimentyukazují, že navrhovaný model nejenže překonává podobnéend-to-end modely na úkol, kde poměr kladných anegativních zkoušek je uměle vyvážená, ale je také schopna se vypořádats mnohem náročnějším úkolem vyhledávání klíčových slovinherentní nerovnováha. Navíc pomocí našeho systému znovu bodovatvýstupy, ke kterým vede systém vyhledávání klíčových slov založený na LVCSRu posledně jmenovaných výrazná zlepšení.
@inproceedings{BUT175847,
author="YUSUF, B. and GOK, A. and GUNDOGDU, B. and SARAÇLAR, M.",
title="End-to-End Open Vocabulary Keyword Search",
booktitle="Proceedings Interspeech 2021",
year="2021",
journal="Proceedings of Interspeech",
volume="2021",
number="8",
pages="4388--4392",
publisher="International Speech Communication Association",
address="Brno",
doi="10.21437/Interspeech.2021-1399",
issn="1990-9772",
url="https://www.isca-speech.org/archive/interspeech_2021/yusuf21_interspeech.html"
}