Detail publikace
End-to-End Open Vocabulary Keyword Search
V poslední době se neurální přístupy k vyhledávání mluveného obsahu staly oblíbenými. Mají však tendenci být omezené ve své slovní zásobě nebo ve své schopnosti vypořádat se s nevyváženým nastaveními testů. Tyto restrikce omezují jejich použitelnost při vyhledávání klíčových slov, kde soubor dotazů není předem znám a kde systém by měl vrátit nejen to, zda výrok obsahuje dotaz, ale přesné umístění všech takových výskytů. V této práci navrhujeme model přímo optimalizovaný pro klíčová slova Vyhledávání. Model bere jako vstup dotaz a výrok a vrátí sekvenci pravděpodobností pro každý snímek vyslovení dotazu, ke kterému došlo v tomto rámci. Experimenty ukazují, že navrhovaný model nejenže překonává podobné end-to-end modely na úkol, kde poměr kladných a negativních zkoušek je uměle vyvážená, ale je také schopna se vypořádat s mnohem náročnějším úkolem vyhledávání klíčových slov inherentní nerovnováha. Navíc pomocí našeho systému znovu bodovat výstupy, ke kterým vede systém vyhledávání klíčových slov založený na LVCSR u posledně jmenovaných výrazná zlepšení.
@INPROCEEDINGS{FITPUB12612, author = "Bolaji Yusuf and Alican Gok and Batuhan Gundogdu and Murat Sara\c{c}lar", title = "End-to-End Open Vocabulary Keyword Search", pages = "4388--4392", booktitle = "Proceedings Interspeech 2021", journal = "Proceedings of Interspeech - on-line", volume = 2021, number = 8, year = 2021, location = "Brno, CZ", publisher = "International Speech Communication Association", ISSN = "1990-9772", doi = "10.21437/Interspeech.2021-1399", language = "english", url = "https://www.fit.vut.cz/research/publication/12612" }