Detail publikace
Probability-Aware Word-Confusion-Network-to-Text Alignment Approach for Intent Classification
Madikeri Srikanth (IDIAP)
Sharma Bidisha (Uniphore)
Khalil Driss (IDIAP)
Kumar Sashi (IDIAP)
Nigmatulina Iuliia (IDIAP)
Motlíček Petr, doc. Ing., Ph.D. (UPGM FIT VUT)
Ganapathiraju Aravind (Uniphore)
Technologie pro porozumění mluvené řeči (SLU) mají výrazně zlepšily díky efektivnímu předtrénování řeči. reprezentace. Běžným požadavkem průmyslových je přenositelnost pro nasazení modelů SLU v hlasových systémech. asistentů. Destilace znalostí z rozsáhlých textových na základě jazykových modelů se stalo atraktivním řešením pro dosažení dobrého výkonu a zaručení přenositelnosti. Na adrese v tomto článku představujeme novou architekturu, která využívá křížový přístup k datům. modální mechanismus pozornosti k extrakci kontextových informací na úrovni binů. z kódování slovně-konfúzní sítě (WNC). tak, aby je bylo možné přímo porovnávat a srovnávat se slovy s tradičními textovými kontextovými vložkami. Toto zarovnání je dosaženo pomocí nedávno navrženého tokenwise konstrastivního ztrátové funkce. Ověřujeme účinnost naší architektury vyladěním našeho předem natrénovaného modelu založeného na WCN, aby mohl provádět záměry. klasifikaci (IC) na známé datové sadě SLURP. Ob- vané přesnosti v úloze IC (81 %), zobrazuje 9,4 % relativní přesnost v úloze IC. v porovnání s nedávnou/ekvivalentní metodou E2E. Translated with DeepL.com (free version)
@INPROCEEDINGS{FITPUB13376, author = "Esa\'{u} Villatoro-tello and Srikanth Madikeri and Bidisha Sharma and Driss Khalil and Sashi Kumar and Iuliia Nigmatulina and Petr Motl\'{i}\v{c}ek and Aravind Ganapathiraju", title = "Probability-Aware Word-Confusion-Network-to-Text Alignment Approach for Intent Classification", pages = "12617--12621", booktitle = "ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)", year = 2024, location = "Seoul, KR", publisher = "IEEE Signal Processing Society", ISBN = "979-8-3503-4485-1", doi = "10.1109/ICASSP48485.2024.10445934", language = "english", url = "https://www.fit.vut.cz/research/publication/13376" }