Detail publikace

Probability-Aware Word-Confusion-Network-to-Text Alignment Approach for Intent Classification

VILLATORO-TELLO Esaú, MADIKERI Srikanth, SHARMA Bidisha, KHALIL Driss, KUMAR Sashi, NIGMATULINA Iuliia, MOTLÍČEK Petr a GANAPATHIRAJU Aravind. Probability-Aware Word-Confusion-Network-to-Text Alignment Approach for Intent Classification. In: ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Seoul: IEEE Signal Processing Society, 2024, s. 12617-12621. ISBN 979-8-3503-4485-1. Dostupné z: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10445934
Název česky
Pravděpodobnostní přístup k zarovnání slov a sítí k textu pro klasifikaci záměrů
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Villatoro-tello Esaú (IDIAP)
Madikeri Srikanth (IDIAP)
Sharma Bidisha (Uniphore)
Khalil Driss (IDIAP)
Kumar Sashi (IDIAP)
Nigmatulina Iuliia (IDIAP)
Motlíček Petr, doc. Ing., Ph.D. (UPGM FIT VUT)
Ganapathiraju Aravind (Uniphore)
URL
Abstrakt

Technologie pro porozumění mluvené řeči (SLU) mají výrazně zlepšily díky efektivnímu předtrénování řeči. reprezentace. Běžným požadavkem průmyslových je přenositelnost pro nasazení modelů SLU v hlasových systémech. asistentů. Destilace znalostí z rozsáhlých textových na základě jazykových modelů se stalo atraktivním řešením pro dosažení dobrého výkonu a zaručení přenositelnosti. Na adrese v tomto článku představujeme novou architekturu, která využívá křížový přístup k datům. modální mechanismus pozornosti k extrakci kontextových informací na úrovni binů. z kódování slovně-konfúzní sítě (WNC). tak, aby je bylo možné přímo porovnávat a srovnávat se slovy s tradičními textovými kontextovými vložkami. Toto zarovnání je dosaženo pomocí nedávno navrženého tokenwise konstrastivního ztrátové funkce. Ověřujeme účinnost naší architektury vyladěním našeho předem natrénovaného modelu založeného na WCN, aby mohl provádět záměry. klasifikaci (IC) na známé datové sadě SLURP. Ob- vané přesnosti v úloze IC (81 %), zobrazuje 9,4 % relativní přesnost v úloze IC. v porovnání s nedávnou/ekvivalentní metodou E2E. Translated with DeepL.com (free version)

Rok
2024
Strany
12617-12621
Sborník
ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
Konference
2024 IEEE International Conference on Acoustics, Speech and Signal Processing IEEE, Seoul, KR
ISBN
979-8-3503-4485-1
Vydavatel
IEEE Signal Processing Society
Místo
Seoul, KR
DOI
BibTeX
@INPROCEEDINGS{FITPUB13376,
   author = "Esa\'{u} Villatoro-tello and Srikanth Madikeri and Bidisha Sharma and Driss Khalil and Sashi Kumar and Iuliia Nigmatulina and Petr Motl\'{i}\v{c}ek and Aravind Ganapathiraju",
   title = "Probability-Aware Word-Confusion-Network-to-Text Alignment Approach for Intent Classification",
   pages = "12617--12621",
   booktitle = "ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)",
   year = 2024,
   location = "Seoul, KR",
   publisher = "IEEE Signal Processing Society",
   ISBN = "979-8-3503-4485-1",
   doi = "10.1109/ICASSP48485.2024.10445934",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13376"
}
Nahoru