Detail publikace

Efektivní přístup ke znalostem v audio-vizuálních záznamech

SZŐKE, I.; FAPŠO, M.; ŽIŽKA, J.; BERAN, V.; ČERNOCKÝ, J. Efektivní přístup ke znalostem v audio-vizuálních záznamech. Proceedings of the Annual Database Conference. Praha: Technická univerzita v Košiciach, 2012. s. 57-74. ISBN: 978-80-553-1049-7.
Název anglicky
Effective access for information in audio-visual recordings
Typ
článek ve sborníku konference
Jazyk
česky
Autoři
URL
Klíčová slova

audiovizuální záznam,převod řeči do textu, převod obrazu do textu, indexace avyhledávání, web

Abstrakt

Množstvíaudiovizuálních dat seneustále zvětšuje.Část znich obsahuje důležité informace- záznamy přednášek, konferencí, kurzů atd. Tato data jsou všakpro současné vyhledávače (Google, Seznam) neviditelná. Pokudpotřebujeme nalézt záznam, který se týká konkrétníproblematiky nebo se jen potřebujeme rychle zorientovat v záznamu,současné vyhledávače nám mnoho nepomohou. V první částipřednášky se podíváme, jak zviditelnit audiovizuální záznamyprezentací pro standardní textové vyhledávače. Z technickéhohlediska si ukážeme, jak vypadá celkové schéma systému, a pakse podrobněji podíváme na jednotlivé komponenty. Zejména nakomponentu automatického rozpoznávače řeči (převod audia dotextu s časováním), a komponentu automatické synchronizace arozpoznání slajdů s videem (převod videa do textu s časováním).Dále si ukážeme, jak jsou zpracována audiovizuální datareprezentována pro vyhledávací engine Lucene. V druhé částipřednášky se zaměřímena prezentaciuživatelům, a také na zpětnou vazbu od uživatelů. Systém jeprakticky nasazen na Fakultě informačních technologií VUT v Brně,a také pro několik velkých konferencí.

Anotace

Množství audiovizuálních dat se neustále zvětšuje. Část z nich obsahuje důležité informace - záznamy přednášek, konferencí, kurzů atd. Tato data jsou však pro současné vyhledávače (Google, Seznam) neviditelná. Pokud potřebujeme nalézt záznam, který se týká konkrétní problematiky nebo se jen potřebujeme rychle zorientovat v záznamu, současné vyhledávače nám mnoho nepomohou. V první části přednášky se podíváme, jak zviditelnit audiovizuální záznamy prezentací pro standardní textové vyhledávače. Z technického hlediska si ukážeme, jak vypadá celkové schéma systému, a pak se podrobněji podíváme na jednotlivé komponenty. Zejména na komponentu automatického rozpoznávače řeči (převod audia do textu s časováním), a komponentu automatické synchronizace a rozpoznání slajdů s videem (převod videa do textu s časováním). Dále si ukážeme, jak jsou zpracována audiovizuální data reprezentována pro vyhledávací engine Lucene. V druhé části přednášky se zaměříme na prezentaci uživatelům, a také na zpětnou vazbu od uživatelů. Systém je prakticky nasazen na Fakultě informačních technologií VUT v Brně, a také pro několik velkých konferencí.

Rok
2012
Strany
57–74
Sborník
Proceedings of the Annual Database Conference
Konference
DATAKON 2012, Mikulov, CZ
ISBN
978-80-553-1049-7
Vydavatel
Technická univerzita v Košiciach
Místo
Praha
BibTeX
@inproceedings{BUT97053,
  author="Igor {Szőke} and Michal {Fapšo} and Josef {Žižka} and Vítězslav {Beran} and Jan {Černocký}",
  title="Efektivní přístup ke znalostem v audio-vizuálních záznamech",
  booktitle="Proceedings of the Annual Database Conference",
  year="2012",
  pages="57--74",
  publisher="Technická univerzita v Košiciach",
  address="Praha",
  isbn="978-80-553-1049-7",
  url="https://www.fit.vut.cz/research/publication/10172/"
}
Nahoru