Detail publikace

Page Layout Analysis System for Unconstrained Historic Documents

KODYM Oldřich a HRADIŠ Michal. Page Layout Analysis System for Unconstrained Historic Documents. In: Lladós J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021. Lecture Notes in Computer Science. Lausanne: Springer Nature Switzerland AG, 2021, s. 492-506. ISBN 978-3-030-86330-2.
Název česky
Systém pro analýzu stránek libovolných historických dokumentů
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Abstrakt

Pro automatický přepis historických dokumentů je nutná extrakce textových oblastí a jednotlivých textových řádků. Navrhujeme rozšířit systém detekce základní linie textu založený na konvolučních neuronových sítích přidáním předpovědí výšky řádku a hranic textového bloku do výstupu modelu, což systému umožní extrahovat komplexnější informace o rozložení. Ukazujeme také, že predikci orientace textu po pixelech lze použít pro zpracování dokumentů s více orientacemi textu. Ukazujeme, že navrhovaná metoda funguje dobře na základním detekčním souboru cBAD. Metodu navíc srovnáváme na nově zavedené datové sadě rozložení stránek PERO, kterou také zveřejňujeme.

Rok
2021
Strany
492-506
Sborník
Lladós J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021
Řada
Lecture Notes in Computer Science
Konference
International Conference on Document Analysis and Recognition, Lausanne, Switzerland, CH
ISBN
978-3-030-86330-2
Vydavatel
Springer Nature Switzerland AG
Místo
Lausanne, CH
DOI
UT WoS
000770800600032
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12493,
   author = "Old\v{r}ich Kodym and Michal Hradi\v{s}",
   title = "Page Layout Analysis System for Unconstrained Historic Documents",
   pages = "492--506",
   booktitle = "Llad\'{o}s J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021",
   series = "Lecture Notes in Computer Science",
   year = 2021,
   location = "Lausanne, CH",
   publisher = "Springer Nature Switzerland AG",
   ISBN = "978-3-030-86330-2",
   doi = "10.1007/978-3-030-86331-9\_32",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12493"
}
Nahoru