Detail publikace

Acceleration Techniques for Automated Design of Approximate Convolutional Neural Networks

PIŇOS Michal, MRÁZEK Vojtěch, VAVERKA Filip, VAŠÍČEK Zdeněk a SEKANINA Lukáš. Acceleration Techniques for Automated Design of Approximate Convolutional Neural Networks. IEEE Journal on Emerging and Selected Topics in Circuits and Systems, roč. 13, č. 1, 2023, s. 212-224. ISSN 2156-3357. Dostupné z: https://ieeexplore.ieee.org/document/10011413
Název česky
Akcelerační techniky pro automatizovaný návrh aproximativních konvolučních neuronových sítí
Typ
článek v časopise
Jazyk
angličtina
Autoři
URL
Abstrakt

Hlavním problémem spojeným s používáním aproximativních komponent, jako jsou aproximativní násobičky, v hlubokých konvolučních neuronových sítích (CNN) během procesu návrhu je nutnost jejich emulace. Ta je výpočetně nákladná kvůli nedostatečné nativní podpoře aproximativních operací v moderních CPU a GPU. Pro urychlení emulace aproximativních operací CNN na GPU navrhujeme softwarovou knihovnu TFApprox4IL rozšiřující TensorFlow o nové aproximované vrstvy. Tyto vrstvy podporují symetrické i asymetrické kvantizační režimy, aproximativní 8xN bitové násobičky emulované pomocí vyhledávacích tabulek, nový typ aproximativní vrstvy známý jako aproximativní depthwise konvoluce a trénování s ohledem na kvantizaci. Výkonnost TFApprox4IL je rozsáhle hodnocena při simulaci aproximovaných implementací sítí MobileNetV2 a ResNet na architekturách GPU Nvidia Pascal a Tesla. Kromě toho je TFApprox4IL vyhodnocován také v algoritmech vyhledávání neuronových architektur (NAS) pro automatický návrh architektur CNN, které přímo využívají aproximativní násobičky. Na dvou různých metodách NAS, EvoApproxNAS a Google Model Search (GMS), ukazujeme, jak lze aproximativní násobiče efektivně začlenit do procesu návrhu CNN. Pro odhad spotřeby energie aproximativních CNN je představen nástroj AxMultAT založený na technologiích Timeloop a Accelergy. V porovnání s vysoce optimalizovanou simulací CNN na GPU implementovanou pomocí exaktních aritmetických operací, která je k dispozici v rámci TensorFlow, je průměrná režie inference a trénování, zavedená nástrojem TFApprox4IL, 13,6× a 8,0× , v tomto pořadí, s ohledem na ResNet50V2 a MobileNetV2 CNN na datových sadách ImageNet a CIFAR-10. Tato režie se oproti předchozím metodám snížila o jeden řád.

Rok
2023
Strany
212-224
Časopis
IEEE Journal on Emerging and Selected Topics in Circuits and Systems, roč. 13, č. 1, ISSN 2156-3357
Vydavatel
IEEE Circuits and Systems Society
DOI
UT WoS
000965262200001
EID Scopus
BibTeX
@ARTICLE{FITPUB12665,
   author = "Michal Pi\v{n}os and Vojt\v{e}ch Mr\'{a}zek and Filip Vaverka and Zden\v{e}k Va\v{s}\'{i}\v{c}ek and Luk\'{a}\v{s} Sekanina",
   title = "Acceleration Techniques for Automated Design of Approximate Convolutional Neural Networks",
   pages = "212--224",
   journal = "IEEE Journal on Emerging and Selected Topics in Circuits and Systems",
   volume = 13,
   number = 1,
   year = 2023,
   ISSN = "2156-3357",
   doi = "10.1109/JETCAS.2023.3235204",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12665"
}
Nahoru