Detail předmětu
Architektury výpočetních systémů
AVS Ak. rok 2024/2025 zimní semestr 5 kreditů
Předmět pokrývá architekturu současných výpočetních systémů složených z univerzálních i specializovaných procesorů a jejich paměťové subsystémy. Paralelismus na úrovni instrukcí je studován na skalárních a superskalárních procesorech. Dále jsou probrány procesory s vláknovým paralelismem. Datový paralelismus je ilustrován na SIMD instrukcích a na grafických procesorech. Následuje výklad programování víceprocesorových systémů se sdílenou pamětí v prostředí OpenMP a popis nejrozšířenějších vícejádrových multiprocesorů i pokročilých systémů NUMA. V závěru se probírá generická architektura grafických karet a základní techniky akcelerace výpočtů na GPU pomocí OpenMP. Jsou vysvětleny i techniky použité při nízkopříkonových procesorů a aplikací.
Garant předmětu
Koordinátor předmětu
Jazyk výuky
Zakončení
Rozsah
- 26 hod. přednášky
- 12 hod. pc laboratoře
- 14 hod. projekty
Bodové hodnocení
- 60 bodů závěrečná zkouška (písemná část)
- 10 bodů půlsemestrální test (písemná část)
- 30 bodů projekty
Zajišťuje ústav
Přednášející
Cvičící
Jaroš Marta, Ing., Ph.D. (UPSY)
Kuník Oliver, Ing. (UPSY)
Olšák Ondřej, Ing. (UPSY)
Cíle předmětu
Seznámit se s architekturou moderních výpočetních systémů založených na vícejádrových procesorech architektury x86, RISC-V nebo ARM v konfiguracích se sdílenou (UMA) i distribuovanou sdílenou (NUMA) pamětí, často doplněných o akcelerátor ve formě GPU. Pochopit hardwarové aspekty výpočetních systémů, které mají vliv na výkon dané aplikace a příkon systému. Umět posoudit možnosti konkrétní architektury a predikovat výkonnost aplikací. Ujasnit si úlohu překladače a jeho spolupráci s procesorem. Získat schopnost orientovat se v nabídce jednotlivých komponent výpočetních systémů, dovést je hodnotit a porovnávat.
Přehled architektur současných výpočetních systémů, jejich možností a budoucích trendů. Schopnost vyhodnotit efektivitu softwarových aplikací na daném výpočetním systému, identifikovat výkonnostní problémy a navrhnout jejich nápravu. Praktické zkušenosti s prací na superpočítačích Barbora a Karolina.
Pochopení důsledků hardwarových omezení na efektivitu softwarových řešení.
Požadované prerekvizitní znalosti a dovednosti
Architektura počítače typu von Neumann, hierarchická organizace paměťového systému, programování v jazyce symbolických instrukcí a jazyce C/C++, činnost a funkce kompilátoru.
Literatura studijní
- Hennessy, J.L., Patterson, D.A.: Computer Architecture - A Quantitative Approach. 5. vydání, Morgan Kaufman Publishers, Inc., 2012, 1136 s., ISBN 1-55860-596-7. download.
- Baer, J.L.: Microprocessor Architecture. Cambridge University Press, 2010, 367 s., ISBN 978-0-521-76992-1. info.
- van der Pas, R., Stotzer, E., and Terboven, T.: Using OpenMP-The Next Step, MIT Press Ltd, ISBN 9780262534789, 2017. info.
- Materiály ke kurzu Computer Science 152: Computer Architecture and Engineering. http://inst.eecs.berkeley.edu/~cs152/sp13/
- Agner Fog: Software optimization resources.
- Aktuální PPT prezentace přednášek v Elearningu.
Osnova přednášek
- Skalární procesory, zřetězené zpracování instrukcí, asistence kompilátoru.
- Superskalární procesory, dynamické plánování instrukcí.
- Optimalizace toku dat v hierarchii pamětí cache.
- Predikce skoků, optimalizace načítání instrukcí a dat.
- Procesory s podporou datového paralelismu a vektorizace.
- Procesory s podporou vláken a vícejádrové procesory.
- Paralelizace a vektorizace smyček.
- Funkční paralelismus a akcelerace rekurzivních algoritmů.
- Synchronizace na systémech se sdílenou pamětí.
- Algoritmy koherence pamětí cache.
- Architektury s distribuovanou sdílenou pamětí.
- Architektura a programování grafických karet.
- Nízkopříkonové procesory a techniky pro snižování příkonu.
Osnova počítačových cvičení
- Měření výkonnosti sekvenčních kódů, představení Intel Tools (4. týden).
- Efektivní využití cache, přehazování a rozbalování smyček (5. týden).
- Vektorizace kódu pomocí OpenMP (6. týden).
- Paralelizace smyček pomocí OpenMP (9. týden).
- Funkční paralelizace pomocí OpenMP tasků (10. týden).
- Sekce a vzájemné vyloučení pomocí OpenMP (11. týden).
Osnova ostatní - projekty, práce
- Optimalizace jednovláknové aplikace pomocí pomocí cache blockingu, vektoriace a restrukturalizace kódu.
- Vývoj paralelní aplikace pomocí OpenMP.
Průběžná kontrola studia
- Vyhodnocení dvou projektů v celkovém rozsahu 14 hodin a půlsemestrální písemky.
- Zameškaná cvičení je možné nahradit v alternativní termínu.
- Pro udělení zápočtu je nutné získat min 20b ze 40b a minimálně 1b z každého projektu.
Rozvrh
Den | Typ | Týdny | Místn. | Od | Do | Kapacita | PSK | Skup | Info |
---|---|---|---|---|---|---|---|---|---|
Po | poč. lab | 4., 5., 6., 9., 10., 11. výuky | N104 | 14:00 | 15:50 | 20 | 1MIT 2MIT | xx | Jaroš |
Po | poč. lab | 4., 5., 6., 9., 10., 11. výuky | N105 | 14:00 | 15:50 | 20 | 1MIT 2MIT | xx | Chlebík |
Po | poč. lab | 4., 5., 6., 9., 10., 11. výuky | N104 | 16:00 | 17:50 | 20 | 1MIT 2MIT | xx | Jaroš |
Po | poč. lab | 4., 5., 6., 9., 10., 11. výuky | N105 | 16:00 | 17:50 | 20 | 1MIT 2MIT | xx | Chlebík |
Po | poč. lab *) | výuky | N105 | 18:00 | 19:50 | 20 | 1MIT 2MIT | xx | |
Po | poč. lab *) | 1., 2., 3., 4., 5., 6., 8., 9., 10., 11., 12., 13. výuky | N104 | 18:00 | 19:50 | 20 | 1MIT 2MIT | xx | Termín nebude otevřen |
Út | poč. lab | 4., 5., 6., 9., 10., 11. výuky | N104 | 08:00 | 09:50 | 20 | 1MIT 2MIT | xx | Chlebík |
Út | poč. lab | 4., 5., 6., 9., 10., 11. výuky | N105 | 08:00 | 09:50 | 20 | 1MIT 2MIT | xx | Kuník |
Út | poč. lab | 4., 5., 6., 9., 10., 11. výuky | N104 | 12:00 | 13:50 | 20 | 1MIT 2MIT | xx | Chlebík |
Út | poč. lab | 4., 5., 6., 9., 10., 11. výuky | N105 | 12:00 | 13:50 | 20 | 1MIT 2MIT | xx | Kuník |
St | poč. lab | 4., 5., 6., 9., 10., 11. výuky | N104 | 14:00 | 15:50 | 20 | 1MIT 2MIT | xx | Jaroš |
St | poč. lab | 4., 5., 6., 9., 10., 11. výuky | N105 | 14:00 | 15:50 | 20 | 1MIT 2MIT | xx | Kuník |
Pá | přednáška | výuky | E104 E105 E112 | 08:00 | 09:50 | 294 | 1MIT 2MIT | NBIO - NSPE NISD - NISY NSEC - NGRI NVER xx | Jaroš |
Zařazení předmětu ve studijních plánech