Detail předmětu

Architektury výpočetních systémů

AVS Ak. rok 2024/2025 zimní semestr 5 kreditů

Předmět pokrývá architekturu současných výpočetních systémů složených z univerzálních i specializovaných procesorů a jejich paměťové subsystémy. Paralelismus na úrovni instrukcí  je studován na skalárních a superskalárních procesorech. Dále jsou probrány procesory s vláknovým paralelismem. Datový paralelismus je ilustrován na SIMD instrukcích a na grafických procesorech. Následuje výklad programování víceprocesorových systémů se sdílenou pamětí v prostředí OpenMP a popis nejrozšířenějších vícejádrových multiprocesorů i pokročilých systémů NUMA. V závěru se probírá generická architektura grafických karet a základní techniky akcelerace výpočtů na GPU pomocí OpenMP. Jsou vysvětleny i techniky použité při nízkopříkonových procesorů a aplikací. 

Garant předmětu

Koordinátor předmětu

Jazyk výuky

česky

Zakončení

zápočet+zkouška (písemná)

Rozsah

  • 26 hod. přednášky
  • 12 hod. pc laboratoře
  • 14 hod. projekty

Bodové hodnocení

  • 60 bodů závěrečná zkouška (písemná část)
  • 10 bodů půlsemestrální test (písemná část)
  • 30 bodů projekty

Zajišťuje ústav

Přednášející

Cvičící

Cíle předmětu

Seznámit se s architekturou moderních výpočetních systémů založených na vícejádrových procesorech architektury x86, RISC-V nebo ARM v konfiguracích se sdílenou (UMA) i distribuovanou sdílenou (NUMA) pamětí, často doplněných o akcelerátor ve formě GPU. Pochopit hardwarové aspekty výpočetních systémů, které mají vliv na výkon dané aplikace a příkon systému. Umět posoudit možnosti konkrétní architektury a predikovat výkonnost aplikací. Ujasnit si úlohu překladače a jeho spolupráci s procesorem. Získat schopnost orientovat se v nabídce jednotlivých komponent výpočetních systémů, dovést je hodnotit a porovnávat.

Přehled architektur současných výpočetních systémů, jejich možností a budoucích trendů. Schopnost vyhodnotit efektivitu softwarových aplikací na daném výpočetním systému, identifikovat výkonnostní problémy a navrhnout jejich nápravu. Praktické zkušenosti s prací na superpočítačích Barbora a Karolina.
Pochopení důsledků hardwarových omezení na efektivitu softwarových řešení.

Požadované prerekvizitní znalosti a dovednosti

Architektura počítače typu von Neumann, hierarchická organizace paměťového systému, programování v jazyce symbolických instrukcí a jazyce C/C++, činnost a funkce kompilátoru.

Literatura studijní

  • Hennessy, J.L., Patterson, D.A.: Computer Architecture - A Quantitative Approach. 5. vydání, Morgan Kaufman Publishers, Inc., 2012, 1136 s., ISBN 1-55860-596-7. download.
  • Baer, J.L.: Microprocessor Architecture. Cambridge University Press, 2010, 367 s., ISBN 978-0-521-76992-1. info.
  • van der Pas, R., Stotzer, E., and Terboven, T.: Using OpenMP-The Next Step, MIT Press Ltd, ISBN 9780262534789, 2017. info.
  • Materiály ke kurzu Computer Science 152: Computer Architecture and Engineering. http://inst.eecs.berkeley.edu/~cs152/sp13/
  • Agner Fog: Software optimization resources.
  • Aktuální PPT prezentace přednášek v Elearningu.

Osnova přednášek

  1. Skalární procesory, zřetězené zpracování instrukcí, asistence kompilátoru.
  2. Superskalární procesory, dynamické plánování instrukcí.
  3. Optimalizace toku dat v hierarchii pamětí cache.
  4. Predikce skoků, optimalizace načítání instrukcí a dat. 
  5. Procesory s podporou datového paralelismu a vektorizace.
  6. Procesory s podporou vláken a vícejádrové procesory.
  7. Paralelizace a vektorizace smyček.
  8. Funkční paralelismus a akcelerace rekurzivních algoritmů.
  9. Synchronizace na systémech se sdílenou pamětí. 
  10. Algoritmy koherence pamětí cache.
  11. Architektury s distribuovanou sdílenou pamětí.
  12. Architektura a programování grafických karet.
  13. Nízkopříkonové procesory a techniky pro snižování příkonu.

Osnova počítačových cvičení

  1. Měření výkonnosti sekvenčních kódů, představení Intel Tools (4. týden).
  2. Efektivní využití cache, přehazování a rozbalování smyček (5. týden).
  3. Vektorizace kódu pomocí OpenMP (6. týden).
  4. Paralelizace smyček pomocí OpenMP (9. týden).
  5. Funkční paralelizace pomocí OpenMP  tasků (10. týden).
  6. Sekce a vzájemné vyloučení pomocí OpenMP (11. týden).

Osnova ostatní - projekty, práce

  • Optimalizace jednovláknové aplikace pomocí pomocí cache blockingu, vektoriace a restrukturalizace kódu.
  • Vývoj paralelní aplikace pomocí OpenMP.

Průběžná kontrola studia

  • Vyhodnocení dvou projektů v celkovém rozsahu 14 hodin a půlsemestrální písemky.
  • Zameškaná cvičení je možné nahradit v alternativní termínu.
  • Pro udělení zápočtu je nutné získat min 20b ze 40b a minimálně 1b z každého projektu.

Rozvrh

DenTypTýdnyMístn.OdDoKapacitaPSKSkupInfo
Po poč. lab 4., 5., 6., 9., 10., 11. výuky N104 14:0015:5020 1MIT 2MIT xx Jaroš
Po poč. lab 4., 5., 6., 9., 10., 11. výuky N105 14:0015:5020 1MIT 2MIT xx Chlebík
Po poč. lab 4., 5., 6., 9., 10., 11. výuky N104 16:0017:5020 1MIT 2MIT xx Jaroš
Po poč. lab 4., 5., 6., 9., 10., 11. výuky N105 16:0017:5020 1MIT 2MIT xx Chlebík
Po poč. lab *) výuky N105 18:0019:5020 1MIT 2MIT xx
Po poč. lab *) 1., 2., 3., 4., 5., 6., 8., 9., 10., 11., 12., 13. výuky N104 18:0019:5020 1MIT 2MIT xx Termín nebude otevřen
Út poč. lab 4., 5., 6., 9., 10., 11. výuky N104 08:0009:5020 1MIT 2MIT xx Chlebík
Út poč. lab 4., 5., 6., 9., 10., 11. výuky N105 08:0009:5020 1MIT 2MIT xx Kuník
Út poč. lab 4., 5., 6., 9., 10., 11. výuky N104 12:0013:5020 1MIT 2MIT xx Chlebík
Út poč. lab 4., 5., 6., 9., 10., 11. výuky N105 12:0013:5020 1MIT 2MIT xx Kuník
St poč. lab 4., 5., 6., 9., 10., 11. výuky N104 14:0015:5020 1MIT 2MIT xx Jaroš
St poč. lab 4., 5., 6., 9., 10., 11. výuky N105 14:0015:5020 1MIT 2MIT xx Kuník
přednáška výuky E104 E105 E112 08:0009:50294 1MIT 2MIT NBIO - NSPE NISD - NISY NSEC - NGRI NVER xx Jaroš
Na výuku se nelze registrovat ve Studis. (Termíny cvičení mohou být v případě potřeby otevřeny dodatečně, ale nemusí být využity vůbec.)

Zařazení předmětu ve studijních plánech

Nahoru