Detail předmětu
Architektury počítačů
ARP Ak. rok 2006/2007 letní semestr 6 kreditů
Předmět pokrývá architekturu procesorů a paralelních systémů. Paralelismus na úrovni instrukcí (ILP) a vláken (TLP) je studován na procesorech skalárních, superskalárních, VLIW a multivláknových. Dále v kontextu paralelismu procesů je pojednáno o nejrozšířenějších symetrických multiprocesorech se společnou sběrnicí (SMP). Následuje výklad propojovacích sítí jako základ systémů s distribuovanou sdílenou pamětí (NUMA) a multipočítačů s lokálními pamětmi, zejména populárních svazků pracovních stanic a masivně paralelních systémů. V poslední skupině jsou paralelní vektorové procesory a zpracování stylem SIMD (datový paralelismus).
Garant předmětu
Jazyk výuky
Zakončení
Rozsah
- 39 hod. přednášky
- 16 hod. cvičení
- 10 hod. projekty
Zajišťuje ústav
Získané dovednosti, znalosti a kompetence z předmětu
Přehled mikroarchitektury procesorů a jejich trendů, principů výstavby paralelních systémů a propojovacích sítí, schopnost odhadnout výkonnost paralelních aplikací.
Cíle předmětu
Seznámit se s architekturou nejnovějších procesorů pracujících s paralelismem na úrovni instrukcí a jejím dopadem na návrh překladačů. Pochopit problematiku paralelních systémů využívajících funkční paralelismus na úrovni procesů nebo vláken a rovněž datový paralelismus.
Požadované prerekvizitní znalosti a dovednosti
Architektura počítače typu von Neumann, hierarchické uspořádání paměťového systému, vyrovnávací paměti a jejich organizace, programování v JSI a v C/C++, činnost a funkce kompilátoru
Literatura studijní
- Dvořák, V., Drábek, V.: Architektura procesorů. VUTIUM, Brno, 1999, 330 s., ISBN 80-214-1458-8.
- Dvořák, V.: Architektura a programování paralelních systémů. Skriptum FIT VUT v Brně, 2004, 170 s., ISBN 80-214-2608-X.
Literatura referenční
- Culler, D.E. et al.: Parallel Computer Architecture. Morgan Kaufmann Publishers, 1999, 1025 s., ISBN 1-55860-343-3.
- Hennessy, J.L., Patterson, D.A.: Computer Architecture - A Quantitative Approach. 3. vydání, Morgan Kaufman Publishers, Inc., 2003, 1136 p., ISBN 1-55860-596-7.
Osnova přednášek
- Funkční a datový paralelismus, ukazatele výkonnosti, zákony omezující zrychlení.
- Zřetězené zpracování instrukcí a instrukční závislosti. Architektura typického procesoru DLX.
- Konflikty datové, řídící, strukturní, techniky snižování prostojů linky s asistencí hardware i kompilátoru. Paralelismus u smyček, predikce skoků.
- Superskalární CPU. Dynamické plánování instrukcí, přejmenování registrů, ROB, spekulace.
- Volnější modely konzistence paměti. Procesory VLIW. Programové řetězení, predikace.
- Paralelismus na úrovni vláken, podpora v hardware. Multivláknové procesory, SMT.
- Architektury se sdílenou pamětí. Saturace sběrnice, organizace paměti, koherence pamětí cache.
- Protokoly koherence MSI a MESI. Synchronizace událostí v multiprocesorech.
- Propojovací a přepínací sítě. Vlastnosti a parametry, směrování, řízení, kolektivní komunikace.
- Architektury s distribuovanou sdílenou pamětí, sdílená virtuální paměť.
- Architektury se zasíláním zpráv. Podpora komunikace v hardware, překrytí komunikace a výpočtů.
- Datový paralelismus, vektorové procesory a instrukce. Počítače SIMD a zpracování stylem SIMD. Systolické struktury.
- Akcelerátory a specifické architektury pro ANN, architektury budoucích procesorů.
Osnova numerických cvičení
- Účinnost a zrychlení paralelních aplikací, Amdahlův a Gustafsonův zákon.
- Instrukční závislosti a eliminace konfliktů při řetězovém zpracování, rozbalování smyček.
- Superskalární zpracování.
- Půlsemestrální zkouška.
- VLIW a softwarové řetězení.
- Multivláknové zpracování, SMT.
- Sdílená paměť, škálovatelnost sběrnice,výkonnost systémů se sdílenou pamětí.
- Parametry propojovacích sítí, směrovací algoritmy.
- Vektorové procesory, trvání vektorových operací.
Průběžná kontrola studia
Výuka není kontrolována.
Kontrolovaná výuka
Vyhodnocení čtyř malých projektů, půlsemestrální zkouška.