• Vstup: Zdrojový program
• Výstup: Řetězec tokenů
 
• Metoda:
• Zdrojový program je rozdělen na lexémy = logicky oddělené lexikální jednotky –
(identifikátory, čísla, klíčová slova, operátory,…)
• Lexémy jsou reprezentovány tokeny
• Nějaké tokeny mohou mít atributy
Lexikální analyzátor (Scanner)
6/17