Znaková sada určuje uspořádanou množinu znaků.
128 znaků (27)
Ve dvojkové soustavě je možné 128 znaků vyjádřit pomocí 7 bitů.
ASCII
- znaky anglické abecedy
- znaky používané v informatice
Vybrané znaky ASCII tabulky
Znak |
Pořadové číslo |
" |
34 |
& |
38 |
' |
39 |
< |
60 |
> |
62 |
@ |
64 |
\ |
92 |
256 znaků (28)
Ve dvojkové soustavě je možné 256 znaků vyjádřit pomocí 8 bitů (bajt).
Prvních 128 znaků je shodných s ASCII.
ISO 8859-1
- Západoevropská znaková sada (ISO Latin 1)
ISO 8859-2
- Východoevropská (středoevropská) znaková sada (ISO Latin 2)
- bosenština
- chorvatština
- čeština
- maďarština
- polština
- rumunština
- srbština (psaná v latinské transkripci)
- srbochorvatština
- slovenština
- slovinština
- hornolužičtina
- dolnolužičtina
- atd.
ISO 8859-...
- ISO 8859-3: Jihoevropská znaková sada (ISO Latin 3)
- ISO 8859-4: Baltská (ISO Latin 4)
- ISO 8859-5: Cyrilice (ruština/cyrilika/ukrajinština)
- ISO 8859-6: Arabská
- ISO 8859-7: Řecká
- ISO 8859-8: Hebrejská
- ISO 8859-9: Turecká (Latin-5)
- ISO 8859-10: Latin-6, Nordická
- ISO 8859-11: Thaiská
- ISO 8859-13 : Baltská (Latin-7)
- ISO 8859-14: Keltská (Latin-8)
- ISO 8859-15 : Západoevropská (Latin-9)
- ISO 8859-16 : Jihovýchodoevropská (Latin-10)
CP852
- středoevropské jazyky (PC Latin 2)
- polština
- rumunština
- čeština
- slovenština
- atd.
Kód Kamenických
- upravená sada CP437, kde jsou znaky 128 až 171 nahrazeny znaky české a slovenské abecedy
Windows 1250 (CP 1250)
- středoevropské jazyky (PC Latin 2)
- bosenština
- chorvatština
- čeština
- maďarština
- polština
- rumunština
- srbština (psaná v latinské transkripci)
- srbochorvatština
- slovenština
- slovinština
- hornolužičtina
- dolnolužičtina
- atd.
- vlastní sada Microsoftu, která nedodržuje ISO standard (liší se zejména ve znacích š, Š, ž, Ž, ť, Ť a ľ)
Miliardy znaků
Unicode (ISO 10646)
Na rozdíl od osmibitových tabulek znaků jako je bratří Kamenických, Latin 2, Windows-1250 či ISO-8859-2 lze všechny znaky zobrazit současně bez použití znakových entit. Tj. v jednom textu lze tedy kombinovat např. češtinu, ruštinu a řečtinu.
- 231 ~ 2 miliardy znaků
- všechny známé znakové sady jazyků na Zemi, včetně japonského nebo čínského písma
- fonetické abecedy (zápis výslovnosti)
- speciální vědecké a matematické symboly
- kombinované znaky
- 4 bajty, každý po 8 bitech (max. však 31 bitů)
- může obsahovat nuly na začátku bajtů, což je nevýhodné např. při programování v jazyce "C" (kódování ISO 8859 nuly na začátku neobsahuje)
- výchozí znaková sada XML
UTF-8
- 8bitové slovo – 1 znak zabírá nejméně 8 bitů (1 bajt)
UTF-16
- 16bitové slovo – 1 znak zabírá nejméně 16 bitů (2 bajty)
- není kompatibilní s ASCII
UTF-32
- 32bitové slovo – každý znak zabírá 32 bitů (4 bajty)