Хелпикс

Главная

Контакты

Случайная статья





ASCII и Unicode.



ASCII и Unicode.

Информация, хранящаяся и обрабатываемая в компьютерах, представлена в двоичном виде.

Бит(англ. binary digit- двоичное число; также игра слов: англ. bit - кусочек, частица) - единица измерения количества информации, равная одному разряду в двоичной системе счисления.

С помощью бита можно закодировать (представить, различать) два состояния (0 или 1; да или нет). Увеличивая количество битов (разрядов), можно увеличить количество кодируемых состояний. Например, для байта (англ. byte), состоящего из 8 битов, количество кодируемых состояний составляет 28 = 256.

ASCII (англ. American Standard Code for Information Interchange) - американская стандартная кодировочная таблица для печатных и управляющих символов. Изначально была разработана как 7-битная для представления 128 символов, при использовании в компьютерах на символ выделялось 8 бит (1 байт), где 8-ой бит служил для контроля целостности (бит четности). Позднее, с задействованием 8 бита для представления дополнительных символов (всего 256 символов), например букв национальных алфавитов, стала восприниматься как половина 8-битной. В частности на основе ASCII были разработаны кодировки, содержащие буквы русского алфавита: для операционной системы MS-DOS - cp866 (англ. code page – кодовая страница), для операционной системы MS Windows – Windows 1251, для различных операционных систем – КОИ-8 (код обмена информацией, 8 битов), ISO 8859-5 и другие.

Unicode - стандарт кодирования символов, позволяющий представить знаки почти всех письменных языков. Стандарт был предложен в 1991 г. некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium, Unicode Inc.). Применение этого стандарта позволяет закодировать большее число символов (чем в ASCII и прочих кодировках) за счет двухбайтового кодирования символов (всего 65536 символов). В документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы.

Коды в стандарте Unicode разделены на несколько разделов. Первые 128 кодов соответствуют кодировке ASCII. Далее расположены разделы букв различных письменностей, знаки пунктуации и технические символы. В частности прописным и строчным буквам русского алфавита соответствуют коды 1025 (Ё), 1040-1103 (А-я) и 1105 (ё).

 

Кодировка ASCII

Дополнительные символы

Двоичный код Десятичный код Символ Двоичный код Десятичный код Символ Двоичный код Десятичный код Символ Двоичный код Десятичный код Символ
NUL @ Ђ А
SOH A Ѓ Б
STX B В
ETX C ѓ Г
EOT D Д
ENQ E Е
ACK F Ж
BEL G З
BS H ? И
HT I Й
LF J Љ К
VT K Л
FF L Њ М
CR M Ќ Н
SO N Ћ О
SI O Џ П
DLE P ђ Р
DC1 Q С
DC2 R Т
DC3 S У
DC4 T Ф
NAK U Х
SYN V Ц
ETB W Ч
CAN X   Ш
EM Y Щ
SUB Z љ Ъ
ESC [ Ы
FS \ њ Ь
GS ] ќ Э
RS ^ ћ Ю
US _ џ Я
  `   а
! a Ў б
" b ў в
# c Ј г
$ d ¤ д
% e Ґ е
& f ¦ ж
' g § з
( h Ё и
) i © й
* j Є к
+ k « л
, l   м
- m   н
. n ® о
/ o Ї п
p ° р
q ± с
r І т
s і у
t ґ ф
u µ х
v ц
w · ч
x ё ш
y щ
: z є ъ
; { » ы
< | ј ь
= } Ѕ э
> ~ ѕ ю
? DEL ї я

 



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.