|
|||
Оценка количественных параметров текстовых документов»«Оценка количественных параметров текстовых документов» Текст состоит из символов- букв, цифр, знаков препинания и т.д., которые человек различает по начертанию. Компьютер различает вводимые символы по их двоичному коду. Двои́чный код — это способ представления данных в виде кода, в котором каждый разряд принимает одно из двух возможных значений, обычно обозначаемых цифрами 0 и разряд в этом случае называется двоичным разрядом.
Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц. Кодовая таблица – это совокупность цифровых (двоичных) кодов и их значений.
В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:
Информационный объём фрагмента текста – это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования.
|
|||
|