12+  Свидетельство СМИ ЭЛ № ФС 77 - 70917
Лицензия на образовательную деятельность №0001058
Пользовательское соглашение     Контактная и правовая информация
 
Педагогическое сообщество
УРОК.РФУРОК
 
Материал опубликовал
Побережнюк Сергей Владимирович896
учитель в школе
Россия, Свердловская обл., Екатеринбург

Кодировки русского языка

Кодировки русского языка

Начиная с середины 80-х гг. компьютерная подготовка документов все больше и больше вытесняет обычные способы – машинопись или типографский набор. Во всем мире в большинстве организаций уже исчезли печатные машинки – их заменили ПК. Постоянно совершенствуется и технологии подготовки текстов. Текстовые процессоры Word, PageMaker и др, позволяют подготовить для печати практически любой документ.

Вместе с компьютерным набором возникли проблемы, связанные с использованием символов, не содержащихся в стандартной кодовой таблице: первая - это проблема включения в подготавливаемые тексты символов национальных алфавитов и специальных символов (например, знаки математических формул); вторая – наличие разных производителей компьютеров и ПО и стандартов на их основе.

В связи с этим, для сохранения совместимости между разными языковыми системами и компьютерами, оснащенными разным ПО принято выделять основные кодировки русского языка:

1. Международный стандарт кириллического алфавита ISO-8859-5, 1 символ кодируется 1 байтом (8 бит)

2. ASCII (American Standard Code for Information Interchange), 1 символ кодируется 1 байтом (8 бит).

В ASCII выделяют: А) CP866 (Кодовая страница фирмы Microsoft, применяется на компьютерах с операционной системой MS DOS) Б) Windows 1251 (Кодовая страница Microsoft, принятая в ОС семейства MS Windows) В) KOI8-R (Базируется на устаревшем государственном стандарте кода обмена информацией (КОИ) и применяется в основном на компьютерах с ОС UNIX)

3. Unicode — универсальные кодировки

В Unicode выделяют: А) UTF 8 (1 символ кодируется 1 байтом, алфавит может состоять из 256 различных знаков, 8 бит=28= 256) Б) UTF 16 (1 символ = 2 байта = 16 бит =216 = 65 536 знаков) наиболее распространенный стандарт (!). В) UTF 32 (4 байта = 32 бита = 232 – более 4 млрд. знаков)

4. MACOS. Кодировка, используемая на компьютерах фирмы Apple (чаще всего 1 символ = 2 байтам).

Объем информационного сообщения. Решение задач

1. Сколько байт/бит составляет сообщение «Умом Россию не понять, аршином общим не измерить», если известно, что в таблице кодировки ASCII 1 символ кодируется 1 байтом? В фразе 48 символов. Так как 1 символ в ASCII = 1 байту, значит, весь текст - 48 байт. В битах это составит 48 * 8 = 384 бит

2. Сколько байт/бит составляет сообщение «В учении нельзя останавливаться», если известно, что в таблице кодировки Unicode 1 символ кодируется 2 байтами?   В фразе 31 символ. Так как 1 символ в Unicode = 2 байтам, значит, весь текст = 62 байт. В битах это составит 62 * 8 = 496 бит

3. Сколько страниц текста помещается на диск объемом 250 Кб, если известно, что на 1 странице помещаются 20 строк по 10 символов в каждой строке. Таблица кодировки ASCII. На одной странице 20 * 10 = 200 символов 200 символов в ASCII это 200 байт На диске помещается 250 * 1024 / 200 = 1280 страниц текста

4. Сколько книг помещается на flash-карту объемом 5 Мб, если известно, что 1 книга состоит из 50 страниц, 24 строк и 35 символов на каждой странице. Таблица кодировки Unicode. На одной странице 24 * 35 = 840 символов 840 символов в Unicode это 1680 байт Размер одной книги 1680 * 50 = 84000 байт На карте помещается 5 * 1024 * 1024 / 84000 = 62,4 книг. Количество книг (целых): 62

Д/з 1. Изучить конспект; 2. уметь решать задачи; 3. потренироваться в решении задач.