минимальная длина равномерных двоичных кодов для букв русского алфавита 33 буквы равна
Содержание урока
Равномерные коды
Равномерные коды
Если нам нужно записать в память компьютера какой-то текст на русском языке, его нужно представить в виде двоичного кода, т. е. перекодировать.
Например, перекодируем слово ГАГАРА в двоичный алфавит, считая, что в тексте есть только буквы «А», «Г» и «Р», т. е. алфавит состоит из трёх знаков. Присвоим каждой из этих букв двоичные коды — кодовые слова (рис. 2.5).
Закодируйте с помощью этого кода слово ГАГАРА.
Такой код называется равномерным, потому что длина всех кодовых слов одинакова.
Равномерный код — это код, в котором все кодовые слова имеют одинаковую длину.
Теперь предположим, что по компьютерной сети передана цепочка
000010000100000010000100
Известно, что для кодирования использовалась таблица, показанная на рис. 2.5, и нам нужно узнать, какое сообщение было закодировано. Эта операция называется декодированием.
Декодирование — это восстановление исходного сообщения из кода.
Сообщение 000010000100000010000100 закодировано с помощью равномерного кода, приведённого на рис. 2.5. Определите, сколько знаков было в исходном сообщении. Как вы рассуждали? Декодируйте это сообщение.
Равномерный 5-битный двоичный код, разработанный в конце XIX века Жаном Морисом Бодо, использовался в телеграфных аппаратах. В современных компьютерных системах при передаче текстовых сообщений также часто применяют равномерный (8-битный или 16-битный) код.
Можно ли было для кодирования букв «А», «Г», «Р» использовать более короткий равномерный код? Определите наименьшую возможную длину кодовых слов.
Если для кодирования используется алфавит мощностью M, то с помощью кодовых слов длиной L можно закодировать M L различных знаков. Это число должно быть не меньше, чем мощность алфавита исходного сообщения M0, потому что иначе какие-то буквы обязательно получат одинаковые коды.
Длину кодовых слов L выбирают из условия M L ≥ M0, где М0 — мощность алфавита исходного сообщения и М — мощность нового алфавита.
Как выбрать наименьшую возможную длину кодовых слов при равномерном кодировании?
В сообщении используются 33 русские прописные буквы и пробел. Определите наименьшую длину кодовых слов для равномерного кодирования этого сообщения в трёхбуквенном и четырёхбуквенном алфавитах.
Следующая страница Неравномерные коды
Cкачать материалы урока
Минимальная длина равномерных двоичных кодов для букв русского алфавита 33 буквы равна
На этом шаге мы рассмотрим равномерное алфавитное двоичное кодирование; байтовый код.
Iвер Iоб
Именно байт принят в качестве единицы измерения количества информации в международной системе единиц СИ. 1 байт = 8 бит. Наряду с байтом для измерения количества информации используются более крупные производные единицы:
1 Кбайт = 2 10 байт = 1024 байт (килобайт)
1 Мбайт = 2 20 байт = 1024 Кбайт (мегабайт)
1 Гбайт = 2 30 байт = 1024 Мбайт (гигабайт)
1 Тбайт = 2 40 байт = 1024 Гбайт (терабайт)
Использование 8-битных цепочек позволяет закодировать 2 8 =256 символов, что превышает оцененное выше N и, следовательно, дает возможность употребить оставшуюся часть кодовой таблицы для представления дополнительных символов.
Вторая часть кодовой таблицы – онасчитается расширением основной – охватывает коды в интервале от 128 до 255 (первый бит всех кодов 1). Она используется для представления символов национальных алфавитов (например, русского или греческого), а также символов псевдографики. Для этой части также имеются стандарты, например, для символов русского языка это КОИ–8, КОИ–7 и др.
Как в основной таблице, так и в ее расширении коды букв и цифр соответствуют их лексикографическому порядку (т.е. порядку следования в алфавите) – это обеспечивает возможность автоматизации обработки текстов и ускоряет ее.
Урок 3
§5. Дискретное кодирование
Содержание урока
Равномерные коды
Равномерные коды
Если нам нужно записать в память компьютера какой-то текст на русском языке, его нужно представить в виде двоичного кода, т. е. перекодировать.
Например, перекодируем слово ГАГАРА в двоичный алфавит, считая, что в тексте есть только буквы «А», «Г» и «Р», т. е. алфавит состоит из трёх знаков. Присвоим каждой из этих букв двоичные коды — кодовые слова (рис. 2.5).
Закодируйте с помощью этого кода слово ГАГАРА.
Такой код называется равномерным, потому что длина всех кодовых слов одинакова.
Равномерный код — это код, в котором все кодовые слова имеют одинаковую длину.
Теперь предположим, что по компьютерной сети передана цепочка
000010000100000010000100
Известно, что для кодирования использовалась таблица, показанная на рис. 2.5, и нам нужно узнать, какое сообщение было закодировано. Эта операция называется декодированием.
Декодирование — это восстановление исходного сообщения из кода.
Сообщение 000010000100000010000100 закодировано с помощью равномерного кода, приведённого на рис. 2.5. Определите, сколько знаков было в исходном сообщении. Как вы рассуждали? Декодируйте это сообщение.
Равномерный 5-битный двоичный код, разработанный в конце XIX века Жаном Морисом Бодо, использовался в телеграфных аппаратах. В современных компьютерных системах при передаче текстовых сообщений также часто применяют равномерный (8-битный или 16-битный) код.
Можно ли было для кодирования букв «А», «Г», «Р» использовать более короткий равномерный код? Определите наименьшую возможную длину кодовых слов.
Если для кодирования используется алфавит мощностью M, то с помощью кодовых слов длиной L можно закодировать M L различных знаков. Это число должно быть не меньше, чем мощность алфавита исходного сообщения M0, потому что иначе какие-то буквы обязательно получат одинаковые коды.
Длину кодовых слов L выбирают из условия M L ≥ M0, где М0 — мощность алфавита исходного сообщения и М — мощность нового алфавита.
Как выбрать наименьшую возможную длину кодовых слов при равномерном кодировании?
В сообщении используются 33 русские прописные буквы и пробел. Определите наименьшую длину кодовых слов для равномерного кодирования этого сообщения в трёхбуквенном и четырёхбуквенном алфавитах.
Следующая страница Неравномерные коды
Cкачать материалы урока
Минимальная длина равномерных двоичных кодов для букв русского алфавита 33 буквы равна
Тесты по информатике 7 класс. Тема: «Двоичное кодирование»
Правильный вариант ответа отмечен знаком +
1. Двоичным будет кодирование, которое ставит в соответствие каждому тексту:
— его длину в символах, считая и пробелы, знаки препинания
— второй цифре нового слова – 1, остальным нули, кроме знаков препинания
2. У каждого двоичного кодирования имеется свойство:
— декодируемости (обратимости кодирования)
3. Не у каждого двоичного кодирования имеется свойство:
— применимости (кода к любому элементу кодируемого набора)
— представимости кода через 0 и 1
4. Преобразование информации из непрерывного вида представления в дискретную называется:
5. Конечный набор различных символов (знаков) для представления информации – это:
6. Количество знаков в алфавите – это его:
7. Алфавитом двоичного кодирования не будет алфавит их символов:
8. В двоичном алфавите представлен текст:
9. Количество символов двоичного кода называется его (двоичного кода):
тест 10. В двоичном коде можно закодировать:
— количество годовых колец на спиле дерева
+ количество всех документов в поисковом запросе Яндекса
11. Кодирование, которое дает всегда одинаковой разрядности код называется:
12. Дискретизацией информации называется процесс преобразования ее из:
— непрерывной формы в регистрируемую
— дискретной формы в непрерывную
+ непрерывной формы в конечную
13. Алфавитом называют набор любых:
14. Алфавитом может служить набор символов:
15. Алфавитом не может служить набор символов:
+ 0,1, 2, 10, 11, 12, 20, 21, 22
16. Минимальная разрядность двоичного кода для кодирования всех 10-буквенных слов русского языка равна:
17. Если в некотором алфавите все слова можно кодировать двоичным однородным кодом минимальной длины 6, то слов в алфавите не более:
18. Наименьшая длина двоичного кода для кодирования всех 16 слов некоторого алфавита равна:
19. Кодирование по правилу «Буква алфавита – Порядковый десятичный номер буквы в алфавите»:
— будет двоичным кодированием
+ не будет двоичным кодированием
— будет двоичным кодированием, если алфавит состоит лишь из 0 и 1
тест-20. Кодирование по правилу «Буква алфавита – Порядковый двоичный номер буквы в алфавите»:
+ будет двоичным кодированием
— не будет двоичным кодированием
— будет двоичным кодированием, если алфавит состоит лишь из 0 и 1
21. Двоичный код всегда использует таблицу кодирования типа:
— «символ алфавита – код ASCII»
— «символ алфавита – код UNICODE»
+ «символ алфавита – слово из двоичных знаков»
22. Двоичным кодом может быть набор:
23. Азбука Морзе является кодированием:
24. Десятичное число 16 имеет двоичный код:
25. Двоичный код 1001 соответствует десятичному числу:
26. В алфавите десятичных чисел при однородном кодировании не может быть кодового слова:
27. В алфавите десятичных чисел при однородном кодировании может быть кодовое слово:
28. Двоичное кодирование всегда ставит в соответствие кодируемому тексту:
— длину текста в двоичных единицах
+ текст из двоичных кодов символов алфавита
29. В двоичном алфавите закодирован текст:
тест_30. В двоичном представлении за конечное время невозможно записать:
+ множество всех натуральных чисел
31. Двоичным алфавитом является набор символов:
32. Минимальная разрядность двоичных кодов всех натуральных десятичных чисел от 1 до 64 равна:
33. Если в алфавите символов <А, а, Б, б>все слова закодировать двоичными однородными кодами длины 2, то кодом слова АББА будет:
34. Наименьшая длина двоичного кода для кодирования алфавита из прописных и заглавных букв кириллицы равна:
35. Кодирование по правилу «Сложение – 1, вычитание – 0»:
— будет двоичным кодированием для десятичной арифметики
+ не будет двоичным кодированием для десятичной арифметики
— будет двоичным кодированием для двоичной арифметики
36. Двоичными кодами может быть все перечисленное в наборе:
37. Азбука Морзе имеет мощность алфавита, равную:
38. Десятичное число 122 имеет двоичный код:
39. Двоичный код 11100 соответствует десятичному числу:
тест*40. В алфавите десятичных чисел при однородном кодировании не будет присутствовать кодовое слово:
41. В алфавите десятичных чисел при однородном кодировании может присутствовать кодовое слово:
42. К атрибутам сообщений для любых алфавитов относится:
— представление в двоичном коде
43. К атрибутам любых алфавитов не относится:
44. Любой компьютер обрабатывает, в конечном (внутреннем) представлении лишь:
Минимальная длина равномерных двоичных кодов для букв русского алфавита 33 буквы равна
Все заглавные буквы русского алфавита закодированы неравномерным двоичным кодом, в котором никакое кодовое слово не является началом другого кодового слова. Это условие обеспечивает возможность однозначной расшифровки закодированных сообщений. Известно, что все кодовые слова содержат не меньше двух двоичных знаков, а слову БАРАН соответствует код 10011111011010. Какое наименьшее количество двоичных знаков может содержать сообщение, кодирующее слово РОБОТ?
Заметим, что буква А повторяется в слове БАРАН два раза. Буква Н стоит в конце слова, кодовое слово 10 для буквы Н не подходит, поскольку тогда невозможно будет подобрать такое кодовое слово для буквы А, которое может встретиться в коде 10011111011010 два раза. Кодовое слово 1010 для буквы Н не подходит, поскольку в этом случае либо невозможно будет подобрать такое кодовое слово для буквы А, которое может встретиться в коде 10011111011010 два раза, либо невозможно будет подобрать такое кодовое слово для буквы А, которое не будет нарушать условие Фано. Значит, букве Н соответствует кодовое слово 010.
Букву А можем закодировать только кодовым словом 011, поскольку при выборе кодового слова 11 не останется кодового слова для буквы Р, не нарушающего условия Фано, а кодовое слово 1011 не встречается в коде 10011111011010 два раза. Тогда букве Б соответствует кодовое слово 10, а букве Р соответствует кодовое слово 111.
Буква О встречается в слове РОБОТ два раза, закодируем её кодовым словом 00. Букву Т закодировать кодовым словом 110 нельзя, поскольку не останется кодовых слов для остальных букв русского алфавита, поэтому букве Т соответствует кодовое слово 1100. Тогда сообщение, кодирующее слово РОБОТ, содержит 3 + 2 + 2 + 2 + 4 = 13 двоичных знаков.