минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

2.2. Равномерное алфавитное двоичное кодирование. Байтовый код

В этом случае двоичный код первичного алфавита строится цепочками равной длины, т.е. со всеми знаками связано одинаковое количество информации равное I ( А) = log2 N. Формировать признак конца знака не требуется, поэтому для определения длины кода можно воспользоваться формулой К(А,2) > log2 N. Приемное устройство просто отсчитывает оговоренное заранее количество элементарных сигналов и интерпретирует цепочку (устанавливает, какому знаку она соответствует), соотнося ее с таблицей кодов. Правда, при этом недопустимы сбои, например, пропуск (непрочтение) одного элементарного сигнала приведет к сдвигу всей кодовой последовательности и неправильной ее интерпретации; решается проблема путем синхронизации передачи или иными способами. С другой стороны, применение равномерного кода оказывается одним из средств контроля правильности передачи, поскольку факт поступления лишнего элементарного сигнала или, наоборот, поступление неполного кода сразу интерпретируется как ошибка.

Другим важным примером использования равномерного алфавитного кодирования является представление символьной (знаковой) информации в компьютере. Чтобы определить длину кода, необходимо начать с установления количества знаков в первичном алфавите. Компьютерный алфавит должен включать:

Байт наряду с битом может использоваться как единица измерения количества информации в сообщении. Один байт соответствует количеству информации в одном знаке алфавита при их равновероятном распределении. Этот способ измерения количества информации называется также объемным. Пусть имеется некоторое сообщение (последовательность знаков); оценка количества содержащейся в нем информации согласно рассмотренному ранее вероятностному подходу (с помощью формулы Шеннона дает Iвер, а объемная мера пусть равна Iоб; соотношение между этими величинами вытекает из (2.12):

Именно байт принят в качестве единицы измерения количества информации в международной системе единиц СИ. 1 байт = 8 бит. Наряду с байтом для измерения количества информации используются более крупные производные единицы:

1 Кбайт = 2 10 байт = 1024 байт (килобайт)

1 Мбайт = 2 20 байт = 1024 Кбайт (мегабайт)

1 Гбайт = 2 30 байт = 1024 Мбайт (гигабайт)

1 Тбайт = 2 40 байт = 1024 Гбайт (терабайт)

Использование 8-битных цепочек позволяет закодировать 2 8 =256 символов, что превышает оцененное выше N и, следовательно, дает возможность употребить оставшуюся часть кодовой таблицы для представления дополнительных символов.

Однако недостаточно только условиться об определенной длине кода. Ясно, что способов кодирования, т.е. вариантов сопоставления знакам первичного алфавита восьмибитных цепочек, очень много. По этой причине для совместимости технических устройств и обеспечения возможности обмена информацией между многими потребителями требуется согласование кодов. Подобное согласование осуществляется в форме стандартизации кодовых таблиц.

Он регламентирует коды первой половины кодовой таблицы (номера кодов от 0 до 127, т.е. первый бит всех кодов 0). В эту часть попадают коды прописных и строчных английских букв, цифры, знаки препинания и математических операций, а также некоторые управляющие коды (номера от 0 до 31), вырабатываемые при использовании клавиатуры. Ниже приведены некоторые ФSC-коды:

Источник

Содержание урока

Равномерные коды

Равномерные коды

Если нам нужно записать в память компьютера какой-то текст на русском языке, его нужно представить в виде двоичного кода, т. е. перекодировать.

Например, перекодируем слово ГАГАРА в двоичный алфавит, считая, что в тексте есть только буквы «А», «Г» и «Р», т. е. алфавит состоит из трёх знаков. Присвоим каждой из этих букв двоичные коды — кодовые слова (рис. 2.5).

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Закодируйте с помощью этого кода слово ГАГАРА.

Такой код называется равномерным, потому что длина всех кодовых слов одинакова.

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равнаРавномерный код — это код, в котором все кодовые слова имеют одинаковую длину.

Теперь предположим, что по компьютерной сети передана цепочка

000010000100000010000100

Известно, что для кодирования использовалась таблица, показанная на рис. 2.5, и нам нужно узнать, какое сообщение было закодировано. Эта операция называется декодированием.

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равнаДекодирование — это восстановление исходного сообщения из кода.

Сообщение 000010000100000010000100 закодировано с помощью равномерного кода, приведённого на рис. 2.5. Определите, сколько знаков было в исходном сообщении. Как вы рассуждали? Декодируйте это сообщение.

Равномерный 5-битный двоичный код, разработанный в конце XIX века Жаном Морисом Бодо, использовался в телеграфных аппаратах. В современных компьютерных системах при передаче текстовых сообщений также часто применяют равномерный (8-битный или 16-битный) код.

Можно ли было для кодирования букв «А», «Г», «Р» использовать более короткий равномерный код? Определите наименьшую возможную длину кодовых слов.

Если для кодирования используется алфавит мощностью M, то с помощью кодовых слов длиной L можно закодировать M L различных знаков. Это число должно быть не меньше, чем мощность алфавита исходного сообщения M0, потому что иначе какие-то буквы обязательно получат одинаковые коды.

Длину кодовых слов L выбирают из условия M L ≥ M0, где М0 — мощность алфавита исходного сообщения и М — мощность нового алфавита.

Как выбрать наименьшую возможную длину кодовых слов при равномерном кодировании?

В сообщении используются 33 русские прописные буквы и пробел. Определите наименьшую длину кодовых слов для равномерного кодирования этого сообщения в трёхбуквенном и четырёхбуквенном алфавитах.

Следующая страница минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равнаНеравномерные коды

Cкачать материалы урока
минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Источник

Минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

На этом шаге мы рассмотрим равномерное алфавитное двоичное кодирование; байтовый код.

Iвер минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равнаIоб

Именно байт принят в качестве единицы измерения количества информации в международной системе единиц СИ. 1 байт = 8 бит. Наряду с байтом для измерения количества информации используются более крупные производные единицы:

1 Кбайт = 2 10 байт = 1024 байт (килобайт)

1 Мбайт = 2 20 байт = 1024 Кбайт (мегабайт)

1 Гбайт = 2 30 байт = 1024 Мбайт (гигабайт)

1 Тбайт = 2 40 байт = 1024 Гбайт (терабайт)

Использование 8-битных цепочек позволяет закодировать 2 8 =256 символов, что превышает оцененное выше N и, следовательно, дает возможность употребить оставшуюся часть кодовой таблицы для представления дополнительных символов.

Вторая часть кодовой таблицы – онасчитается расширением основной – охватывает коды в интервале от 128 до 255 (первый бит всех кодов 1). Она используется для представления символов национальных алфавитов (например, русского или греческого), а также символов псевдографики. Для этой части также имеются стандарты, например, для символов русского языка это КОИ–8, КОИ–7 и др.

Как в основной таблице, так и в ее расширении коды букв и цифр соответствуют их лексикографическому порядку (т.е. порядку следования в алфавите) – это обеспечивает возможность автоматизации обработки текстов и ускоряет ее.

Источник

Информатика. 7 класс

Конспект урока

Кодирование информации. Двоичный код

Перечень вопросов, рассматриваемых в теме:

Дискретизация информации – процесс преобразования информации из непрерывной формы представления в дискретную. Чтобы представить информацию в дискретной форме, её следует выразить с помощью символов какого-нибудь естественного или формального языка.

Алфавит языка – конечный набор отличных друг от друга символов, используемых для представления информации. Мощность алфавита – это количество входящих в него символов.

Алфавит, содержащий два символа, называется двоичным алфавитом. Представление информации с помощью двоичного алфавита называют двоичным кодированием. Двоичное кодирование универсально, так как с его помощью может быть представлена любая информация.

1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.

Теоретический материал для самостоятельного изучения

Для решения своих задач человеку часто приходится преобразовывать имеющуюся информацию из одной формы представления в другую. Например, при чтении вслух происходит преобразование информации из дискретной (текстовой) формы в непрерывную (звук). Во время диктанта на уроке русского языка, наоборот, происходит преобразование информации из непрерывной формы (голос учителя) в дискретную (записи учеников).

Информация, представленная в дискретной форме, значительно проще для передачи, хранения или автоматической обработки. Поэтому в компьютерной технике большое внимание уделяется методам преобразования информации из непрерывной формы в дискретную.

Дискретизация информации – процесс преобразования информации из непрерывной формы представления в дискретную.

Рассмотрим суть процесса дискретизации информации на примере.

На метеорологических станциях имеются самопишущие приборы для непрерывной записи атмосферного давления. Результатом их работы являются барограммы – кривые, показывающие, как изменялось давление в течение длительных промежутков времени. Одна из таких кривых, вычерченная прибором в течение семи часов проведения наблюдений, показана на рисунке 1.

На основании полученной информации можно построить таблицу, содержащую показания прибора в начале измерений и на конец каждого часа наблюдений.

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Полученная таблица даёт не совсем полную картину того, как изменялось давление за время наблюдений: например, не указано самое большое значение давления, имевшее место в течение четвёртого часа наблюдений. Но если занести в таблицу значения давления, наблюдаемые каждые полчаса или 15 минут, то новая таблица будет давать более полное представление о том, как изменялось давление.

Таким образом, информацию, представленную в непрерывной форме (барограмму, кривую), мы с некоторой потерей точности преобразовали в дискретную форму (таблицу).

В дальнейшем вы познакомитесь со способами дискретного представления звуковой и графической информации.

В общем случае, чтобы представить информацию в дискретной форме, её следует выразить с помощью символов какого-нибудь естественного или формального языка. Таких языков тысячи. Каждый язык имеет свой алфавит.

Алфавит – конечный набор отличных друг от друга символов (знаков), используемых для представления информации. Мощность алфавита – это количество входящих в него символов (знаков).

Алфавит, содержащий два символа, называется двоичным алфавитом (рис. 3). Представление информации с помощью двоичного алфавита называют двоичным кодированием. Закодировав таким способом информацию, мы получим её двоичный код.

Рассмотрим в качестве символов двоичного алфавита цифры 0 и 1. Покажем, что любой алфавит можно заменить двоичным алфавитом. Прежде всего, присвоим каждому символу рассматриваемого алфавита порядковый номер. Номер представим с помощью двоичного алфавита. Полученный двоичный код будем считать кодом исходного символа.

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Если мощность исходного алфавита больше двух, то для кодирования символа этого алфавита потребуется не один, а несколько двоичных символов. Другими словами, порядковому номеру каждого символа исходного алфавита будет поставлена в соответствие цепочка (последовательность) из нескольких двоичных символов. Правило получения двоичных кодов для символов алфавита мощностью больше двух можно представить схемой на рисунке.

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Двоичные символы (0,1) здесь берутся в заданном алфавитном порядке и размещаются слева направо. Двоичные коды (цепочки символов) читаются сверху вниз. Все цепочки (кодовые комбинации) из двух двоичных символов позволяют представить четыре различных символа произвольного алфавита:

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Цепочки из трёх двоичных символов получаются дополнением двухразрядных двоичных кодов справа символом 0 или 1. В итоге кодовых комбинаций из трёх двоичных символов получается 8 – вдвое больше, чем из двух двоичных символов:

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Соответственно, четырёхразрядный двоичный код позволяет получить 16 кодовых комбинаций, пятиразрядный – 32, шестиразрядный – 64 и т. д.

Длину двоичной цепочки – количество символов в двоичном коде – называют разрядностью двоичного кода.

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Обратите внимание, что:

32 = 2 ∙ 2 ∙ 2 ∙ 2 ∙ 2 и т. д.

Здесь количество кодовых комбинаций представляет собой произведение некоторого количества одинаковых множителей, равного разрядности двоичного кода.

Если количество кодовых комбинаций обозначить буквой N, а разрядность двоичного кода – буквой i, то выявленная закономерность в общем виде будет записана так:

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

В математике такие произведения записывают в виде:

Запись 2 i читают так: «2 в i-й степени».

Задача. Вождь племени Мульти поручил своему министру разработать двоичный код и перевести в него всю важную информацию. Двоичный код какой разрядности потребуется, если алфавит, используемый племенем Мульти, содержит 16 символов? Выпишите все кодовые комбинации.

Чтобы выписать все кодовые комбинации из четырёх 0 и 1, воспользуемся схемой на рис. 1.13: 0000, 0001, 0010, 0011, 0100, 0101, 0110, 0111, 1000, 1001, 1010, 1011, 1100, 1101, 1110, 1111.

Универсальность двоичного кодирования

В начале нашей беседы вы узнали, что информация, представленная в непрерывной форме, может быть выражена с помощью символов некоторого естественного или формального языка. В свою очередь, символы произвольного алфавита могут быть преобразованы в двоичный код. Таким образом, с помощью двоичного кода может быть представлена любая информация на естественных и формальных языках, а также изображения и звуки (рис. 6). Это и означает универсальность двоичного кодирования.

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Двоичные коды широко используются в компьютерной технике, требуя только двух состояний электронной схемы – «включено» (это соответствует цифре 1) и «выключено» (это соответствует цифре 0).

Простота технической реализации – главное достоинство двоичного кодирования. Недостаток двоичного кодирования – большая длина получаемого кода.

Равномерные и неравномерные коды

Различают равномерные и неравномерные коды. Равномерные коды в кодовых комбинациях содержат одинаковое число символов, неравномерные – разное.

Выше мы рассмотрели равномерные двоичные коды.

Примером неравномерного кода может служить азбука Морзе, в которой для каждой буквы и цифры определена последовательность коротких и длинных сигналов. Так, букве Е соответствует короткий сигнал («точка»), а букве Ш – четыре длинных сигнала (четыре «тире»). Неравномерное кодирование позволяет повысить скорость передачи сообщений за счёт того, что наиболее часто встречающиеся в передаваемой информации символы имеют самые короткие кодовые комбинации.

Разбор решения заданий тренировочного модуля

№1.Тип задания: ввод с клавиатуры пропущенных элементов в тексте

Переведите десятичное число 273 в двоичную систему счисления.

Воспользуемся алгоритмом перевода целых чисел из системы с основанием p в систему с основанием q:

1. Основание новой системы счисления выразить цифрами исходной системы счисления и все последующие действия производить в исходной системе счисления.

2. Последовательно выполнять деление данного числа и получаемых целых частных на основание новой системы счисления до тех пор, пока не получим частное, меньшее делителя.

3. Полученные остатки, являющиеся цифрами числа в новой системе счисления, привести в соответствие с алфавитом новой системы счисления.

4. Составить число в новой системе счисления, записывая его, начиная с последнего остатка.

минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Смотреть картинку минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Картинка про минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна. Фото минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Ответ: 27310= 100010001.

№2. Тип задания: единичный / множественный выбор.

Четыре буквы латинского алфавита закодированы кодами различной длины:

Источник

Минимальная длина равномерных двоичных кодов для буквы русского алфавита 33 буквы равна

Заглавные буквы русского алфавита закодированы неравномерным двоичным кодом, в котором никакое кодовое слово не является началом другого кодового слова. Это условие обеспечивает возможность однозначной расшифровки закодированных сообщений. Известно, что все кодовые слова содержат не меньше двух двоичных знаков, а слову КОШКА соответствует код 10101001101000. Какой код соответствует слову ШОК?

Заметим, что буква К повторяется в слове КОШКА два раза. Буква К стоит в начале слова, кодовое слово 1 для кодирования буквы К использоваться не может, кодовое слово 10 использоваться не может, поскольку при кодировании остальных букв будет нарушено условие Фано, кодовое слово 1010 использоваться не может, поскольку в коде 10101001101000 не найдётся второй буквы К. Значит, буква К кодируется словом 101. Тогда буква А, стоящая на конце слова, соответствует кодовому слову 000.

Буква О кодироваться словом 010 не может, поскольку при кодировании буквы Ш будет нарушено условие Фано, значит, буква О соответствует кодовому слову 01, а буква Ш — кодовому слову 001.

Тогда слово ШОК будет закодировано кодовым словом 00101101.

Все заглавные буквы русского алфавита закодированы неравномерным двоичным кодом, в котором никакое кодовое слово не является началом другого кодового слова. Это условие обеспечивает возможность однозначной расшифровки закодированных сообщений. Известно, что все кодовые слова содержат не меньше двух двоичных знаков, а слову БАРАН соответствует код 10011111011010. Какое наименьшее количество двоичных знаков может содержать сообщение, кодирующее слово РОБОТ?

Заметим, что буква А повторяется в слове БАРАН два раза. Буква Н стоит в конце слова, кодовое слово 10 для буквы Н не подходит, поскольку тогда невозможно будет подобрать такое кодовое слово для буквы А, которое может встретиться в коде 10011111011010 два раза. Кодовое слово 1010 для буквы Н не подходит, поскольку в этом случае либо невозможно будет подобрать такое кодовое слово для буквы А, которое может встретиться в коде 10011111011010 два раза, либо невозможно будет подобрать такое кодовое слово для буквы А, которое не будет нарушать условие Фано. Значит, букве Н соответствует кодовое слово 010.

Букву А можем закодировать только кодовым словом 011, поскольку при выборе кодового слова 11 не останется кодового слова для буквы Р, не нарушающего условия Фано, а кодовое слово 1011 не встречается в коде 10011111011010 два раза. Тогда букве Б соответствует кодовое слово 10, а букве Р соответствует кодовое слово 111.

Буква О встречается в слове РОБОТ два раза, закодируем её кодовым словом 00. Букву Т закодировать кодовым словом 110 нельзя, поскольку не останется кодовых слов для остальных букв русского алфавита, поэтому букве Т соответствует кодовое слово 1100. Тогда сообщение, кодирующее слово РОБОТ, содержит 3 + 2 + 2 + 2 + 4 = 13 двоичных знаков.

Все заглавные буквы русского алфавита закодированы неравномерным двоичным кодом, в котором никакое кодовое слово не является началом другого кодового слова. Это условие обеспечивает возможность однозначной расшифровки закодированных сообщений. Известно, что все кодовые слова содержат не меньше двух двоичных знаков, а слову БАЗАР соответствует код 10001111011010. Какое наименьшее количество двоичных знаков может содержать сообщение, кодирующее слово РОБОТ?

Заметим, что буква А повторяется в слове БАЗАР два раза. Буква Р стоит в конце слова, кодовое слово 10 для буквы Р не подходит, поскольку тогда невозможно будет подобрать такое кодовое слово для буквы А, которое может встретиться в коде 10001111011010 два раза. Кодовое слово 1010 для буквы Р не подходит, поскольку в этом случае либо невозможно будет подобрать такое кодовое слово для буквы А, которое может встретиться в коде 10001111011010 два раза, либо невозможно будет подобрать такое кодовое слово для буквы А, которое не будет нарушать условие Фано. Значит, букве Р соответствует кодовое слово 010.

Букву А можем закодировать только кодовым словом 011, поскольку при выборе кодового слова 11 не останется кодового слова для буквы Р, не нарушающего условия Фано, а кодовое слово 1011 не встречается в коде 10001111011010 два раза. Тогда букве Б соответствует кодовое слово 100, а букве З соответствует кодовое слово 11.

Буква О встречается в слове РОБОТ два раза, закодируем её кодовым словом 00. Букву Т закодировать кодовым словом 101 нельзя, поскольку не останется кодовых слов для остальных букв русского алфавита, поэтому букве Т соответствует кодовое слово 1010. Тогда сообщение, кодирующее слово РОБОТ, содержит 3 + 2 + 3 + 2 + 4 = 14 двоичных знаков.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *