Что понимается под понятием кодирование

Кодирование

Что понимается под понятием кодирование. Смотреть фото Что понимается под понятием кодирование. Смотреть картинку Что понимается под понятием кодирование. Картинка про Что понимается под понятием кодирование. Фото Что понимается под понятием кодирование

Что понимается под понятием кодирование. Смотреть фото Что понимается под понятием кодирование. Смотреть картинку Что понимается под понятием кодирование. Картинка про Что понимается под понятием кодирование. Фото Что понимается под понятием кодирование

Полезное

Смотреть что такое «Кодирование» в других словарях:

Кодирование — Encoding Отождествление квантованного сигнала электросвязи с кодовыми словами Примечания: 1. Под кодовым словом понимается упорядоченная последовательность символов некоторого алфавита. 2. В конкретных устройствах квантование сигнала электросвязи … Словарь-справочник терминов нормативно-технической документации

Кодирование — Кодирование: В Викисловаре есть статья «кодирование» Кодирование информации процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для передачи, хранения или автоматической… … Википедия

Кодирование — процесс представления данных последовательностью символов, кодов, сигналов. Кодирование позволяет представить данные в форме, удобной для использования в системах и сетях. По английски: Coding См. также: Кодирование Обработка сигналов Коды… … Финансовый словарь

КОДИРОВАНИЕ — (от франц. code – свод законов, правил) – отображение (преобразование) нек рых объектов (событий, состояний) в систему конструктивных объектов (называемых кодовыми образами), совершаемое по определ. правилам, совокупность к рых наз. шифром К.,… … Философская энциклопедия

КОДИРОВАНИЕ — отображение признаков геол. объектов в символах некоторого усл. алфавита. Различается непозиционное кодирование, при котором каждый признак обозн. самостоятельным знаком, и позиционное кодирование, в котором имеет значение не только форма знака,… … Геологическая энциклопедия

КОДИРОВАНИЕ — [ Словарь иностранных слов русского языка

кодирование — шифрование, программирование, зашифровывание, гаммирование, шифровка, закодирование, зашифровка, кодировка, зашифрование, гипнотизирование Словарь русских синонимов. кодирование сущ., кол во синонимов: 12 • гаммирование (1) … Словарь синонимов

кодирование — Преобразование дискретного сообщения в дискретный сигнал, осуществляемое по определенному правилу. [Сборник рекомендуемых терминов. Выпуск 94. Теория передачи информации. Академия наук СССР. Комитет технической терминологии. 1979 г.] кодирование… … Справочник технического переводчика

КОДИРОВАНИЕ — КОДИРОВАНИЕ, смотри в статье Код … Современная энциклопедия

КОДИРОВАНИЕ — операция отождествления символов или групп символов одного кода с символами или группами символов другого кода … Большой Энциклопедический словарь

кодирование — КОДИРОВАТЬ, рую, руешь; анный; сов. и несов., что (спец.). Толковый словарь Ожегова. С.И. Ожегов, Н.Ю. Шведова. 1949 1992 … Толковый словарь Ожегова

Источник

Информатика. Шпаргалка

Что понимается под понятием кодирование. Смотреть фото Что понимается под понятием кодирование. Смотреть картинку Что понимается под понятием кодирование. Картинка про Что понимается под понятием кодирование. Фото Что понимается под понятием кодирование

Понятие «информатика» (от лат. – «осведомленность в чем-либо» появилось в середине XX в. во Франции. Термин образовался посредством объединения слов «информация» (information) и «автоматика» (automatique) и в переводе на русский язык означает «автоматизированная обработка информация»; возник, чтобы определить область знании, которая занимается обработкой информации с использованием ЭВМ. Другими словами, информатика является наукой о компьютерной технике.

Оглавление

Приведённый ознакомительный фрагмент книги Информатика. Шпаргалка предоставлен нашим книжным партнёром — компанией ЛитРес.

Кодирование текстовых данных

Под системой кодирования понимается комплекс норм обозначения информации с помощью кода.

Кодирование представляет собой перевод того или иного вида информации в код (условное обозначение) с целью оптимизации обработки данных.

Под текстовой информацией понимается сочетание различных знаков или символов (буквенных, цифровых или других), посредством которых выражаются или отображаются информационные объекты — данные на разнообразных носителях (бумага, электронный вид и т. д.).

Для разработчиков программного обеспечения кодирование текстовой информации является одной из важнейших задач. Эта задача облегчится, если каждую букву алфавита, цифру или знак препинания сопоставить с двоичными числами. Чтобы решить эту задачу, хватит и одного байта информации, с применением которого можно закодировать 256 символов. С этим связана одна общая проблема — система кодирования текстовых данных должна быть одинакова во всем мире и на всех компьютерах. Но эта проблема все еще не решена, так как, например, в России существует несколько систем кодирования текстовых данных. А относительно второй части проблемы можно сказать следующее: компьютеры, на которых применялись свои оригинальные системы кодирования, устарели и вышли из употребления. Кодирование текстовых данных осуществляется в соответствии со стандартами ASCII (американская система кодирования для обмена информацией), в основу которых положен принцип удовлетворения международных интересов и интересов отдельных стран и разработчиков. В соответствии с этим стандартом таблица кодирования символов разделена на две части: базовую (коды от 0 до 127) и расширенную (коды от 128 до 255). Базовая часть в свою очередь делится еще на две части. В первую часть входят коды от 0 до 31, которые были отданы разработчикам аппаратуры. Во вторую часть включены коды от 32 до 127. Эти коды составляют международную часть. Таблицы международной части используются во всех странах мира.

За расширенную часть стандарт не отвечает. В этой части каждая страна располагает свои символы исходя из своего удобства.

В настоящее время разработана шестнадцатиразрядная система кодирования текстовых данных, которая называется UNICODE. Данная система кодирования позволяет закодировать 65 536 символов. Благодаря системе UNICODE в одной таблице можно закодировать символы большинства стран планеты.

Кодировка КОИ-8 (восьмизначный код обмена информацией) применяется в сети Интернет, а также в компьютерных системах в России.

Кодировка ISO (международный стандарт кодировки русского текста), несмотря на свое обозначение как стандарта, практически не применяется.

Источник

Кодирование информации

1.3.1 Системы кодирования

Под кодированием понимается процесс присвоения условных обозначений (кодов) признакам объектов. Кодирование используется для представления информации в ЭВМ при хранении, передаче и обработке. Вопросам кодирования, связанным с хранением и передачей информации (представление в ЭВМ, шифрование, сжатие, помехозащищённость), посвящены соответствующие разделы теории информации.

Здесь же рассматриваются основы кодирования, связанного с обработкой информации. Цель такого кодирования – обеспечение более удобной и эффективной обработки информации (путём представления информации в соответствующей форме). Система кодирования – совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, который может состоять из букв, цифр и других символов. Наибольшее распространение при обработке информации с помощью ЭВМ получили цифровые коды. Код характеризуется длиной, структурой и степенью информативности. Длина – количество позиций (знаков, разрядов) в коде. Структура – порядок расположения в коде символов, используемых для обозначения классификационного признака. Степень информативности – отношение числа закодированных признаков к длине кода.

К системам кодирования предъявляются следующие требования:

— идентификация каждого объекта кодируемого множества;

— отображение необходимой информации об объектах;

— достаточная гибкость и резерв кодовых обозначений при минимальной длине кода;

— ориентация на автоматическую обработку информации, возможность обнаружения ошибок.

Существующие системы кодирования информации можно разбить на два основных вида (рис. 3.3):

регистрационные системы кодирования, не требующие предварительной классификации объектов;

классификационные системы кодирования, ориентированные на проведение предварительной классификации объектов.

Регистрационное кодирование, в свою очередь, может быть представлено порядковой и серийно-порядковой системами, а классификационное – последовательной и параллельной системами. Каждая из них имеет преимущества и недостатки, поэтому в зависимости от конкретных обстоятельств и целей необходимо выбирать наиболее рациональную систему.

Что понимается под понятием кодирование. Смотреть фото Что понимается под понятием кодирование. Смотреть картинку Что понимается под понятием кодирование. Картинка про Что понимается под понятием кодирование. Фото Что понимается под понятием кодированиеЧто понимается под понятием кодирование. Смотреть фото Что понимается под понятием кодирование. Смотреть картинку Что понимается под понятием кодирование. Картинка про Что понимается под понятием кодирование. Фото Что понимается под понятием кодирование

Рис. 3.3. Классификация основных систем кодирования

Особо следует выделить комбинированные системы кодирования, представляющие собой сочетание нескольких различных систем кодирования. Они используются для кодирования больших номенклатур объектов, которые можно группировать по нескольким соподчинённым или независимым признакам. Комбинированные системы кодирования дают возможность получить более информативный код.

1.3.2 Порядковое кодирование

Порядковая система кодирования не требует предварительной классификации объектов и основана на наиболее простом методе. Его суть заключается в последовательной нумерации объектов натуральными числами. Таким образом, каждый объект идентифицируется регистрационным номером. Объекты при регистрации могут располагаться как случайно, так и в определённом порядке, например алфавитном (список студентов группы) или хронологическом (журнал регистрации событий).

Достоинствами порядковой системы являются простота кодирования и минимальная длина кода. Долговечность порядкового кода практически всегда достигается за счёт незначительной избыточности, так как добавление только одного разряда увеличивает ёмкость кода вА раз.

Недостатком порядковой системы кодирования является отсутствие в коде информации о свойствах объектов (даже зная, что список группы составляется в лексикографическом порядке, мы не можем по номеру с полной уверенностью назвать начальную букву фамилии, так как все студенты могут оказаться Ивановыми).

1.3.3 Серийно-порядковое кодирование

Используемый в серийно-порядковой системе метод отличается от порядкового кодирования тем, что объекты предварительно разбиваются на подмножества, а порядковые номера – на серии. Элементы каждого подмножества регистрируются в пределах отведённой для него серии номеров. В каждой серии обычно предусматриваются резервные номера (на случай появления новых позиций).

По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Обычно применяется в тех случаях, когда деление на подмножества осуществляется только по одному классификационному признаку, а их количество невелико.

Пример.Для нумерации аудиторий некоего вуза, размещённого в четырёх небольших близкорасположенных зданиях, имеющих по 20 используемых для занятий помещений, можно использовать четыре серии по 25 номеров (00–24; 25–49; 50–74; 75–99). При этом в каждой серии остаётся резерв из пяти номеров (на случай перепланировки), а длина кода аудитории остаётся прежней – двузначной. Другой пример: использование «нечётной» серии для нумерации почтовых адресов домов, расположенных на левой, а «чётной» – на правой стороне улицы.

Серийно-порядковой системе присущи в основном те же достоинства и недостатки, что и порядковому кодированию. Но здесь коды, помимо идентификации объекта, несут некоторую дополнительную информацию, хотя её восприятие человеком может быть затруднено. Резервирование, с одной стороны, является достоинством, обеспечивающим некоторую долговечность кода, а с другой – серийно-порядковая система может стать непригодной из-за переполнения только одной серии, при этом резервы других серий ещё не будут исчерпаны. Поэтому серийно-порядковый код в сравнении с порядковым оказывается менее долговечным и более избыточным.

1.3.4 Последовательное кодирование

Последовательное кодирование, как и параллельное (рис. 3.3), требует проведения предварительной классификации кодируемых объектов. Классификационные системы кодирования называются также позиционными, так как для выражения каждого классификационного признака в структуре кода выделяется позиция (группа символов) из одного или нескольких разрядов.

Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, а после код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. При этом значение характеристики объекта, выраженного каким-либо числом на определённой позиции, зависит от конкретного значения предыдущих разрядов кодовой комбинации (за исключением разрядов старшей группировки).

Пример. Проведём кодирование информации, классифицированной с помощью двухуровневой иерархической схемы (рис. 3.3). Количество позиций определяется глубиной классификации и равно двум. Присвоим на каждом уровне код «Л» для левых группировок (Регистрационные, Порядковая, Последовательная), «П» – для правых (Классификационные, Серийно-порядковая, Параллельная). Структура кода задаётся последовательностью «ХY», где «Х» – код группировки первого уровня, «Y» – второго. Теперь легко получить коды всех группировок второго уровня:

— ЛЛ – (Система кодирования) Регистрационная, Порядковая;

— ЛП – Регистрационная, Серийно-порядковая;

— ПЛ – Классификационная, Последовательная;

— ПП – Классификационная, Параллельная.

Следует обратить внимание на то, что символ «Л» в позиции «Х» имеет значение – «Регистрационные», а значение этого же символа, но расположенного в позиции «Y», уже зависит от предыдущего знака (ЛЛ – Порядковая, а ПЛ – Последовательная). То есть извлечение информации из кода (как и кодирование) осуществляется последовательно: сначала определяется значение признака, соответствующего первому уровню, а только потом – второму.

Последовательная система кодирования обладает теми же основными достоинствами и недостатками, что и иерархическая система классификации. Если же сравнивать с порядковой системой, то представление дополнительной информации достигается за счёт увеличения длины и избыточности кода.

1.3.5 Параллельное кодирование

Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга (параллельно, одновременно); для каждого фасета в структуре кода определяется позиция из одного или нескольких разрядов.

Параллельная система кодирования обладает основными достоинствами и недостатками, присущими фасетной системе классификации. Однако параллельный код оказывается ещё более избыточным, чем последовательный, так как на практике многие сочетания признаков могут вообще не существовать и, следовательно, ёмкость кода будет использоваться не полностью.

Пример. Проведём кодирование сведений, представленных на рисунке 3.2. фасетами «Направление», «Форма обучения», «Курс». Количество кодовых группировок определяется количеством фасетов и равно трём. Для кодирования фасетов следует проанализировать их номенклатуру и выбрать наиболее рациональный метод, учитывая предъявляемые к системам кодирования требования.

Для использования в процессе автоматизированной обработки и обмена информацией на всех установленных государством образовательных уровнях в Российской Федерации с охватом как государственных, так и негосударственных образовательных учреждений предназначен Общероссийский классификатор специальностей по образованию (ОКСО). Но в учебных целях рассматриваемого примера (удобство восприятия, понимание) можно закодировать каждое направление первыми тремя буквами его наименования. Для кодирования фасета «Форма обучения» будем использовать первую букву значения, а для номера курса – соответствующую десятичную цифру.

Структуру полученного кода можно выразить записью «ННН Ф К», где ННН – присвоенный нами код направления; Ф – код формы обучения, К – курс. В отличие от последовательного кодирования, порядок (очерёдность) кодирования фасетов значения не имеет. Поэтому по обозначению «Сер О 2» мы независимо от других позиций можем определить и направление – Сервис; и форму обучения – очная; и курс – второй.

1.3.6 Штриховое кодирование

В настоящее время для автоматической идентификации признаков объектов широко используется штриховое кодирование, основанное на оптическом считывании информации различными техническими устройствами – сканерами штрих-кода. В качестве примера можно привести такие широко известные штриховые коды, как:

— UРC (Universal Product Code) – универсальный товарный код, разработанный в США;

— EAN (European Article Number) – европейский товарный код, созданный на базе UРC;

Опуская особенности преобразования штрихового года в цифровой, рассмотрим подробнее структуру широко распространённого в России товарного кода EAN-13. Он состоит из тринадцати цифр, которые можно разделить на четыре части:

— первые три цифры обозначают код страны-производителя (точнее – код регионального представителя глобальной организации по стандартизации). Но некоторые коды имеют специальное значение. Так, использование кодов, начинающихся с цифры 2, разрешено для внутренних целей любого предприятия, но запрещено за его пределами (применяется, например, для весового товара при розничной торговле);

— следующие четыре цифры (в России начиная с 2000 г. – шесть) – код предприятия-производителя для данной страны;

— следующие пять цифр (в России – три) – код продукта, устанавливаемый предприятием-производителем;

— последняя цифра является контрольной.

Таким образом, в основе кода EAN-13 лежит последовательная система кодирования, так как определение значения второй части кода возможно только после определения первой, а третьей – после второй. При этом в первой части кода используется серийно-порядковое кодирование, так как, например, России соответствует серия 460–469.

Классификаторы

Для обеспечения взаимодействия различных ИС и сопоставимости получаемой из них информации осуществляется разработка и внедрение классификаторов, представляющих собой систематизированную совокупность наименований и кодов классификационных группировок. В зависимости от применения классификаторы можно разделить на следующие группы:

— общероссийские, используемые во всех секторах экономики;

— классификаторы, используемые в пределах определённого сектора экономики;

— локальные, используемые в пределах отдельных предприятий и организаций.

В любой стране разработаны и применяются государственные и отраслевые классификаторы. Например, классифицированы отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д. С целью обеспечения совместимости государственных информационных систем и ресурсов, создаваемых на федеральном и региональном уровнях управления в Российской Федерации разработан Общероссийский классификатор информации об общероссийских классификаторах (ОКОК).

Все общероссийские классификаторы являются составной частью Единой системы классификации и кодирования технико-экономической и социальной информации (ЕСКК ТЭИ), используемой в различных ИС, и их применение в формах первичных документов, а также при обработке информации средствами вычислительной техники, является обязательным условием для предприятий, организаций и фирм всех секторов экономики.

Практически любое юридическое лицо так или иначе использует общероссийские классификаторы органов власти и управления (ОКОГУ), территорий (ОКАТО), видов экономической деятельности (ОКВЭД), форм собственности (ОКФС), организационно-правовых форм (ОКОПФ).

Рассмотрим в качестве примера общероссийский классификатор услуг населению (ОКУН), утверждённый Постановлением Госстандарта РФ от 28 июня 1993 г. № 163 (в редакции изменений 12/2010, утверждённых Приказом Росстандарта от 23.12.2010 № 1072-ст).

Этот классификатор разработан для решения задач развития и совершенствования стандартизации в сфере услуг населению; осуществления сертификации услуг с целью обеспечения безопасности жизни, здоровья потребителей и охраны окружающей среды, предотвращения причинения вреда имуществу потребителей; повышения эффективности применения средств вычислительной техники; учёта и прогнозирования объёмов реализации услуг населению; изучения спроса населения на услуги; предоставления услуг населению предприятиями и организациями различных организационно-правовых форм собственности и гражданами-индивидуа-лами; гармонизации классификации услуг населению с международными классификациями; актуализации видов услуг с учётом новых социально-экономических условий в Российской Федерации.

Объектами классификации являются услуги населению, оказываемые предприятиями и организациями различных организационно-пра-вовых форм собственности и гражданами-индивидуалами, использующими различные формы и методы обслуживания.

Для классификатора услуг населению принята иерархическая классификация с делением всего классификационного множества объектов на группы. Затем каждую группу делят на подгруппы, которые в свою очередь делят на виды деятельности по целевому функциональному назначению. В ОКУН используют последовательную систему кодирования.

Кодовое обозначение объекта классификации включает шесть цифровых десятичных знаков (ГГПВУУ) и контрольное число (К). Общая структура кодового обозначения классификатора услуг населению представлена следующей схемой:

Источник

Краткое объяснение кодирования текстовой информации. Информатика

Содержание:

Кодирование текстовой информации — очень распространенное явление. Один и тот же текст может быть закодирован в нескольких форматах. Принято считать, что кодирование текстовой информации появилось с приходом компьютеров. Это и так и не так одновременно. Кодировка в том виде, в котором мы ее знаем, действительно к нам пришла с приходом компьютеров. Но над самим процессом кодирования люди бьются уже много сотен лет. Ведь, по большому счету, сама письменность уже является способом закодировать человеческую речь, для ее дальнейшего использования. Вот и получается, что любая окружающая нас информация никогда не бывает представленной в чистом виде, потому что она уже каким-то образом закодирована. Но сейчас не об этом.

Кодирование текстовой информации

Самый распространенный способ кодирования текстовой информации — это ее двоичное представление, которое сплошь и рядом используется в каждом компьютере, роботе, станке и т. д. Все кодируется в виде слов в двоичном представлении.

Сама технология двоичного представления информации зародилась еще задолго до появления первых компьютеров. Среди первых устройств, которые использовали двоичный метод кодирования, был аппарат Бодо — телеграфный аппарат, который кодировал информацию в 5 битах в двоичном представлении. Суть кодировки заключалась в простой последовательности электрических импульсов:

В компьютерный мир такая кодировка пришла вместе с персонализацией самих компьютеров. То есть в первых компьютерах не было такой кодировки. Но как только компьютеры стали уходить «в массы», то резко обнаружилась потребность обрабатывать компьютерами большое количество именно текстовой информации, которую нужно было как-то кодировать. Тенденция обрабатывать большое количество текстовой информации сохранилась и в современных устройствах.

Так получилось, что двоичное кодирование в компьютерах связано только с двумя символами «0» и «1», которые выстраиваются в определенной логической последовательности. А сам язык подобной кодировки стал называться машинным.

Кодирование текстовой информации и компьютеры

Для справки. Есть уникальный язык программирования, который в качестве своих операторов использует только пробелы, табуляции и переносы строки. Практического применения этот язык не имеет, но он есть.

Мы вводим текст в компьютер при помощи клавиатуры, символы которой мы прекрасно понимаем. Нажимая на какую-то букву, мы отправляем в оперативную память компьютера двоичное представление нажатых клавиш. Каждый отдельный символ будет представлен 8-битной кодировкой. Например буква «А» — это «11000000». Получается, что один символ — это 1 байт или 8 бит. При такой кодировке, путем нехитрых подсчетов можно посчитать, что мы можем зашифровать 256 символов. Для кодирования текстовой информации данного количества символов более чем предостаточно.

Кодирование текстовой информации в компьютерных устройствах сводится к тому, что каждому отдельному символу присваивается уникальное десятичное значение от 0 и до 255 или его эквивалент в двоичной форме от 00000000 и до 11111111. Люди могут различать символы по их внешнему виду, а компьютерное устройство только по их уникальному коду.

Рассмотрите, как происходит процесс. Мы нажимаем нужный нам символ на клавиатуре, ориентируясь на их внешний вид. В оперативную память компьютера он попадает в двоичном представлении, а когда компьютер его выводит нам на экран, то происходит процесс декодирования, чтобы мы увидели знакомый нам символ.

Что понимается под понятием кодирование. Смотреть фото Что понимается под понятием кодирование. Смотреть картинку Что понимается под понятием кодирование. Картинка про Что понимается под понятием кодирование. Фото Что понимается под понятием кодирование

Кодирование текстовой информации и таблицы кодировок

Таблица кодировки — это место, где прописано какому символу какой код относится. Все таблицы кодировки являются согласованными — это нужно, чтобы не возникало путаницы между документами, закодированными по одной таблице, но на разных устройствах.

На сегодняшний день существует множество таблиц кодировок. Из-за этого часто возникают проблемы с переносом текстовых документов между устройствами. Так получается, что если текстовая информация была закодирована по одной какой-то таблице, то и раскодирована она может быть только по этой таблице. Если попытаться раскодировать другой таблицей, то в результате получим только набор непонятных символов, но никак не читабельный текст.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *