Методы кодирования информации

Курбанова А.М. 1, Баммаева Г.А. 1

1Дагестанский Государственный Университет

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Код - это комплект условных обозначений (либо сигналов) с целью записи (либо передачи) предварительно определенных конкретных понятий.

Кодирование информации – это процедура образования установленного представления данных. В узком смысле «кодирование» переключение с одной формы представления данных к иной, наиболее комфортной для хранения, передачи либо обработки.

Как правило любой образ при кодировании представляется отдельным символом.

Символ - это компонент конечного множества непохожих друг на друга компонентов.

Пк способен подвергать обработке лишь данные, представленные в числовой форме. Вся иная информация (к примеру, звуки, изображения и т. д.) для обработки в пк должна быть преобразована в числовую форму. К примеру, для того чтобы перевести в числовую форму музыкальный звук, необходимо через незначительные интервалы времени определять интенсивность звука на определенных частотах, представляя итоги каждого измерения в числовой форме. С помощью программ для пк возможно осуществить преобразования полученной данных, к примеру "наложить" друг на друга звуки с разных источников.

Подобным способом в пк возможно подвергать обработке текстовую информацию. При вводе в пк каждая буква кодируется конкретным числом, а при выводе на внешние устройства с целью восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Как мы знаем все без исключения числа в пк представляются с помощью нулей и единиц. Другими словами, пк как правило функционируют в двоичной системе счисления, так как при этом устройства для их обработки получаются наиболее элементарными. Ввод чисел в пк, а также вывод их с целью чтения человеком способен реализоваться в обычной десятичной форме, а все без исключения требуемые преобразования осуществляют программы, действующие в пк.

Двоичный код – это метод представления данных с помощью 2-ух знаков - $0$ также $1$.

Длина кода – число знаков, применяемых для представления кодируемой информации.

Бит - это одна двоичная цифра $0$ либо $1$. Одним битом возможно закодировать 2 значения: $1$ либо $0$. Двумя битами возможно закодировать 4 значения: $00$, $01$, $10$, $11$. Тремя битами кодируются $8$ различных значений. Добавление 1-го бита удваивает число значений, которое возможно закодировать.

Рисунок 1.

Виды кодирования информации

Различают кодирование информации следующих видов:

кодирование текстовой информации;

кодирование цвета;

кодирование графической информации;

кодирование числовой информации;

кодирование звуковой информации;

кодирование видеозаписи

Кодирование текстовой информации.

Каждый текст состоит из последовательности знаков. Знаками могут являться буквы, цифры, знаки препинания, знаки математических операций, круглые и квадратные скобки и т.д.

Текстовая информация, равно как также каждая иная, находится в памяти пк в двоичном виде. Для этого любому устанавливается в соответствии некоторое неотрицательное число, именуемое кодом знака, и это число вносится в память ЭВМ в двоичном виде. Конкретное соотношение между знаками и их кодами именуется системой кодировки. В пк как правило применяется система кодировки ASCII (American Standard Code for Informational Interchange – Американский стандартный код для информационного обмена).

Создатели программного обеспечения сформировали личные $8$-битные стандарты кодировки текста. За счет дополнительного бита диапазон кодирования в них был расширен до $256$ знаков. Чтобы не было путаницы, первые $128$ знаков в таких кодировках, как правило, отвечают стандарту ASCII. Остальные $128$ - реализуют региональные языковые характерные черты.

Восьмибитными кодировками, популярными в нашей стране, считаются KOI8, UTF8, Windows-1251 и некоторые прочие.

Больше всего кодированию подвергаются тексты, написанные на естественных языках (русском, немецком и др.).

Основные методы кодирования текстовой информации

Имеется ряд ключевых методов кодирования текстовых данных:

графический, в котором текстовая информация кодируется путем применения специальных рисунков либо символов;

символьный, в котором тексты кодируются с применением знаков того же алфавита, на котором написан исходник;

числовой, в котором текстовая информация кодируется с помощью чисел.

Процедура чтения текста представляет собой процесс, обратный его написанию, в результате которого рукописный текст преобразуется в устную речь. Чтение – это ничто иное, как декодирование письменного текста.

Стенография

Стенография — это один из методов кодирования текстовой информации с помощью специальных символов. Она представляет собой быстрый метод записи устной речи. Навыками стенографии могут обладать далеко не все, а только немногие специально обученные люди, которых называют стенографистами. Эти люди успевают записывать текст одновременно с речью выступающего лица, что, на наш взгляд, достаточно трудно. Но для них это не проблема, так как в стенограмме целое слово либо совокупность букв могут обозначаться одним символом. Скорость стенографического письма превышает скорость обыкновенного в $4-7$ раз. Расшифровать стенограмму способен только сам стенографист.

На рисунке представлен пример стенографии, в которой написано следущее: «Говорить умеют все люди на свете. Даже у самых примитивных племен есть речь. Язык — это нечто всеобщее и самое человеческое, что есть на свете»:

Рисунок 2.

Стенография дает возможность не только осуществлять синхронную запись устной речи, но и рационализировать технику письма.

Криптография

В некоторых случаях появляется необходимость засекречивания текста сообщения или документа, с целью того чтобы его не смогли прочитать те, кому не положено. Это называется защитой от несанкционированного доступа. В таком случае секретный текст шифруется. В старые времена шифрование называлось тайнописью.

Шифрование представляет собой процедура превращения открытого текста в зашифрованный, а дешифрование — процедура противоположного преобразования, при котором восстанавливается первоначальный текст.

Шифрование — это тоже кодирование, но с засекреченным способом, известным только источнику и адресату. Методами шифрования занимается наука криптография.

Криптография — это наука о способах и принципах передачи и приема зашифрованной с помощью специальных ключей информации. Ключ — секретная информация, используемая криптографическим алгоритмом при шифровании/расшифровке сообщений.

Числовое кодирование текстовой информации

В любом национальном языке существует свой алфавит, который состоит из определенного набора букв, следующих друг за другом, а значит и имеющих собственный порядковый номер.

Каждой букве сопоставляется целое положительное число, которое называют кодом символа. Именно данный код и будет хранить память компьютера, а при выводе на экран или бумагу преобразовывать в соответствующий ему символ. Кроме кодов самих символов в памяти пк находится также сведения о том, какие именно данные закодированы в конкретной области памяти. Это необходимо для различия представленной информации в памяти пк.

Используя соответствия букв алфавита с их числовыми кодами, возможно сформировать специальные таблицы кодирования. Иначе можно отметить, что символы конкретного алфавита имеют свои числовые коды в соответствии с конкретной таблицей кодирования.

Как мы знаем национальных алфавитов колоссальное число, поэтому и расширенные таблицы ASCII-кодов презентованы множеством альтернатив. Так для русского языка имеется также несколько альтернатив, наиболее распространенные Windows-$1251$ и Koi8-r. Огромное количество вариантов кодировочных таблиц формирует определенные проблемы. К примеру, мы отправляем сообщение, представленное в одной кодировке, а адресат при этом пытается прочесть его в иной. В следствии на экране у него появляется непонятная абракадабра, что свидетельствует о том, что получателю для прочтения письма необходимо использовать другую кодировочную таблицу.

Кодирование цвета

Чтобы сохранить в двоичном коде фотографию, ее сперва условно делят на множество небольших цветных точек, именуемых пикселями. После разбивки на точки цвет каждого пикселя кодируется в бинарный код и записывается на запоминающем устройстве.

Но качество кодирования фото в бинарный код зависит не только от количества пикселей, но также и от их цветового многообразия. Алгоритмов записи цвета в двоичном коде имеется несколько. Наиболее популярным из них считается RGB. Эта аббревиатура – первые буквы названий 3-х ключевых цветов: красного – англ.Red, зеленого – англ. Green, синего – англ. Blue. Перемешивая эти 3 тона в разных пропорциях, можно получить любой иной цвет либо оттенок.

На этом и построен алгоритм RGB. Каждый пиксель записывается в двоичном коде путем указания количества красного, зеленого и синего цвета, участвующего в его создании. Чем больше битов выделяется для кодирования пикселя, тем больше вариантов смешивания этих 3-х каналов можно использовать и тем значительнее будет цветовая насыщенность изображения.

Цветовое разнообразие пикселей, из которых состоит изображение, именуется глубиной цвета

Кодирование графической информации

Считается, что глаз человека может отличать приблизительно $16$ миллионов оттенков цвета. Для формального описания цвета создали ряд цветовых моделей и соответствующих им методов кодирования.

Цветовая модель RGB

Название этой модели происходит от названий 3-х базовых цветов, применяемых в модели — Red, Green, Blue, а конкретнее их первых букв. Данная цветовая модель представляет метод получения цвета на экране монитора либо тв, т.е. устройства, содержащего электронно-лучевую трубку. Модель аддитивная (цвет получается при сложении точек 3-х базовых цветов, каждая своей яркости). Причем яркость любого базового цвета может принимать значения от $0$ до $255$, таким образом, модель дает возможность кодировать $2563$ либо $16,7$ млн. цветов. Эти тройки базовых цветов находятся весьма близко друг к другу, так, когда мы посмотрим на эти триады из светящихся точек, то любая тройка объединяется для нас в большую точку определенного цвета. Чем больше яркость цветной точки, тем большее количество данного цвета добавится к результирующей точке

Устройства ввода графических данных такие, как сканер, цифровая камера и пр. функционируют в данной модели. RGB-кодирование лучше всего может помочь описать цвет, излучаемый определенным устройством, к примеру, монитором. Если же мы посмотрим на изображение, отпечатанное на бумаге, ситуация абсолютно другая. Мы улавливаем не прямые лучи источника, которые попадают нам в глаза, а лучи, отраженные с поверхности. Белый свет, испускаемый некоторым источником и включающий волны всего видимого диапазона, поступает на бумагу с нанесенной на нее краской. Краска впитывает долю лучей, а остальные воспринимают наши глаза, это и есть тот цвет, что мы видим.

Описанная выше техника формирования изображений из мелких точек считается более популярной и именуется растровой. Однако помимо растровой графики, в пк применяется еще и векторная графика.

Векторные изображения формируются только при поддержке пк и создаются не из пикселей, а из графических примитивов.

Кодирование числовой информации

При кодировании чисел учитывается цель, с которой цифра была введена в систему. Любые сведения, кодируемые в двоичной системе, шифруются с помощью единиц и нолей. Данные символы еще именуют битами. Этот способ кодировки считается более распространенным, так как его проще организовать в технологическом плане: наличие сигнала – $1$, отсутствие – $0$. У двоичного шифрования имеется только единственный минус – длина комбинаций из символов. С технической точки зрения легче действовать с множеством обычных, однотипных компонентов, нежели с небольшим количеством более сложных.

Целые числа кодируются переводом чисел с одной системы счисления в иную. Для кодирования реальных чисел применяют $80$-разрядное кодирование.

Список использованных источников

Простейшие методы шифрования текста/ Д.М. Златопольский. – М.: Чистые пруды, 2007 – 32 с.

Информатика. Задачник-практикум в 2 т. / Под ред. И. Г. Семакина, Е. К. Хеннера: Том 1. – М.: Лаборатория Базовых Знаний, 2000. – 304 с.: ил.

https://spravochnick.ru/informatika/kodirovanie_informacii/#kodirovanie-videozapisi

https://topref.ru/referat/52478.html

Просмотров работы: 7957

Код для цитирования:

XII Международная студенческая научная конференция Студенческий научный форум - 2020

Методы кодирования информации

Студенческий научный форум - 2020
XII Международная студенческая научная конференция