Код - это комплект условных обозначений (либо сигналов) с целью записи (либо передачи) предварительно определенных конкретных понятий.
Кодирование информации – это процедура образования установленного представления данных. В узком смысле «кодирование» переключение с одной формы представления данных к иной, наиболее комфортной для хранения, передачи либо обработки.
Как правило любой образ при кодировании представляется отдельным символом.
Символ - это компонент конечного множества непохожих друг на друга компонентов.
Пк способен подвергать обработке лишь данные, представленные в числовой форме. Вся иная информация (к примеру, звуки, изображения и т. д.) для обработки в пк должна быть преобразована в числовую форму. К примеру, для того чтобы перевести в числовую форму музыкальный звук, необходимо через незначительные интервалы времени определять интенсивность звука на определенных частотах, представляя итоги каждого измерения в числовой форме. С помощью программ для пк возможно осуществить преобразования полученной данных, к примеру "наложить" друг на друга звуки с разных источников.
Подобным способом в пк возможно подвергать обработке текстовую информацию. При вводе в пк каждая буква кодируется конкретным числом, а при выводе на внешние устройства с целью восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.
Как мы знаем все без исключения числа в пк представляются с помощью нулей и единиц. Другими словами, пк как правило функционируют в двоичной системе счисления, так как при этом устройства для их обработки получаются наиболее элементарными. Ввод чисел в пк, а также вывод их с целью чтения человеком способен реализоваться в обычной десятичной форме, а все без исключения требуемые преобразования осуществляют программы, действующие в пк.
Двоичный код – это метод представления данных с помощью 2-ух знаков - $0$ также $1$.
Длина кода – число знаков, применяемых для представления кодируемой информации.
Бит - это одна двоичная цифра $0$ либо $1$. Одним битом возможно закодировать 2 значения: $1$ либо $0$. Двумя битами возможно закодировать 4 значения: $00$, $01$, $10$, $11$. Тремя битами кодируются $8$ различных значений. Добавление 1-го бита удваивает число значений, которое возможно закодировать.
Рисунок 1.
Виды кодирования информации
Различают кодирование информации следующих видов:
кодирование текстовой информации;
кодирование цвета;
кодирование графической информации;
кодирование числовой информации;
кодирование звуковой информации;
кодирование видеозаписи
Кодирование текстовой информации.
Каждый текст состоит из последовательности знаков. Знаками могут являться буквы, цифры, знаки препинания, знаки математических операций, круглые и квадратные скобки и т.д.
Текстовая информация, равно как также каждая иная, находится в памяти пк в двоичном виде. Для этого любому устанавливается в соответствии некоторое неотрицательное число, именуемое кодом знака, и это число вносится в память ЭВМ в двоичном виде. Конкретное соотношение между знаками и их кодами именуется системой кодировки. В пк как правило применяется система кодировки ASCII (American Standard Code for Informational Interchange – Американский стандартный код для информационного обмена).
Создатели программного обеспечения сформировали личные $8$-битные стандарты кодировки текста. За счет дополнительного бита диапазон кодирования в них был расширен до $256$ знаков. Чтобы не было путаницы, первые $128$ знаков в таких кодировках, как правило, отвечают стандарту ASCII. Остальные $128$ - реализуют региональные языковые характерные черты.
Восьмибитными кодировками, популярными в нашей стране, считаются KOI8, UTF8, Windows-1251 и некоторые прочие.
Больше всего кодированию подвергаются тексты, написанные на естественных языках (русском, немецком и др.).
Основные методы кодирования текстовой информации
Имеется ряд ключевых методов кодирования текстовых данных:
графический, в котором текстовая информация кодируется путем применения специальных рисунков либо символов;
символьный, в котором тексты кодируются с применением знаков того же алфавита, на котором написан исходник;
числовой, в котором текстовая информация кодируется с помощью чисел.
Процедура чтения текста представляет собой процесс, обратный его написанию, в результате которого рукописный текст преобразуется в устную речь. Чтение – это ничто иное, как декодирование письменного текста.
Стенография
Стенография — это один из методов кодирования текстовой информации с помощью специальных символов. Она представляет собой быстрый метод записи устной речи. Навыками стенографии могут обладать далеко не все, а только немногие специально обученные люди, которых называют стенографистами. Эти люди успевают записывать текст одновременно с речью выступающего лица, что, на наш взгляд, достаточно трудно. Но для них это не проблема, так как в стенограмме целое слово либо совокупность букв могут обозначаться одним символом. Скорость стенографического письма превышает скорость обыкновенного в $4-7$ раз. Расшифровать стенограмму способен только сам стенографист.
На рисунке представлен пример стенографии, в которой написано следущее: «Говорить умеют все люди на свете. Даже у самых примитивных племен есть речь. Язык — это нечто всеобщее и самое человеческое, что есть на свете»:
Рисунок 2.
Стенография дает возможность не только осуществлять синхронную запись устной речи, но и рационализировать технику письма.
Криптография
В некоторых случаях появляется необходимость засекречивания текста сообщения или документа, с целью того чтобы его не смогли прочитать те, кому не положено. Это называется защитой от несанкционированного доступа. В таком случае секретный текст шифруется. В старые времена шифрование называлось тайнописью.
Шифрование представляет собой процедура превращения открытого текста в зашифрованный, а дешифрование — процедура противоположного преобразования, при котором восстанавливается первоначальный текст.
Шифрование — это тоже кодирование, но с засекреченным способом, известным только источнику и адресату. Методами шифрования занимается наука криптография.
Криптография — это наука о способах и принципах передачи и приема зашифрованной с помощью специальных ключей информации. Ключ — секретная информация, используемая криптографическим алгоритмом при шифровании/расшифровке сообщений.
Числовое кодирование текстовой информации
В любом национальном языке существует свой алфавит, который состоит из определенного набора букв, следующих друг за другом, а значит и имеющих собственный порядковый номер.
Каждой букве сопоставляется целое положительное число, которое называют кодом символа. Именно данный код и будет хранить память компьютера, а при выводе на экран или бумагу преобразовывать в соответствующий ему символ. Кроме кодов самих символов в памяти пк находится также сведения о том, какие именно данные закодированы в конкретной области памяти. Это необходимо для различия представленной информации в памяти пк.
Используя соответствия букв алфавита с их числовыми кодами, возможно сформировать специальные таблицы кодирования. Иначе можно отметить, что символы конкретного алфавита имеют свои числовые коды в соответствии с конкретной таблицей кодирования.
Как мы знаем национальных алфавитов колоссальное число, поэтому и расширенные таблицы ASCII-кодов презентованы множеством альтернатив. Так для русского языка имеется также несколько альтернатив, наиболее распространенные Windows-$1251$ и Koi8-r. Огромное количество вариантов кодировочных таблиц формирует определенные проблемы. К примеру, мы отправляем сообщение, представленное в одной кодировке, а адресат при этом пытается прочесть его в иной. В следствии на экране у него появляется непонятная абракадабра, что свидетельствует о том, что получателю для прочтения письма необходимо использовать другую кодировочную таблицу.
Кодирование цвета
Чтобы сохранить в двоичном коде фотографию, ее сперва условно делят на множество небольших цветных точек, именуемых пикселями. После разбивки на точки цвет каждого пикселя кодируется в бинарный код и записывается на запоминающем устройстве.
Но качество кодирования фото в бинарный код зависит не только от количества пикселей, но также и от их цветового многообразия. Алгоритмов записи цвета в двоичном коде имеется несколько. Наиболее популярным из них считается RGB. Эта аббревиатура – первые буквы названий 3-х ключевых цветов: красного – англ.Red, зеленого – англ. Green, синего – англ. Blue. Перемешивая эти 3 тона в разных пропорциях, можно получить любой иной цвет либо оттенок.
На этом и построен алгоритм RGB. Каждый пиксель записывается в двоичном коде путем указания количества красного, зеленого и синего цвета, участвующего в его создании. Чем больше битов выделяется для кодирования пикселя, тем больше вариантов смешивания этих 3-х каналов можно использовать и тем значительнее будет цветовая насыщенность изображения.
Цветовое разнообразие пикселей, из которых состоит изображение, именуется глубиной цвета
Кодирование графической информации
Считается, что глаз человека может отличать приблизительно $16$ миллионов оттенков цвета. Для формального описания цвета создали ряд цветовых моделей и соответствующих им методов кодирования.
Цветовая модель RGB
Название этой модели происходит от названий 3-х базовых цветов, применяемых в модели — Red, Green, Blue, а конкретнее их первых букв. Данная цветовая модель представляет метод получения цвета на экране монитора либо тв, т.е. устройства, содержащего электронно-лучевую трубку. Модель аддитивная (цвет получается при сложении точек 3-х базовых цветов, каждая своей яркости). Причем яркость любого базового цвета может принимать значения от $0$ до $255$, таким образом, модель дает возможность кодировать $2563$ либо $16,7$ млн. цветов. Эти тройки базовых цветов находятся весьма близко друг к другу, так, когда мы посмотрим на эти триады из светящихся точек, то любая тройка объединяется для нас в большую точку определенного цвета. Чем больше яркость цветной точки, тем большее количество данного цвета добавится к результирующей точке
Устройства ввода графических данных такие, как сканер, цифровая камера и пр. функционируют в данной модели. RGB-кодирование лучше всего может помочь описать цвет, излучаемый определенным устройством, к примеру, монитором. Если же мы посмотрим на изображение, отпечатанное на бумаге, ситуация абсолютно другая. Мы улавливаем не прямые лучи источника, которые попадают нам в глаза, а лучи, отраженные с поверхности. Белый свет, испускаемый некоторым источником и включающий волны всего видимого диапазона, поступает на бумагу с нанесенной на нее краской. Краска впитывает долю лучей, а остальные воспринимают наши глаза, это и есть тот цвет, что мы видим.
Описанная выше техника формирования изображений из мелких точек считается более популярной и именуется растровой. Однако помимо растровой графики, в пк применяется еще и векторная графика.
Векторные изображения формируются только при поддержке пк и создаются не из пикселей, а из графических примитивов.
Кодирование числовой информации
При кодировании чисел учитывается цель, с которой цифра была введена в систему. Любые сведения, кодируемые в двоичной системе, шифруются с помощью единиц и нолей. Данные символы еще именуют битами. Этот способ кодировки считается более распространенным, так как его проще организовать в технологическом плане: наличие сигнала – $1$, отсутствие – $0$. У двоичного шифрования имеется только единственный минус – длина комбинаций из символов. С технической точки зрения легче действовать с множеством обычных, однотипных компонентов, нежели с небольшим количеством более сложных.
Целые числа кодируются переводом чисел с одной системы счисления в иную. Для кодирования реальных чисел применяют $80$-разрядное кодирование.
Список использованных источников
Простейшие методы шифрования текста/ Д.М. Златопольский. – М.: Чистые пруды, 2007 – 32 с.
Информатика. Задачник-практикум в 2 т. / Под ред. И. Г. Семакина, Е. К. Хеннера: Том 1. – М.: Лаборатория Базовых Знаний, 2000. – 304 с.: ил.
https://spravochnick.ru/informatika/kodirovanie_informacii/#kodirovanie-videozapisi
https://topref.ru/referat/52478.html