|
КОДИРОВАНИЕ |
|
Для обмена информацией с другими людьми человек использует естественные языки. Наряду с естественными языками были разработаны формальные языки для профессионального применения их в какой-либо сфере. Представление информации с помощью какого-либо языка часто называют кодированием.
Код — набор символов (условных обозначений) для представления информации.
Код — система условных знаков (символов) для передачи, обработки и хранения информации(сообщения).
Кодирование — процесс формирования определенного представления информации. В более узком смысле под термином "кодирование" часто понимают перехол от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.
Декодирование - процесс обратного преобразования кода к исходной символьной системе, т.е. получение исходного сообщения. Например: перевод с азбуки Морзе в письменный текст на русском языке.
В более широком смысле декодирование — это процесс восстановления содержания закодированного сообщения. При таком подходе процесс записи текста с помощью русского алфавита можно рассматривать в качестве кодирования, а его чтение — это декодирование.
Для кодирования одной и той же информации могут быть использованы разные способы, их выбор зависит от цели кодирования: сокращение записи, засекречивание, удобство обработки и т.д., от условий, от имеющихся средств.
Если надо записать текст в темпе речи — используем стенографию; если надо передать текст за границу — используем английский алфавит; если надо представить текст в виде, понятном для грамотного русского человека, — записываем его по правилам грамматики русского языка.
Чаще всего кодированию подвергаются тексты на естественном языке. существует три способа кодирования текста:
1. графический - с помощью специальных рисунков или значков;
2. числовой - с помощью чисел;
3. символьный - с помощью символов какого-либо адфавита.
Выбор способа кодирования информации может быть связан с предполагаемым способом ее обработки.
Рассмотрим пример представления чисел — количественной информации. Используя русский алфавит, можно записать число "тридцать пять". Используя же алфавит арабской десятичной системы счисления, пишем «35». Второй способ не только короче первого, но и удобнее для выполнения вычислений. Какая запись удобнее для выполнения расчетов: "тридцать пять умножить на сто двадцать семь" или "35 х 127"? Очевидно — вторая.
Множество символов, используемое для кодирования, называется алфавитом или азбукой.
Шифрование сообщения
В некоторых случаях возникает потребность засекречивания текста сообщения или документа, для того чтобы его не смогли прочитать те, кому не положено. Это называется защитой от несанкционированного доступа. В таком случае секретный текст шифруется. В давние времена шифрование называлось тайнописью.
Шифрование представляет собой процесс превращения открытого текста в зашифрованный, а дешифрование —процесс обратного преобразования, при котором восстанавливается исходный текст.
Шифрование — это тоже кодирование, но засекреченным методом, известным только источнику и адресату. Методами шифрования занимается наука под названием криптография.
Аналоговая и дискретная форма представления информации
Человек способен воспринимать и хранить информацию в форме образов (зрительных, звуковых, осязательных, вкусовых и обонятельных). Зрительные образы могут быть сохранены в виде изображений (рисунков, фотографий и так далее), а звуковые — зафиксированы на пластинках, магнитных лентах, лазерных дисках и так далее. Такая форма представления информации называется аналоговой.
Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.
Двоичное кодирование в компьютере
Вся информация, которую обрабатывает компьютер должна быть представлена в дискретной форме двоичным кодом с помощью двух цифр: 0 и 1. Эти два символа принято называть двоичными цифрами или битами.
С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.
Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.
Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.
С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:
0 – отсутствие электрического сигнала;
1 – наличие электрического сигнала.
Эти состояния легко различать. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим количеством простых элементов, чем с небольшим числом сложных.
Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.
Хотелось бы обратить внимание на один важный момент:
Возьмем какой-либо двоичный код, например 1000 11002. Если обратиться к кодовой таблице, то можно утверждать, что это код буквы “М”. С другой стороны, можно сказать, что этим кодом задается цвет одного из пикселов монохромного изображения. Наконец, если воспользоваться правилами перевода из двоичной системы в десятичную, то можно утверждать, что это код числа +14010 (в другой интерпретации это код числа –12010). Что же это на самом деле? Интерпретация, то есть истолкование смысла одного и того же машинного кода, может быть самой разной. Один и тот же код разными программами может рассматриваться и как число, и как текст, и как изображение, и как звук. Другими словами, как именно трактуется тот или иной машинный код, определяется обрабатывающей этот код программой. |
|
| |