Кодировка данных — это процесс преобразования информации (символов, чисел, звуков, изображений и других типов данных) в форму, удобную для передачи, хранения и последующей интерпретации компьютером или устройством. Главная задача кодировки — представить данные в таком виде, чтобы они были понятны машине и позволяли восстановить исходную информацию без потерь.
Компьютеры понимают лишь двоичный код (биты — нули и единицы), поэтому вся вводимая нами информация должна быть представлена в бинарном виде. Если мы хотим передать символ 'A', компьютер воспринимает его как последовательность битов, соответствующую этому символу согласно выбранной кодировке.
Одна из первых универсальных кодировок символов. Используется для представления латинских букв, цифр и знаков пунктуации. Каждый символ представлен одним байтом (8 бит), что позволяет закодировать максимум 256 символов. Однако эта кодировка не способна представлять символы национальных алфавитов, таких как русский.
Современная кодировка, разработанная для поддержки практически всех письменных языков мира. Наиболее известные варианты Unicode:
Для русского языка использовались специфические кодировки:
Форматы JPEG, PNG, MP3, AVI и другие представляют собой специализированные способы кодирования графики, музыки и видео в цифровом виде.
При передаче данных или открытии файла в неверной кодировке символы могут отображаться некорректно (например, появляются квадратики или непонятные знаки). Это часто связано с отсутствием правильной установки нужной кодировки в программе просмотра или браузере.