Что такое кодировка?
Что такое кодировка?

Что такое кодировка? Не все люди знают ответ на данный вопрос. Некоторые, вроде бы понимают, что кириллица — это «windows-1251» («CP1251»), а Unicode — это «UTF-8». А что такое кодировка, так и не понимают.
И целью данной статьи является рассказать о том, что это такое.


Итак, кодировка — таблица, в которой описывается соответствие определённого символа и числа. То есть любой символ, который мы видим или вводим, для компьютера в реальности — всего лишь набор битов (набор нулей и единиц). Именно эти биты и перегоняются от устройства к устройству. А чтобы показать результат этих перегонок человеку, компьютер преобразует с помощью таблицы (той самой кодировки) код символа в соответствующий внешний вид.

Но языков существует огромное множество, часто у них совершенно разный набор символов. Именно по этой причине и возникают трудности с кодировкой. Вы набирали текст, допустим, на русском языке. А компьютер решил, что этот текст написан на китайском. Разумеется, он используют китайскую кодировку, а не кириллическую. В итоге идет неправильное преобразование символов, и мы видим кракозябры.

Кодировок же существует большое количество, и задача вебмастера состоит в правильном выборе кодировки и указания ее напрямую. Не следует надеяться на сервер, браузер, пользователя или еще на кого-то в этом вопросе.

Наверняка, у Вас возникла мысль о том, чтобы объединить все эти кодировки в одну, чтобы была универсальность. Мысли правильные, и это уже сделали, так родилась кодировка UTF-8 — самая популярная во всём мире. Она и является той самой универсальной кодировкой. Поэтому большинство CMS (Joomla, WordPress, Drupal) делают в кодировке UTF-8, так как CMS должна работать при любой национальной кодировке.

И последнее, при создании сайта обязательно задайтесь вопросом на каких языках он будет. Если Вы точно знаете, что там будет не только русский и латинский алфавит, то используйте UTF-8. В противном случае, оставляю выбор за Вами.