узнать кодировкуСейчас, я хотел бы поговорить о том, как узнать кодировку того или иного файла. Но сначала нужно определиться что такое кодировка 🙂

   Посмотрите на клавиатуру. Как вы можете заметить, на ней расположено довольно много клавиш. И только несколько десятков из них выделено под буквы. Причем в работе нам довольно часто нужны как буквы латинского алфавита, так и нашего, кириллического.

   Но компьютер оперирует только цифрами, причем исключительно двоичной системой счисления – есть сигнал – единица, нет сигнала – ноль, и как таковые, буквы не понимает. Для оперирования компьютера алфавитом выделен специальный диапазон в 255 единиц. А, как вам известно, кроме латинского алфавита, существует большое количество национальных, и все их вместить в 255 значений, выделенных для этих целей, просто нереально. Вот для того, чтобы компьютер мог оперировать не только с базовым латинским алфавитом, и было создано большое количество различных кодировок текстов.

      Бывает иногда, и довольно часто, что вы открываете документ, который, по идее, написан на обычном русском языке. А на экране появляется не текст, а какие-то непонятные крякозябры или бнопня, как  ее еще называют. Все просто, просто нужно открыть документ в нужной кодировке, и тогда он будет отображаться на экране корректно и правильно.

   Что же такое кодировка? Это таблица, где каждой букве алфавита, а кроме этого — цифрам и специальным символам, присвоен некий уникальный номер — код символа.

Сколько существует кодировок.

   Кодировок весьма много, но есть основные, то есть используемые пользователями и программным обеспечением часто, а есть специфические, о многих из которых мы и не слышали.

   Началось все это с того времени, как корпорация Microsoft стремительно ворвалась в компьютерную сферу вначале с операционной системой DOS, а затем и Windows. Дело в том, что, вместо того, чтобы воспользоваться уже готовыми стандартами, данная корпорация создала новую кодировку под названием codepage 866. Основное ее отличие от уже существовавших в то время – это то, что она поддерживала создание вокруг текста так называемой псевдографики.

   От корпорации Apple и ОС Макинтош нам досталась кодировка МАС. От Windows — Win-1251. И, наконец, от организации по стандартам ISO нам досталась кодировка ISO-8859-5.

   Как видим, кодировок, позволяющих отображать кириллицу, существует довольно много, а единого стандарта до сих пор, к большому сожалению, нет.

   Вот для того, чтобы особо не мучиться с кодировками, и не подыскивать вручную, в какой же из них был создан тот или иной файл, и существуют программы-перекодировщики.

Программы-перекодировщики.

   В основном крякозябры появляются либо при работе в Интернете, либо при чтении электронной почты. А есть ли в браузерах и почтовиках встроенные средства для перекодирования страниц и сообщений с целью их нормального отображения? Оказывается, есть.

   В браузерах возможность перекодирования открытой страницы спрятана в меню Вид – Кодировка. Если щелкнуть на какую-либо другую, более подходящую по вашему мнению кодировку, или выставить ее автоопределение, то, скорее всего, текст отобразится в требующемся виде.

В почтовиках, например, в Outlook Express, данная возможность скрывается там же: в меню Вид – Кодировка.

   Если же данные ухищрения не помогают, то есть утилиты, которые проводят тщательный анализ из всего имеющегося в их распоряжении арсенала кодировок и выводят наиболее подходящий вариант.

   Самой популярной является программа под названием Штирлиц. Она бесплатна, хотя при ее запуске и появляется ненадолго рекламный баннер, но стерпеть это вполне можно.

Есть и еще утилиты, но они не столь популярны.

Так что, как мы видим, узнать кодировку текста довольно легко.