Почему пдф отображает странные символы

PDF Квадраты и символы при копировании

Как-то раз мне на стол принесли PDF-файл с просьбой скопировать содержимое текста, мол сами не могут т.к. при копировании текст превращается в квадраты, крякозяблы и странные символы. «Кодировка, защита или недостающие шрифты», подумал я, это ж легко. Однако пережимы pdf, снятие защиты через онлайн сервисы и прочие простые решения не помогли. При копировании со всех созданных вариантов данного pdf имеем такую картину:

p, blockquote 1,0,1,0,0 —>

Поиски решения

Открываем PDF в программе Acrobat reader, скачать его можно по ссылке идем в редактирование — защита — параметры защиты. Самой защиты на моем PDF не оказалось, однако на вкладке Шрифты указаны отсутствующие у меня на компе шрифты с заказной кодировкой. Скорее всего дело в этом, можно погуглив найти и установить недостающий шрифт, однако в моем случае такое решение не прокатит. Шрифт MSTT31c, кодировка — заказная.

p, blockquote 2,0,0,0,0 —>

Быстрое решение

Дабы особо не ломать голову, выбираем самое простое решение. Мы попросту разобьем данный PDF на JPEG файлы и заново пересоберем, используя Pdf 24 Creator или его аналоги. (см. Конвертация PDF в JPEG и обратно).

p, blockquote 3,1,0,0,0 —>

Открываем программу — тыкаем Pdf конструктор, ищем наш файл и перетаскиваем в правую часть окна и тыкаем сохранить. В появившемся окне жмем «Настраиваемый» и выбираем Jpeg. DPI оставляйте как есть и жмите продолжить. Вам предложат путь куда вы сохраните весь ваш файл в виде изображений.

Не закрывая программу идем в папку куда сохранили изображения и перетаскиваем их на правую часть. Сохраняем как PDF, получаем слепленный из изображений файл, с которого пока что нельзя копировать ничего. Осталось чуть-чуть.

p, blockquote 5,0,0,0,0 —>

Снова открываем программу, на этот раз жмем Recognize text, выбираем язык документа, желаемое качество, жмем Add files и выбираем созданный на прошлом шаге файл. И всё, жмем Start, по завершению из нашего PDF можно с легкостью копировать текст. Надеюсь помог =)

Pdf вместо букв квадратики

Действительно, иногда при открытии какой-нибудь интернет-странички вместо текста показываются различные "крякозабры" (как я их называю), и прочитать это нереально.

Происходит это из-за того, что текст на страничке написан в одной кодировке (более подробно об этом можете узнать из Википедии), а браузер пытается его открыть в другой. Из-за такого рассогласования, вместо текста – непонятный набор символов.

Попробуем исправить это.

Исправляем иероглифы на текст

Браузер

Вообще, раньше Internet Explorer часто выдавал подобные крякозабры, современные же браузеры (Chrome, Яндекс-браузер, Opera, Firefox) – довольно неплохо определяет кодировку, и ошибаются очень редко. Скажу даже больше, в некоторых версиях браузера уже убрали выбор кодировки, и для "ручной" настройки этого параметра нужно скачивать дополнения, или лезть в дебри настроек за 10-ток галочек.

И так, предположим браузер неправильно определили кодировку и вы увидели следующее (как на скрине ниже).

Неправильно выбранная кодировка

Чаще всего путаница бывает между кодировками UTF (Юникод) и Windows-1251 (большинство русскоязычных сайтов выполнены в этих кодировках).

Поэтому, я рекомендую в ручном режиме попробовать их обе. Например, чтобы это сделать в браузере Firefox, нужно:

  1. нажать левый ALT – чтобы сверху показалось меню. Нажать меню "Вид";
  2. выбрать пункт "Кодировка текста" , далее выбрать Юникод . Вуаля – иероглифы на странички сразу же стали обычным текстом (скрин ниже)!

Смена кодировки в Firefox

Еще один совет : если в браузере не можете найти, как сменить кодировку (а дать инструкцию для каждого браузера – вообще нереально!), я рекомендую попробовать открыть страничку в другом браузере. Очень часто другая программа открывает страницу так, как нужно.

Текстовые документы

Очень много вопросов по крякозабрам задаются при открытии каких-нибудь текстовых документов. Особенно старых, например при чтении Readme в какой-нибудь программе прошлого века (например, к играм).

Разумеется, что многие современные блокноты просто не могут прочитать DOS’овскую кодировку, которая использовалась ранее. Чтобы решить сию проблему, рекомендую использовать редактор Bread 3.

Простой и удобный текстовый блокнот. Незаменимая вещь, когда нужно работать со старыми текстовыми файлами. Bred 3 за один клик мышкой позволяет менять кодировку и делать не читаемый текст читаемым! Поддерживает кроме текстовых файлов довольно большое разнообразие документов. В общем, рекомендую!

Попробуйте открыть в Bred 3 свой текстовый документ (с которым наблюдаются проблемы). Пример показан у меня на скрине ниже.

Иероглифы при открытии текстового документа

Далее в Bred 3 есть кнопка для смены кодировки: просто попробуйте поменять ANSI на OEM – и старый текстовый файл станет читаемым за 1 сек.!

Исправление иероглифов на текст

Для работы с текстовыми файлами различных кодировок так же подойдет еще один блокнот – Notepad++. Вообще, конечно, он больше подходит для программирования, т.к. поддерживает различные подсветки, для более удобного чтения кода.

Надежный, удобный, поддерживающий громадное число форматов файлов блокнот. Позволяет легко и быстро переключать различные кодировки.

Пример смены кодировки показан ниже: чтобы прочитать текст, достаточно в примере ниже, достаточно было сменить кодировку ANSI на UTF-8.

Смена кодировки в блокноте Notepad++

WORD’овские документы

Очень часто проблема с крякозабрами в Word связана с тем, что путают два формата Doc и Docx . Дело в том, что с 2007 Word (если не ошибаюсь) появился формат Docx (позволяет более сильнее сжимать документ, чем Doc, да и надежнее защищает его).

Так вот, если у вас старый Word, который не поддерживает этот формат – то вы, при открытии документа в Docx, увидите иероглифы и ничего более.

  1. скачать на сайте Microsoft спец. дополнение, которое позволяет открывать в старом Word новые документы. Только из личного опыта могу сказать, что открываются далеко не все документы, к тому же сильно страдает разметка документа (что в некоторых случаях очень критично);
  2. использовать аналоги Word (правда, тоже разметка в документе будет страдать);
  3. обновить Word до современной версии.

Так же при открытии любого документа в Word (в кодировке которого он "сомневается"), он на выбор предлагает вам самостоятельно указать оную. Пример показан на рисунке ниже, попробуйте выбрать:

Переключение кодировки в Word при открытии документа

Окна в различных приложениях Windows

Бывает такое, что какое-нибудь окно или меню в программе показывается с иероглифами (разумеется, прочитать что-то или разобрать – нереально).

Могу дать несколько рекомендаций:

  1. Руссификатор. Довольно часто официальной поддержки русского языка в программе нет, но многие умельца делают руссификаторы. Скорее всего, на вашей системе – данный руссификатор работать отказался. Поэтому, совет простой: попробовать поставить другой;
  2. Переключение языка. Многие программы можно использовать и без русского, переключив в настройках язык на английский. Ну в самом деле: зачем вам в какой-то утилите, вместо кнопки "Start" перевод "начать"?
  3. Если у вас раньше текст отображался нормально, а щас нет – попробуйте восстановить Windows, если, конечно, у вас есть точки восстановления (подробно об этом здесь – ;
  4. Проверить настройки языков и региональных стандартов в Windows, часто причина кроется именно в них.

Языки и региональные стандарты в Windows

Чтобы открыть меню настроек:

intl.cpl – язык и регион. стандарты

Проверьте чтобы во вкладке "Форматы" стояло "Русский (Россия) // Использовать язык интерфейса Windows (рекомендуется)" (пример на скрине ниже).

Формат – русский // Россия

Во вкладке местоположение поставьте расположение Россия.

И во вкладке дополнительно установите язык системы на "Русский (Россия)". После этого сохраните настройки и перезагрузите ПК. Затем вновь проверьте, нормально ли отображается интерфейс нужной программы.

Текущий язык программ

PS

И напоследок, наверное, для многих это очевидно, и все же некоторые открывают определенные файлы в программах, которые не предназначены для этого: к примеру в обычном блокноте пытаются прочитать файл DOCX или PDF. Естественно, в этом случае вы вместо текста будут наблюдать за крякозабрами, используйте те программы, которые предназначены для данного типа файла (WORD 2007+ и Adobe Reader для примера выше).

Иногда после установки на компьютере некоторых приложений, их "русификации", обновления и т.д., в определенных окнах этих приложений, а также в окнах самой операционной системы, неправильно отображаются шрифты.

Как правило, это не сказывается на стабильности работы компьютера, однако создает кучу неудобств пользователям, поскольку в окнах вместо букв отображаются иероглифы, квадратики, цифры и прочие непонятные символы.

Зачастую работать на таком компьютере становится просто невозможно. Значительная часть пользователей решают проблему радикально – переустанавливают Windows. Хотя из сложившейся ситуации можно выйти гораздо проще.

Предложенный автором способ помогает не всегда, но в значительной части случаев он решает проблему.

Важно. Способ предусматривает внесение изменений в реестр Windows. Системный реестр — очень важный элемент операционной системы. Поэтому кроме указанных ниже параметров ничего в нем не изменяйте, если только Вы не уверены в правильности своих действий.

Решение проблемы

В реестре Windows нужно открыть ветку HKEY_LOCAL_MACHINESYSTEMCurrentControlSetControlNlsCodePage , найти в ней параметры " 1250 ", " 1252 " и " 1253 " и установить для каждого из них значение "c_1251.nls".

Сделать это можно несколькими способами:

Способ 1

1) открыть "Редактор реестра".

Для этого нужно нажать на клавиатуре кнопку "Windows" (обычно с изображением логотипа Windows, находится в нижнем ряду, слева, между кнопками Ctrl и Alt) и, удерживая ее, нажать кнопку "R" (в русской раскладке "К"). Появится окно запуска программ. В нем нужно написать regedit и нажать кнопку "ОК";

2) последовательно открывая соответствующие папки в левой части "Редактора реестра", зайти в ветку HKEY_LOCAL_MACHINESYSTEMCurrentControlSetControlNlsCodePage. Это значит, что нужно открыть сначала папку "HKEY_LOCAL_MACHINE", в ней открыть папку "SYSTEM", в ней – "CurrentControlSet" и т.д.;

3) когда доберетесь до раздела "CodePage" и выделите его в левой части "Редактора реестра", в его правой части появится довольно большой список параметров. Нужно отыскать среди них параметры "1250", "1252" и "1253".

4) дважды щелкнуть мышкой по параметру "1250". Откроется окно "Изменение строкового параметра". В нем содержание поля "Значение" нужно изменить на "c_1251.nls" и нажать кнопку "ОК" (см.рис.).

Затем аналогичным образом изменить на "c_1251.nls" значение параметров "1252" и "1253".

5) закрыть окно редактора реестра и перезагрузить компьютер. После перезагрузки проблема с неправильным отображением шрифтов должна исчезнуть.

Способ 2

Все указанные выше изменения в системный реестр можно внести немного проще, используя соответствующий REG-файл.

REG-файлы (их часто называют твиками реестра) – это такие специальные файлы, при открытии которых все предусмотренные в них изменения вносятся в реестр автоматически. Вам остается только подтвердить эти изменения и перезагрузить компьютер.

Открывать REG-файлы необходимо от имени администратора компьютера.

Подробнее об этом читайте здесь.

Чтобы получить архив с REG-файлом, осуществляющим описанные выше действия, нажмите сюда.

Иногда после установки на компьютере некоторых приложений, их "русификации", обновления и т.д., в определенных окнах этих приложений, а также в окнах самой операционной системы, неправильно отображаются шрифты.

Как правило, это не сказывается на стабильности работы компьютера, однако создает кучу неудобств пользователям, поскольку в окнах вместо букв отображаются иероглифы, квадратики, цифры и прочие непонятные символы.

Зачастую работать на таком компьютере становится просто невозможно. Значительная часть пользователей решают проблему радикально – переустанавливают Windows. Хотя из сложившейся ситуации можно выйти гораздо проще.

Предложенный автором способ помогает не всегда, но в значительной части случаев он решает проблему.

Важно. Способ предусматривает внесение изменений в реестр Windows. Системный реестр — очень важный элемент операционной системы. Поэтому кроме указанных ниже параметров ничего в нем не изменяйте, если только Вы не уверены в правильности своих действий.

Решение проблемы

В реестре Windows нужно открыть ветку HKEY_LOCAL_MACHINESYSTEMCurrentControlSetControlNlsCodePage , найти в ней параметры " 1250 ", " 1252 " и " 1253 " и установить для каждого из них значение "c_1251.nls".

Сделать это можно несколькими способами:

Способ 1

1) открыть "Редактор реестра".

Для этого нужно нажать на клавиатуре кнопку "Windows" (обычно с изображением логотипа Windows, находится в нижнем ряду, слева, между кнопками Ctrl и Alt) и, удерживая ее, нажать кнопку "R" (в русской раскладке "К"). Появится окно запуска программ. В нем нужно написать regedit и нажать кнопку "ОК";

2) последовательно открывая соответствующие папки в левой части "Редактора реестра", зайти в ветку HKEY_LOCAL_MACHINESYSTEMCurrentControlSetControlNlsCodePage. Это значит, что нужно открыть сначала папку "HKEY_LOCAL_MACHINE", в ней открыть папку "SYSTEM", в ней – "CurrentControlSet" и т.д.;

3) когда доберетесь до раздела "CodePage" и выделите его в левой части "Редактора реестра", в его правой части появится довольно большой список параметров. Нужно отыскать среди них параметры "1250", "1252" и "1253".

4) дважды щелкнуть мышкой по параметру "1250". Откроется окно "Изменение строкового параметра". В нем содержание поля "Значение" нужно изменить на "c_1251.nls" и нажать кнопку "ОК" (см.рис.).

Затем аналогичным образом изменить на "c_1251.nls" значение параметров "1252" и "1253".

5) закрыть окно редактора реестра и перезагрузить компьютер. После перезагрузки проблема с неправильным отображением шрифтов должна исчезнуть.

Способ 2

Все указанные выше изменения в системный реестр можно внести немного проще, используя соответствующий REG-файл.

REG-файлы (их часто называют твиками реестра) – это такие специальные файлы, при открытии которых все предусмотренные в них изменения вносятся в реестр автоматически. Вам остается только подтвердить эти изменения и перезагрузить компьютер.

Открывать REG-файлы необходимо от имени администратора компьютера.

Подробнее об этом читайте здесь.

Чтобы получить архив с REG-файлом, осуществляющим описанные выше действия, нажмите сюда.

[Acr DC] Знаки и символы вместо текста

Ситуация следующая. Есть документ pdf, в котором не работает поиск по тексту. Посмотрел встроенные шрифты — пусто (см. img005). По виду это Times New Roman. При обычном копировании (из Acr DC) текст представляет из себя бессвязный набор символов — стрелки, цифры, значки и т.п. При копировании "с форматированием" текст становится текстом (см. img004). Это сам файл стр31, выложенный на файлообменник. Всю книгу выложить не могу, так как правилами вузовской библиотеки это делать запрещено. Мне разрешили скопировать на носитель только одну страницу, чтобы показать специалистам. Такие электронные книги не часто, но попадаются, но никто не знает, в чем дело именно в этом случае. На мой взгляд — не встроены шрифты, раз их нет в разделе "шрифты". Но тогда непонятно, как программа копирует текст и вставляет их в Word или Блокнот в читаемом виде. Да, ситуация не самая безнадежная, но когда время поджимает, без поиска сложно быстро ориентироваться по тексту. Я не сотрудник библиотеки, студент-заочник, спрашивал их, обращались ли к поставщику (вуз и библиотека платят деньги за электронные книги), они сказали что обращались, но внятного ответа не получили, а так как таких книг некритическое количество в общей массе, то настаивать не стали. Есть ли решение этой ситуации? И можно ли что-то делать с такими книгами, не нарушая законодательство об авторских правах, я имею в виду использование гипотетического способа исправления документа, когда начинает работать поиск по тексту.

Текст выводится на печать или отображается некорректно

Текст должным образом не отображается или не выводится на печать после преобразования или объединения документов PDF в Acrobat 9.

  • Текст выглядит размытым, или буквы и символы накладываются друг на друга.
  • Текст зашифрован, искажен или отображается как набор нечитаемых символов.
  • Текст в некоторых местах отображается с нижним индексом.
  • Текст не печатается должным образом.

Решение. Встройте шрифты, чтобы избежать подстановки

Встраивание делает ненужной подстановку шрифта при просмотре или печати файла, поэтому пользователь видит текст, отображаемый в первоначальном шрифте.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *