Вопрос индексации поисковиками файлов в формате PDF интересует многих создателей сайтов. Индексируются ли PDF-файлы? А если индексируются, то какие и как это влияет на ранжирование сайта в поисковых системах?

Со ссылкой на информацию с Яндекс.Вебмастер, можно утверждать, что файлы PDF индексируются. Да и результаты поиска выдают их на страницах. И здесь возникает определенная проблема. Если сайт является коммерческим (продающим товары или услуги), то лучшим вариантом для информирования клиента является каталог производителя этих товаров. Наиболее часто такие каталоги размещены на сайте производителя в формате PDF. В то же время, размещение такого файла поисковая система может принять за плагиат и, соответственно, понизить сайт в ранжировании.

Какой выход?

Можно не размещать каталог производителя. Но тогда возможен отток клиентов с сайта из-за недостаточной информативности. Можно поместить каталог в том виде, в котором он находится на сайте производителя. Или разместить на него ссылку. Но тогда возможно понижение рейтинга сайта. Решением такой проблемы может быть размещение на своем сайте такого каталога в виде графического PDF-файла с заполнением всех метаданных: название, тема, ключевые слова. Следует учесть, что содержимое PDF-файла индексируется только в том случае, если оно содержит внедренный или связанный текст. Графика не индексируется. Преобразование PDF-файла, содержащего текст, в графический тип очень удобно делать с помощью программы PDF-XChange Viewer. Отличить файл со шрифтами от графического PDF-файла можно по наличию возможности выделения мышкой текста. Если выделяется, то файл содержит внедренный или связанный текст и его надо преобразовывать. Если текст невозможно выделить мышкой, значит это графический PDF-файл и его можно размещать на своем сайте, как есть.

Как создать графический PDF-файл?

Сначала экспортируем файл, содержащий текст, в графический тип, например в формат DCX. Затем преобразуем полученный графический DCX-файл в формат PDF и заполняем метаданные(наименование, тему, ключевые слова). Все. При этом может несколько уменьшиться качество изображения и увеличиться размер. Для достижения нужного результата желательно поэкспериментировать с различными настройками. А затем выбрать для себя наиболее подходящие из них. Можно, вообще, преобразовать цветной PDF-файл в черно-белый. Вариантов много. Для снятия пароля с PDF-файла (при его наличии) также существуют специальные программы.
При проведении такого рода преобразований, возможно возникновение претензий со стороны производителя по вопросу авторского права. Хотя вопрос этот достаточно сложный. С одной стороны, коммерческий сайт посредника размещает документ производителя. С другой стороны, этот документ для того и размещается, чтобы увеличить продажи товара. Так что, размещение каталога производителя на сайте продавца его товара должно быть выгодно обеим сторонам.
Вышеуказанная информация об индексации PDF-файлов не является «истиной в последней инстанции». Работа алгоритма поисковиков не является общедоступной. Но обратить внимание на нее следует. Особенно, если непонятна задержка в повышении рейтинга сайта при качественном контенте и наличии хорошей ссылочной массы.