Поисковые системы помимо html-файлов также индексируют файлы альтернативных форматов: PDF, DOC (DOCX), XLS (XLSX). Ежедневно люди ищут различные документы, которые обычно хранятся в вышеперечисленных форматах.Например, шаблоны каких-либо заявлений, различные протоколы, отчеты, руководства, инструкции по применению и так далее.
Публикуя на своем сайте файлы в форматах PDF, DOC (DOCX) или XLS (XLSX), вы наверняка рассчитываете на то, что пользователи будут использовать их. Но согласитесь, что было бы неплохо, если бы ваши файлы также участвовали в результатах поиска и приносили дополнительный трафик. Для того, чтобы это было возможным, документы в вышеназванных форматах, как и html-странички, рекомендуется должным образом оптимизировать.
Ниже приведены базовые принципы по оптимизации файлов альтернативных форматов.
Имя файла для PDF документа напрямую связано с адресом страницы, так как название, как правило, включается непосредственно в url. Поэтому рекомендуется при составлении имени файла руководствоваться принципами формирования ЧПУ (человекоподобного урла):
Файлы в формате PDF аналогично html-страницам имеют title и description. Для того, чтобы повысить авторитетность ресурсов для поисковых систем, рекомендуется заполнять данные поля, которые находятся по следующему пути в Acrobat Reader: Файл (File)→Свойства (Properties).
Поле «Заголовок» соответствует элементу title, а поле «Тема» - description.
Обязательно включайте в заголовок и описание PDF файла ключевые слова, по которым планируется продвижение. Это значительно увеличит шансы на высокое ранжирование поисковыми системами. Title и description должны отражать суть документа и максимально соответствовать запросам пользователей.
Для каждого документа на сайте прописывайте уникальные заголовки и описания, чтобы избежать дублирования мета-тегов.
Не забывайте включать ваши ресурсы в ссылочную структуру сайта:размещайте внутренние ссылки на файл на соответствующих страницах. Таким образом вы покажете поисковым системам, что ваш документ является важной частью сайта, а потому он должен быть проиндексирован и участвовать в поиске по релевантным запросам.
Также следует отметить, что на формирование заголовка, представленного в результатах выдачи, а, следовательно, и на ранжирование самого документа помимо title в метаданных документа, влияет и анкорный текст ссылки, ведущей на сам файл. Поэтому рекомендуется прописывать хорошие анкоры, включающие в себя ключевые слова и отражающие суть документа.
Дополнительно рекомендуется оставлять ссылки из самого PDF файла на страницы вашего сайта, и по возможности, на проверенные внешние ресурсы, если таковые могут быть полезны для пользователей в рамках содержимого документа.
Для того, чтобы никто извне не мог заменить ваши исходящие ссылки на свои, не забывайте защищать документ от редактирования в настройках. Если кто-то решит, что ваше руководство по созданию космического корабля будет отлично смотреться у них на сайте, это не даст им, например, заменить ссылки.
Представьте, что вы пытаетесь скопировать текст из найденного вами pdf-файла. Но не тут-то было – выделить нужный фрагмент попросту невозможно. Это происходит из-за того, что содержимое многих PDF - документов представляет собой изображения — чаще всего это результаты сканирования каких-либо печатных источников. Хотя это не мешает посетителям просматривать документ, выделение текста становится проблемой. Гораздо большие трудности испытывают поисковые системы – несмотря на постоянное совершенствование алгоритмов, им чаще всего не удается разобрать содержимое файла, текст в котором представлен картинками. Именно поэтому важно использовать файлы PDF с текстовым, а не графическим содержимым.
PDF файлы обрабатываются так же как и обычные html-страницы, поэтому они также могут создавать дубликаты контента. Если по каким-то причинам ваш файл является копией содержимого какой-либо страницы сайта, то обязательно пропишите для него атрибут rel=”canonical”в теге link, чтобы сообщить поисковым системам, какую версию страницы считать приоритетной.
Стандартное правило для файлов практически любого типа - чем меньше размер файла, тем лучше для SEO. Если файл слишком большой, пользователи могут просто не дождаться окончания загрузки. Кроме того, поисковые системы могут накладывать ограничения на размер файлов, подлежащих сканированию. Так, например, Яндекс не индексирует документы, размер которых превышает 10 Мб.
Одним из способов, позволяющих уменьшить размер файла, является сжатие изображений.А еще стоит помнить о том, что скорость загрузки является одним из факторов ранжирования.
Не забывайте о значительной доли мобильного трафика оптимизируйте ПДФ под смартфоны и планшеты: избегайте горизонтального скроллинга - этого можно добиться, выравнивая содержимое по левому краю, делайте текст удобным для восприятия, визуально выделяя ключевые моменты. Структурируйте текст – используйте заголовки, подзаголовки, абзацы и различные списки – мало кому понравится сплошное текстовое полотно.
Если ваши документы содержат изображения, то не забывайте использовать альтернативный текст для их описания. Это даст понять поисковым системам, что именно находится на изображении, а также позволить им ранжироваться в поиске по картинкам.
Файлы Word и Excel также могут отображаться в поисковой выдаче, поэтому все рекомендации, данные для PDF файлов также применимы и к файлам формата doc и xlsx.
В заключение поговорим об общей целесообразности использования файлов альтернативных форматов.
Pdf, doc, xls и подобные документы ранжируются поисковыми системами наравне с обычными html страницами. Это может привести к каннибализации других страниц сайта, так как pdf файлы зачастую содержат в себе больше информации. Например, вместо карточки товара из интернет-магазина, пользователь получит в выдаче его инструкцию по эксплуатации.Это может привести к потере конверсии, ведь даже если клиент найдет искомую информацию, он может так и не добраться до странички заказа.Также, многие пользователи предпочитают html странички из-за отсутствия необходимости открывать их в сторонних программах и гораздо более удобной навигации в браузере(одно только наличие кнопки "назад" чего стоит).
Таким образом, при оптимизации вашего сайта стоит задуматься о представлении содержимого документов в виде обычных страниц. В конце концов, в наши дни практически всё можно воспроизвести с помощью html и css.Сами файлы в таком случае следует закрыть от индексации, однако, если они по-прежнему несут полезную нагрузку, их можно оставить на сайте, чтобы пользователи могли, например, распечатать их.
Если же перевод содержимого в html представляется ненужным, оптимизируйте файлы альтернативных форматов согласно советам выше.