понедельник, 25 ноября 2019 г.

Новый формат сохраненной копии страницы в Яндексе

В октябре 2019-го года Яндекс тихой сапой, безо всяких анонсов и объявлений, заменил формат сохраненной копии страницы. Нажав на ссылку «Сохраненная копия» в сниппете, 
мы попадаем на домен yandexwebcache.net, который раньше не использовался для хранения сохраненных копий. Собственно, этот домен был зарегистрирован совсем недавно, в августе 2019-го года:


Дизайн шапки страницы сохраненной копии со служебной информации изменился:


Хорошая новость – ссылка на текстовую копию стала рабочей в отличие от старого формата сохраненки. Она доступна по ссылке «Только текст», URL страницы текстовой версии сохраненной копии отличается от URL полной версии наличием get-параметра mode=text:
Но есть и очень неприятная особенность нового формата сохраненной копии – полностью исчезла подсветка ключевых слов запроса как в полной версии, так и в текстовой:
К счастью, подсветку ключевых слов все-таки можно увидеть, применив несложный лайфхак. Оказывается, с вводом нового формата сохраненной копии Яндекс пока еще не удалил возможность пользоваться старым форматом. Для доступа к сохраненкам в старом формате нам нужно заменить в URL сохраненки имя домена с https://yandexwebcache.net/ на https://hghltd.yandex.net/
При этом нужно иметь в виду, что при загрузке полной версии сохраненной копии Яндекс может убирать из ее URL в командной строке браузера get-параметр sign (по крайней мере, это происходит для сохраненной копии исследуемой нами главной страницы Яндекса). Если такое происходит, то URL полной версии сохраненки нужно скопировать не из командной строки браузера, а из ссылок на нее из сниппета на странице выдачи или со страницы текстовой сохраненной копии, в которых этот параметр присутствует. Далее заменяем в скопированном URL домен и получаем полную версию сохраненной копии в старом формате с подсветкой ключевых слов:
Для получения текстовой версии сохраненной копии в старом формате с подсветкой, надо к сконструированному нами URL полной версии сохраненки добавить get-параметр &cht=1, т.к. ссылка «Посмотреть текстовую копию», как я уже упоминал выше, здесь работает некорректно:
При этом надо иметь в виду тот факт, что время жизни текущего значения get-параметра sign в URL сохраненных версий как нового, так и старого формата ограничено. И если мы начинаем при попытке ее загрузить получать 404-ю ошибку, то необходимо обновить страницу с результатами поиска и извлечь из сниппета ссылку на сохраненную копию с новым значением get-параметра sign, которое будет рабочим некоторое время. Так, например, за время написания этой статьи рабочее значение get-параметра sign в URL сохраненных копий рассматриваемого примера менялось несколько раз, что можно заметить на скриншотах.
Хотелось бы надеяться, что сотрудники Яндекса восстановят подсветку ключевых слов запроса в новом формате сохраненки. А пока придется совершать вот такие вот танцы с бубнами с возвращением к старому формату для продуктивного анализа сохраненных копий страниц. При этом проблема возможного несоответствия показываемой версии сохраненной копии страницы и той, что находится в индексе и используется для ранжирования, о которой я писал ранее, к сожалению, все еще остается актуальной.

Share this


2 Comments
avatar

Добрый день!
Статья отличная. Однако, могли бы вы подсказать следующий момент. В сохраненной копии в параметрах есть две даты (tm и la):
&tm=1580662231&tld=ru&la=1580319104
Даты не совпадают ни с одной датой, которую можно получить открыто (даты индексации в ЯВМ, дата последней сохраненной копии).
Что эти даты означают?

Reply
avatar

Доброго времени суток! Спасибо за статью. А не подскажите можно ли вернуться к ранее сохраненной версии или как отредактировать текущие данные в яндекс поиске

Reply

Blog Archive

Технологии Blogger.