пятница, 28 апреля 2017 г.

Когда в выдаче Яндекса что-то сломалось… Лайфхак №2. Получаем текстовую сохраненную копию.

Вот уже несколько дней в выдаче Яндекса наблюдается очередная странность. Известно, что со страницы выдачи по ссылке «Сохраненная копия» можно попасть на страницу полной версии этой самой сохраненной копии:
На которой в свою очередь есть ссылка на текстовую копию:
Однако с недавних пор при переходе по ссылке «Посмотреть текстовую копию» ни на какую текстовую версию сохраненной копии мы не попадаем, а остаемся все на той же полной. То есть полная версия сохраненки ссылается сама на себя. Однако текстовую копию получить все-таки возможно. Для этого к адресу страницы полной версии сохраненной копии нужно добавить get-параметр &cht=1. Вуаля:
Возникает вопрос – баг это или фича? Текстовую сохраненку намеренно прячут или ссылку на нее просто потеряли?


вторник, 18 апреля 2017 г.

Лайфхаки к выдаче Яндекса. Узнаем возраст документа без get-параметра how=tm.

В связи с тем, что Яндекс в последнее время основательно взялся за урезание языка запросов и прочих возможностей исследования выдачи, всё чаще встречаю в профессиональных сообществах вопросы об альтернативах тем или иным утраченным возможностям. Поэтому решил открыть рубрику «Лайфхаки», где буду в лаконичной форме предлагать искомые альтернативы для некоторых случаев.
Итак, лайфхак #1. Одной из наиболее востребованных является задача установления возраста страницы в Яндексе. Раньше она решалась с помощью применения get-параметра к URL страницы поисковой выдачи Яндекса how=tm – сортировки выдачи по времени документа. В сниппете сформированной таким образом выдачи для каждого документа указывалась дата, которая и идентифицировалась, как возраст документа с точки зрения Яндекса. С некоторых пор индикация даты документа в выдаче с использованием такой сортировки отсутствует (за исключением стандартной индикации «свежести» документов из «быстроботовской» примеси), хотя, сама сортировка, судя по всему, продолжает осуществляться корректно.  

Однако альтернативная возможность узнать возраст документа с точки зрения Яндекса на данный момент имеется. Для этого нужно воспользоваться сервисом Яндекс.XML и извлечь значение параметра <modtime> для нужной страницы в формате YYYYMMDDThhmmss ISO 8601:2004:


пятница, 14 апреля 2017 г.

Безвременная кончина операторов intext и inlink

Яндекс планомерно закручивает гайки реверс-инжинирингу алгоритма ранжирования. На днях тихой сапой почили в бозе недокументированные операторы intext: и inlink:
Они в своё время были упомянуты только в документации к продукту Яндекс.Сервер  - приложению для поиска в корпоративных сетях и поиска по сайту. Тем не менее оператор intext: полноценно работал и в большом поиске по вебу. Он обнулял значения ссылочных факторов. Если еще и несколько модифицировать базовый запрос таким образом, чтоб обнулились и поведенческие факторы, то можно было получить выдачу, более-менее пригодную для анализа текстовых факторов ранжирования.
Что же касается оператора inlink:, то работал он с некоторыми ограничениями, и полноценно его использовать удавалось только по правую сторону от оператора << (неранжирующее И). Однако это позволяло решить ряд интересных исследовательских и прикладных задач, например, задачу поиска по анкор-файлу.
Сейчас же, единственный заметный эффект от применения этих операторов заключается, похоже, только в отрубании «спектральной» примеси.

Технологии Blogger.