Параметры URL страницы выдачи Яндекса
Помимо использования операторов языка запроса в поисковой системе Яндекс существует возможность регулировать результаты выдачи по базовому запросу (в URL страницы выдачи ему соответствует значение параметра text) с помощью целого ряда get-параметров формата переменная=значение, используемых в URL страницы выдачи.
Базовый набор этих параметров можно определить с помощью использования фильтров расширенного поиска, а также индивидуальных настроек поиска.
- lr (регион выдачи) – в качестве значения используется номер региона. Числовые значения номеров некоторых распространенных регионов можно найти на странице https://yandex.ru/yaca/geo.c2n , но используемая база значительно полней (в ней по различным оценкам, полученным методом перебора значений, содержится несколько десятков тысяч регионов). Этот параметр не имеет аналога в языке запросов.
Фильтры расширенного поиска активируются по нажатию соответствующей кнопки в поисковой форме: https://yandex.ru/support/search/how-to-search/advanced-search.xml. Также отдельно форма расширенного поиска Яндекса в несколько ином формате находится по адресу https://www.yandex.ru/search/advanced, но, не исключено, что она уже не относится к документированным возможностям поиска, а является позабытым артефактом. С помощью расширенного поиска возможно определить ряд параметров URL страницы выдачи. Некоторые из них по сути дублируют соответствующие операторы языка запросов, а некоторые в языке запросов не имеют аналогов. Следует отметить, что мне представляется более предпочтительным при исследовании выдачи, где это возможно, применять именно get-параметры, а не операторы языка запроса. Так как при этом сам базовый запрос формально остается неизменным, что обеспечивает, на мой взгляд, большую чистоту исследования.
- rstr (поиск по сайтам из заданного региона) – в качестве значения используется номер региона аналогично оператору lr с одним отличием, что перед номером региона необходимо поместить знак «минус», например: rstr=-15. К сожалению, на самом деле в выдаче с использованием этого параметра содержатся не документы, привязанные к заданному региону, а документы, которые содержат в тексте или анкор-файле упоминание заданного региона, т.е. по сути происходит некоторая модификация базового запроса путем добавления к нему названия региона.
- site (поиск на заданном сайте) – в качестве значения используется имя домена или поддомена. По принципу действия аналогичен оператору site:, однако результаты выдачи могут отличаться друг от друга.
- lang (язык документа) – принимает значения:
ru (русский)
en (английский)
fr (французский)
de (немецкий)
uk (украинский)
be (белорусский)
tt (татарский)
kk (казахский)
tr (турецкий)
id (индонезийский)
По принципу действия аналогичен оператору lang:, однако результаты выдачи могут отличаться друг от друга.- mime (формат документа) – принимает значения html, pdf, rtf, doc, swf, xls, ppt, docx, odt, odp, ods, odg, xlsx, pptx.
- zone (зона документа) – принимает значения
all (где угодно)
title (в заголовке), по принципу действия аналогично оператору title:, однако результаты выдачи могут отличаться друг от друга.- wordforms (употребление слов) – принимает значения
all (в любой форме)
exact (как в запросе), по принципу действия аналогично оператору “” (поиск по цитате), однако результаты выдачи могут отличаться друг от друга.- numdoc (количество результатов на странице выдачи) – принимает значения 10, 20, 30 и 50. При использовании чисел, отличных от этих значений, меньших 50, происходит округление вверх до ближайшего из них. При использовании чисел более 50, происходит округление до 50.
- from_date_full (начальное значение диапазона дат) – принимает значения в виде ДД.ММ.ГГГГ
- to_date_full (конечное значение диапазона дат) – принимает значения в виде ДД.ММ.ГГГГ
- within (диапазон дат) – принимает значения
1 (за две недели)
2 (за месяц)
3 (за три месяца)
4 (за полгода)
5 (за год)
6 (за два года)
7 (за сутки)
77 (за сутки)
8 (за трое суток)
9 (за неделю)
Оператор within имеет приоритет над операторами from_date_full и to_date_full при совместном использовании.
В основном поиске также поддерживается один из параметров, указанных в документации get-запросов для сервиса Яндекс.XML
В основном поиске также поддерживается один из параметров, указанных в документации get-запросов для сервиса Яндекс.XML
- l10n (язык уведомлений) – устанавливает язык интерфейса страницы с результатами поиска, принимает значения:
ru (русский)
uk (украинский)
be (белорусский)
kk (казахский)
Кроме того, в различных служебных сообщениях на странице выдачи можно обнаружить ссылки на страницы выдачи, содержащие следующие параметры:- page (номер страницы выдачи) – принимает значения от 0 (первая страница) до 18
- noreask=1 – отключение автоматического исправления опечаток, добавления результатов выдачи по схожим запросам.
Также продолжают работать некоторые параметры-артефакты, которые некогда содержались в ссылках из различных служебных сообщений на странице выдачи, но со временем эти сообщения перестали показываться:
- nomisspell=1 – в настоящий момент по действию аналогичен параметру noreask=1
- nosyn=1 – отключение подсветки синонимов в сниппетах
- how=tm – сортировка выдачи по дате первичной индексации документа
- rd=0 – отключение фильтра дубликатов (в терминах Яндекса – «слишком похожих страниц»)
- pag=u – разгруппировка результатов выдачи по сайтам
Учитывая тот факт, что при этом также происходит и разгруппировка аффилиатов, этот параметр можно использовать для поиска отфильтрованных аффилиатов в выдаче, правда здесь нужно учитывать, что разгруппированные страницы с некоторых сайтов могут занять много мест в топе, что затруднит поиск аффилиатов.
В завершении стоит, пожалуй, заметить, что есть еще один параметр-артефакт, который некоторым образом изменяет результаты поиска по базовому запросу. Это параметр hodreq, значение которого представляет собой некоторый поисковый запрос. Когда-то это параметр использовался в режиме «Искать в найденном», фиксируя предыдущий поисковый запрос, который ограничивал выборку документов для применения базового запроса. Однако на данный момент корректно интерпретировать действие этого параметра мне, к сожалению, не удалось.
1 Comment
Сергей, спасибо за напоминание этих параметров. Было бы интересно почитать, как сейчас применяете это все, как Вы это умеете делать.
Reply