Метод попарного сравнения как способ анализа наложения пост-фильтров
Санкции, применяемые поисковыми машинами к результатам органической выдачи, можно разделить по характеру их действия на две основные группы – пост-фильтры и пред-фильтры.
Суть пост-фильтров заключается в том, что сначала рассчитывается реальное численное значение релевантности документа запросу, а затем из него вычитается некоторая величина (штраф). В отличие от них характер действия пред-фильтров заключается в том, что сначала дисконтируется или вообще обнуляется значение некоторых факторов ранжирования для документа, а затем уже с использованием измененных значений этих факторов рассчитывается значение релевантности.
Одним из способов анализа пост-фильтров является подход, основанный на модификации базового запроса таким способом, чтобы удалить действие пост-фильтров на определенные документы. При этом важно, чтобы модификация не влияла на базовую часть запроса, по которой собственно и рассчитывается релевантность.
Одно время существовало несколько способов подобной модификации. Например, добавление к запросу незначащих символов (таких как точка, запятая или скобки). Или же добавление к запросу через оператор отрицания термина, выдача по которому заведомо пуста (как правило, для этого использовался случайный набор символов, так называемая «абракадабра»). Но рано или поздно почти все эти способы перестали работать.
Кроме, пожалуй, одного – сужения выдачи на меньшее число документов. Возможно, что пост-фильтры отключаются, когда число ответов в ней сравнительно невелико. Что, в принципе, логично с той точки зрения, что искусственное занижение релевантных ответов в такой «короткой» выдаче может способствовать появлению в топе откровенного мусора с околонулевой релевантностью.
Так, к примеру, сужение выдачи на сайт (так называемый поиск по сайту или «Показать еще с сайта») иногда приводит к смене самой релевантной страницы. Сотрудники службы поддержки Яндекса (собирательным образом которых является Платон Щукин) предпочитают это объяснять тем, что «по служебным запросам при поиске по сайту некоторые факторы могут учитываться иначе, чем при построении общей выдачи». В принципе, гипотеза о снятии пост-фильтров при сужении выдачи вполне укладывается в это объяснение.
Одним из таких методов сужения выдачи для анализа на предположительное применение к сайту пост-фильтров по определенному запросу в Яндексе, является так называемый метод попарного сравнения.
Суть его заключается в том, что документ (или сайт), занимающий определенное место в общей выдаче по запросу, последовательно сравнивается с документами (или сайтами), занимающими места в общей выдаче выше него путем сужения выдачи на два этих документа (или сайта). Если в суженной выдаче исследуемый документ (или сайт) ранжируется выше хотя бы нескольких документов, стоящих выше него в общей выдаче, то делается вывод о наложении на него в общей выдаче пост-фильтра.
Поясню на примере. Так, сайт известной компаний BDBD, в которой я когда-то работал, на момент написания статьи находился в седьмом десятке выдачи Яндекса по региону «Москва» по запросу [продвижение сайтов]:
Место достаточно низкое для такой известной компании, особенно с учетом того, что несколько лет назад этот сайт стабильно занимал первые места в выдаче по этому запросу. В связи с этим напрашивается предположение о применении к сайту каких-либо санкций.
С помощью попарного сравнения можно убедиться, что рассматриваемый сайт опережает в выдаче, суженной на два сайта, многие сайты, которые ранжируются в общей выдаче гораздо выше него, например, во втором десятке:
Стоит заметить, что для сужения выдачи на два сайта используется исключенный из списка документированных оператор группировки () («скобки»). Несмотря на прекращение официальной поддержки, этот оператор сохранил частичную работоспособность и в данном случае прекрасно справляется с возложенной на него функцией.
Безусловно, метод попарного сравнения нельзя назвать стопроцентно точным инструментом анализа наличия пост-фильтров. Однако, на мой взгляд, если сайт при попарном сравнении обходит достаточно большое количество сайтов, которым он уступает в общей выдаче, то это весьма серьезный повод задуматься о том, что с ранжированием исследуемого сайта по данному запросу то-то не так. К сожалению, сейчас служба поддержки Яндекса практически никогда не признает наличия санкций, если об этом нет отметки в сервисе Яндекс.Вебмастер. Поэтому поиск причин наложения санкций становится нетривиальной задачей.