вторник, 2 апреля 2019 г.

Google запатентовал поведенческие факторы


Исторически Google, в отличие от Яндекса, никогда официально не признавал использование в ранжировании поведенческих факторов. Более того, устами своих сотрудников он открыто отрицал это, объясняя свое решение низким качеством этих сигналов.
Так, в 2014-м году на московской конференции Cybermarketing-2014 во время телемоста с европейской штаб-квартирой Google в Дублине сотрудник отдела качества поиска Андрей Липатцев недвусмысленно заявил, что поведенческие и социальные факторы с точки зрения разработчиков алгоритма ранжирования Google являются очень плохими и слишком шумными сигналами и поэтому не учитываются в алгоритме. Эта мысль постоянно звучала затем в многочисленных видеоконференциях сотрудников Google, как русско-, так и англоязычных, в частности Джона Мюллера.
И вот 18 марта 2019 года американский SEO-специалист Билл Славски обнаружил свеженький, датированный 12 марта 2019 года, патент Google под названием «Modifying search result ranking based on implicit user feedback» («Изменение ранжирования результатов поиска на основе неявной обратной связи с пользователем»).
Итак, что же подразумевается под «неявной обратной связью с пользователем»? Как оказалось, старые добрые поведенческие факторы. В частности, в патенте упоминаются следующие сигналы:
  1. Запрос, заданный пользователем, результаты поиска, предоставленные поисковой системой, документ, выбранный пользователем из числа результатов поиска, его позиция в порядке представления результатов поиска (“a query submitted by the user, one or more search results presented by the search engine in response to the query, a document selected by the user from among the search results, an ordinal position in a presentation order of the search results of the search result selected by the user”). То есть речь идет о так называемых «кликовых» поведенческих факторах, непосредственно связанных с поведением пользователя на странице поисковой выдачи. Замечу, что Яндекс вот уже 10 лет (начиная с алгоритма «Арзамас», запущенного в апреле 2009-го года) учитывает кликовые факторы (в свое время я достаточно подробно писал о кликовых факторах ранжирования в Яндексе).
  2. Время, проведенное пользователем на выбранном документе (“a time the user spent on the document”). Так называемая «длина клика». Далее поясняется, что под временем, потраченным пользователем на документ, подразумевается время, прошедшее от клика на документ в результатах поиска до возвращения к результатам поиска и выбора в них нового документа.
  3. Язык, используемый пользователем, и страна, где пользователь с большой долей вероятности находится (“a language employed by the user, and a country where the user is likely located”). Что свидетельствует о дифференцированном подходе к учету поведения пользователей в зависимости от их языка и страны. В общем-то, вполне логично, что разноязычные пользователи, равно как и пользователи, живущие в разных странах, могут иметь различные предпочтения в выдаче по одному и тому же запросу.
Информация по длине кликов в выдаче по определенному запросу от различных пользователей взвешивается на основе длины клика по срезам: 
  1. запрос-документ
  2. запрос-документ-язык
  3. запрос-документ-язык-страна
По длине клики классифицируются на короткие, средние и длинные (причем, дифференциация по этим категориям на основе длины клика зависит от запроса), также выделяется категория «последнего клика». Каждая категория имеет соответствующий вес. В качестве примера приводятся следующие весовые коэффициенты. Короткий клик может считаться признаком плохой страницы и, следовательно, получает малый вес (например, 0,1). Средний клик может считаться показателем потенциально полезной страницы и, следовательно, получает несколько больший вес (например, 0,5). Длинный клик может считаться показателем хорошей страницы и, таким образом, получает гораздо больший вес (например, 1,0). Последний клик (когда пользователь не возвращается на страницу с результатами поиска) может считаться вероятным показателем хорошей страницы и, следовательно, иметь достаточно большой вес (например, 0,9).
При взвешивании кликов предлагается назначать меньший вес кликам тех пользователей, которые почти всегда выбирают высоко ранжируемые документы, по сравнению с кликами пользователей, которые чаще их выбирают документы с более низкими позициями. В общем-то, на мой взгляд, вполне логично понизить вес «голосов» пользователей, занимающихся тупым перебором всех подряд элементов в списке, не обращая внимание на сниппеты.
Также предлагается разделять пользователей на определенные типы. Указывается, что более опытным пользователям требуется меньше времени на получение информации, таким образом при учете кликов определенного пользователя может использоваться весовой коэффициент в зависимости от его индивидуального поведения в сети, например, учитывающий среднюю продолжительность сессии или частоту переходов между документами.
Кроме того, пользователь может быть определенным образом классифицирован на основе его потока запросов. В частности, предполагается, что пользователь, который задает много запросов по определенной теме, может иметь высокий уровень знаний по ней, и данные о его кликах могут быть соответствующим образом взвешены для будущих запросов от данного пользователя по данной теме.
В качестве «меры релевантности» предлагается использование составных показателей, таких, например, как отношение числа длинных кликов к коротким или отношение числа длинных кликов ко всем кликам для конкретного документа по конкретному запросу (доля длинных кликов). Причем, к отношениям может быть добавлен в качестве защиты от шума параметр сглаживания, обладающий следующим свойством – если общее количество кликов невелико, то результат будет стремится к нулю. Благодаря составным показателям документы, получающие относительно небольшое количество кликов, но в большинстве своем длинные, в итоге могут получить больший вес, чем документы, находящиеся на более высоких позициях и получающие за счет этого большее количество кликов, но имеющие относительно небольшую долю длинных кликов. То есть, как говорится, не CTR’ом единым… 
Также параметры сглаживания могут варьироваться в зависимости от языка или страны пользователей. Примечательно, что в качестве примера географического источника запросов, среди которых исторически генерировалось больше спам-активности и которые потому требуют более жесткого сглаживания, указана Россия.
Упоминается и о возможности учета дополнительной информации, такой как позиции, численные значения релевантности и сниппеты как выбранных пользователем документов, так и показанных ему, но не выбранных им.
В итоге вычисленные значения меры релевантности в явном или преобразованном виде предлагается применять в качестве повышающего коэффициента к значениям релевантности, вычисленным алгоритмом ранжирования.
В тексте патента также провозглашается необходимость обеспечения защиты пользовательских данных от накруток. Что ж, вещь, несомненно, весьма актуальная, особенно для исторически спам-активной в этом плане России. Интересно, насколько эффективно ее будет решать Google, если дело дойдет до реализации заявленных в патенте положений.
Резюмируя, можно отметить, что ничего революционного в патенте не содержится. Всё вертится вокруг доли длинных кликов, как основной меры активности пользователя, и нюансах взвешивания данных от различных категорий пользователей. В хорошо известных статьях сотрудников Яндекса шести-семилетней давности на тему учета кликовых факторов «Session-based Query Performance Prediction» и «Through the looking glass: utilizing rich post-search trail statistics for web search» содержится информация о гораздо более разнообразных сигналах.
Ну, и не следует забывать, что наличие патента еще не означает непременной реализации указанных в нем вещей в «боевом» поиске. Но в любом случае мы получаем еще одно подтверждение, что задача удержания пользователей на сайте является одной из основных.

Share this


0 Comments

Blog Archive

Технологии Blogger.