четверг, 30 июня 2016 г.

Особенности регионального ранжирования в Яндексе (доклад на конференции "Неделя Байнета 2016")

Регион пользователя стал учитываться Яндексом при ранжировании сайтов в апреле 2009 года. Тогда в анонсе релиза нового алгоритма «Арзамас» в блоге разработчиков Яндекса появилось следующее сообщение (https://yandex.ru/blog/webmaster/3425):
«…Теперь поиск Яндекса учитывает регион пользователя. Начиная с "Арзамаса", результаты поиска по одному и тому же запросу могут быть разными в разных регионах… В ранжировании стали учитываться факторы, позволяющие понять, что данная страница важна пользователям именно "своего" региона…»
Регион пользователя по умолчанию определяется автоматически. Однако, в отличие от поисковой системы Google, у Яндекса есть дополнительная возможность задать этот регион вручную на странице http://tune.yandex.ru/region/:
Также в Яндексе можно менять регион результатов поиска с помощью get-параметра lr непосредственно в URL страницы поисковой выдачи (значение lr=15 соответствует городу Тула):
Список номеров наиболее распространенных регионов можно найти на странице https://yandex.ru/yaca/geo.c2n. Но на самом деле их много больше. Различными методами перебора удавалось найти десятки тысяч уникальных значений номеров для различных населенных пунктов, регионов, территорий и стран.  
В свою очередь запросы делятся на геонезависимые (ГНЗ) и геозависимые (ГЗ). Для геонезависимых запросов выдача не зависит от значения региона (значения параметра lr) в одной стране, для таких запросов влияние региональности документов на ранжирование равно нулю (lr=15 – Тула, lr=213 – Москва):
В случае же геозависимых запросов выдача от региона зависит:
Заметим, что у геозависимых запросов появляется характерный признак – подсветка в сниппетах названия региона.
Кстати, геозависимость запроса – величина не бинарная. Сила влияния региональности документа на ранжирование зависит от степени геозависимости запроса. Выше я привел пример сильно-геозависимого запроса (доставка пиццы), выдача по которому в разных регионах отличается очень заметно. Но есть и запросы со слабой геозависимостью, где различия в региональных выдачах минимальны:
Стоит отметить, что не каждый регион из пронумерованных Яндексом имеет собственную выдачу для геозависимых запросов. Так, например, выдача для регионов из дальнего зарубежья может практически не отличаться даже по сильно-геозависимым запросам:
Существует также и особый класс запросов – это запросы, содержащие в себе топонимы, т.е. названия населенных пунктов. Формально эти запросы являются геонезависимыми, т.к. выдача по ним не зависит от региона пользователя. Однако по факту регион, указанный в тексте запроса, влияет на ранжирование, и он же подсвечивается в сниппетах, т.к. является ключевым словом запроса:
Дело в том, что ГНЗ без топонипов выдача строится по формуле для страны (например, для российских пользователей – по так называемой «общероссийской» формуле), а выдача для запросов с топонимами – по формуле для того региона, который указан в запросе. Это нужно обязательно иметь в виду.
Вообще умение правильно классифицировать геозависимость запросов играет очень большое значение. Так как геозависимые и геонезависимые запросы ранжируются в Яндексе различными формулами, то, к примеру, продвижение одной станицы сайта одновременно по разным типам запросов может вызвать определенные затруднения – у разных формул разные оптимальные значения различных факторов ранжирования.
Казалось бы, что проще – взять и сравнить выдачи по одному запросу для двух разных регионов? В общем-то этот метод определения геозависимости запроса прекрасно работал до недавнего времени, но с запуском «многорукого бандита», перемешивающего топ выдачи, сильно повышается вероятность получения для геонезависимого на самом деле запроса отличающихся выдач в разных регионах, т.е. ложноположительного срабатывания проверки на геозависимость. Да что там говорить о разных регионах, когда даже выдачи по одному запросу для одного региона на одном компьютере в одном браузере, полученные в разные моменты времени, могут отличаться.
Не так давно мне удалось сконструировать достаточно интересный способ проверки запроса на геонезависимость, который не зависит от проделок «многорукого бандита», а также других вещей, искажающих органическую выдачу – различных примесей к органике, пост-штрафов, экспериментов разработчиков Яндекса и т.п. О нем я писал ранее в блоге: http://www.ludkiewicz.ru/2016/05/blog-post.html
Важную роль в ранжировании геозависимых запросов играет совпадение региона поисковой выдачи и региона сайта.
Иерархию уровней региональности в Яндексе можно представить следующим образом (от более широкого к более узкому):
  • Весь мир
  • Континент (напр., Евразия)
  • Часть света (напр. Европа – кроме России и стран СНГ),
  • СНГ (только для стран СНГ, кроме России)
  • Страна (напр., Россия)
  • Укрупненный регион (напр., Центральный федеральный округ – только для России)
  • Регион (напр., Тульская область – для отдельных стран)
  • Район (напр., Городской округ Тула – для отдельных стран)
  • Населенный пункт (напр., Тула)
  • Часть населенного пункта (напр., Менделеевский – для отдельных населенных пунктов)
Так вот, самое сильное влияние на выдачу по геозависимым запросам оказывает совпадение региональности выдачи и региональности документа на самом нижнем уровне – как правило, это населенный пункт. Совпадение на более высоких уровнях имеет намного более слабый эффект. Одно из самых распространенных заблуждений, связанных с региональным ранжированием – что присвоение сайту региона более высокого уровня (например, «Россия») даст ему заметное преимущество в ранжировании по всем более нижним уровням (в рамках данного примера – всем населенным пунктам России). Это не так. Сайт с присвоенным регионом «Россия» будет ранжироваться в конкретном населенном пункте России, например, в городе Тула, ровно так же, как сайт, которому привязан к любому населенному пункту из другого российского региона – ведь совпадение региональности в этом случае произойдет также на уровне страны. И будет неизбежно проигрывать при прочих равных сайтам из Тульской области. А сайты из других городов Тульской области, в свою очередь, при прочих равных будут проигрывать сайтам, привязанным к городу Тула. То есть, чем выше в представленной иерархии региональности находится уровень совпадения регионов поисковой выдачи и сайта, тем хуже будет ранжироваться сайт по геозависимым запросам.
В связи с этим нужно запомнить простое правило – если Вы хотите хорошо ранжироваться в выдаче для конкретного населенного пункта, необходимо присвоить сайту/документу в качестве региона непосредственно этот населенный пункт.
Существуют следующие возможности для привязки определенного региона к сайту:
  1. Задание регионов редакторами при регистрации в Яндекс.Каталоге (максимум 7 регионов)
  2. Задание региона владельцем сайта в Яндекс.Вебмастере (всего 1 регион, при этом необходимо указать страницу сайта, которая содержит информацию о региональной принадлежности). Причем, бета-версия Яндекс.Вебмастера на данный момент имеет более богатый выбор регионов для присвоения сайту, чем основная версия, например, там можно выбрать части населенных пунктов.
  3. Получение регионов из физических адресов организации, к которой привязан сайт, при регистрации организации в Яндекс.Справочнике (неограниченное количество регионов, необходимо пройти процедуру валидации указанного физического адреса организации)
  4. Автоматическое определение региона по найденной в контенте сайта геоинформации (неограниченное количество регионов, региональную привязку могут получать отдельные страницы сайта)
Проверить, какие регионы присвоены сайту, можно разными способами. Официальный способ – с помощью соответствующего режима Яндекс.Вебмастера («География сайта – Регион сайта» в основной версии и «Настройки индексирования – Региональность» в бета-версии). Я рекомендую использовать бета-версию, как дающую более информативный ответ, в частности, там региональная привязка классифицирована по источникам присвоения:
Альтернативный способ я упоминал в своей статье «Сеанс поисковой магии, или смещения в языке запросов Яндекса». Это проверка региональной привязки для отдельного документа с помощью оператора языка запросов Яндекса cat: с использованием в качестве его значений определенных смещений, которые суммируются с кодом проверяемого региона. Для проверки региональной привязки, заданной через Яндекс.Каталог можно использовать документированное смещение 11000000:
Существуют также недокументированные смещения:
  • 21000000 – региональность, присвоенная через Яндекс.Вебмастер или автоматически
  • 31000000 – региональность, присвоенная автоматически
  • 51000000 – региональность, присвоенная автоматически
  • 61000000 – региональность, присвоенная автоматически
  • 71000000 – региональность, присвоенная автоматически
  • 81000000 – региональность, присвоенная через Яндекс.Справочник
Скомбинировав эти смещения в одном запросе, мы можем получить универсальный запрос для проверки привязки к определенному региону как отдельного документа, так и группы документов, например, всех документов с конкретного сайта. Например, для города Тула с кодом региона 15, комбинация смещений будет выглядеть следующим образом:
(cat:11000015 | cat:21000015 | cat:31000015 | cat:51000015 | cat:61000015 | cat:71000015 | cat:81000015)
Можно убедиться, что, к примеру, для сайта yandex.ru привязку к региону «Тула», имеют, в основном, страницы сервиса Яндекс.Расписания, очевидно, получившие эту привязку автоматически вследствие упоминания топонима «Тула» в своем контенте:
Отдельно стоит упомянуть о наследовании поддоменами региональности от основного (родительского) домена. Поддомены наследуют по умолчанию те регионы родительского домена, которые были присвоены через Яндекс.Каталог (однако, информация о наследуемых регионах не отображается в Яндекс.Вебмастере). Регионы же, присвоенные через Яндекс.Справочник, поддоменом не наследуются. Наследование поддоменом регионов от родительского домена может быть аннулировано в случаях:
  • регистрации поддомена в Яндекс.Каталоге как самостоятельного ресурса;
  • отдельной привязки поддомена к зарегистрированной в в Яндекс.Справочнике организации;
  • присвоения поддомену региона через Яндекс.Вебмастер.
В обратную сторону (от поддомену к родительскому домену) перехода региональности не происходит вне зависимости от способа её привязки к поддомену.
Зачастую перед сайтом стоит задача хорошего ранжирования по геозависимым запросам в нескольких регионах. Для этого необходима привязка к сайту всех интересующих регионов. С учетом особенностей различных способов привязки региона к сайту можно обозначить две основные стратегии присвоения регионов для мультирегиональных сайтов.
В силу того, что Яндекс.Каталог представляется наименее предпочтительным инструментом ввиду отсутствия гибкости и ограничения на количество регионов, будем рассматривать варианты региональной привязки через Яндекс.Справочник и Яндекс.Вебмастер.
Стратегия на основе Яндекс.Справочника подходит для случаев, когда нет проблем с верификацией физических адресов организации в интересующих регионах. В реквизитах каждого такого физического адреса организации, зарегистрированного в Яндекс.Справочнике, нужно прописать адрес сайта.  Важный момент – вследствие того, что поддомены не наследуют от родительского домена региональную привязку, полученную через Яндекс.Справочник, всю важную для мультирегионального ранжирования информацию следует располагать на основном домене.
Стратегия на основе присвоения региона через Яндекс.Вебмастер подходит для случаев, когда возникают проблемы с верификацией физических адресов организации в интересующих регионах через Яндекс.Справочник. Дело в том, что эта процедура довольно жесткая, и не все сайты в состоянии ее пройти для всех интересующих их регионов, т.к. надо иметь реально работающий офис по указанному при регистрации адресу. Верификация же региональной привязки через Яндекс.Вебмастер гораздо более мягкая, единственное требование – наличие страницы, содержащей региональную принадлежность (например, «Контакты»). Однако региональная привязка в Яндекс.Вебмастере ограничена только одним регионом. Поэтому возникает необходимость создания под каждый интересующий регион отдельного регионального поддомена. Эти поддомены можно зарегистрировать в Яндекс.Вебмастере, как отдельные сайты, и привязать через него к каждому поддомену соответствующий регион.


среда, 8 июня 2016 г.

ТАСС уполномочен заявить

Сегодня чисто случайно наткнулся на сайте с многообещающим доменным именем tass.ru на одну статейку с зацепившим взгляд заголовком «Google: самый популярный запрос в мире, связанный с Россией, - "русская голубая кошка"». Согласно опубликованной информации аналитик из Google по имени Арам Астрян подготовил доклад для конференции «Google Think Performance» на основе статистики запросов в Google, включающих в себя слово «русский». В котором аналитик детализирует данные по странам – англичане ассоциируют Россию с кошками, французы – с хомяками, японцы – с черепахами. Сплошной клуб любителей животных.
Ну, и в обраточку у него тоже аналитика есть – как там русские ассоциируют всяких басурман: "Самый популярный запрос в России про Францию - "французский поцелуй", а с Англией у россиян ассоциируются, в первую очередь, английские бульдоги. Жители России часто ищут информацию про испанскую премьер-лигу и японские сканворды».
Ну, тут я и подумал, а я, что – рыжий? Я также, как и тот аналитик Гугла, могу пойти заценить публичную статистику запросов в Яндекс и поинтересоваться что там на самом деле ищут русские про иностранцев.
Со словом «английский» было сложней всего. Приходилось продираться сквозь тему изучения английского языка. Сумасшедшее отрицание всевозможных ассоциаций с обучением в виде
английский -язык -перевод -класс -русский -русско -перевод -переводчик -гдз -учебник -решебник -перевести -тетрадь -уроки -тема -школа -слово -контрольная -бесплатно -бесплатный -начинающих -биболетова -5 -6 -7 -8 –онлайн
оставило в фаворитах запрос «английские песни»:
Ну да, эти песни именно песни на английском языке. Которые мы хотим не только слушать, но и понимать, что в них поётся. Так что не гугловскими английскими бульдогами едиными. К ним, боюсь, вообще не пробраться в яндексовской статистике через отрицания ассоциаций с английским языком и культурой.
Смотрим за «французский». Тут, к счастью, ничего минусовать не надо, и все выглядит просто шикарно:
Мясо, фильмы, наконец-то бульдог (но не английский!), песни и даже порно. Но гугловского поцелуя не видно и в помине.
Итак, далее испанцы. По версии аналитика из Google русскоязычных пользователей больше всего интересует испанская Премьер-лига. Минусуем запросы, связанные с изучением испанского языка (они тут, в отличие от французского, присутствуют в большом количестве) и получаем, что испанский футбольный чемпионат интересует нас сильно меньше, чем испанские песни, танцы и испанский визовый центр. Вот она, проза жизни :)
Ну и, что же нам скажут напоследок японцы?
Да, кроссворды там есть (причем, именно кроссворды, а не сканворды), но только после порно.
В общем, зверушки – не наша тема, нам импортное кино (всякое разное), песни и танцы подавай. Мы – люди культурные ☺


понедельник, 6 июня 2016 г.

Новый облик Сёрча

Сегодня обновился дизайн главного сеошного сайта Рунета – www.searchengines.ru, в простонародье – Сёрча. Новый дизайн выполнен по самому последнему фен-шую – адаптивность, мобильность, блочность и прочая модность.
Сказать, что Сёрч (объединяющий информационный сайт и форум) – это целая эпоха для русскоязычных сеошников – значит ничего не сказать. Это больше, чем эпоха. Конечно, поначалу сам сайт находился в тени форума, но со временем он вырос в очень интересное остраслевое СМИ. Вот таким Серч был в марте 2001-го года, когда я впервые стал его пользователем:

Ностальжи... Всякие Альтависты с Профьюжнами, о которых писалось тогда в поисковых новостях, уже давно почили в бозе как поисковые системы, а Сёрч – жив, курилка. Да не просто жив, а вечно молод, подтянут, энергичен и теперь еще и прикинут по последней моде. ☺

Технологии Blogger.