Показаны сообщения с ярлыком Обзоры. Показать все сообщения

понедельник, 9 декабря 2019 г.

Чего ждать от алгоритма BERT?

Пожалуй, наиболее ярким событием прошедшего месяца в сфере SEO стало обсуждение алгоритма BERT, начавшееся после объявления сотрудниками Google о том, что этот алгоритм уже используется в поиске для ряда запросов. И хотя, на мой взгляд, этот алгоритм не оказывает сколько-либо заметного влияния на традиционные сферы сеошных интересов в поиске, обойти его вниманием, думаю, было бы не совсем правильно.
25 октября 2019-го года в блоге разработчиков поисковой машины Google появилась статья под заголовком «Understanding searches better than ever before» («Понимание поисковых запросов лучше, чем когда-либо прежде») за авторством вице-президента Google Search Панду Наяка (Pandu Nayak). В ней помимо весьма пространного раcсказа о технологии поиска под названием BERT, впервые анонсированной год назад, было упомянуто об ее уже состоявшемся запуске в «боевой» поиск: «We’re also applying BERT to make Search better for people across the world». В статье как свершившийся факт рассматриваются примеры улучшения выдачи по некоторым запросам. Впрочем, ни о каком отдельном релизе в явном виде не было заявлено, и все выглядит так, что улучшения внедряются постепенно на протяжении некоторого времени, причем SEO-сообщество их не заметило до выхода этой статьи. А вот после появились заявления о дате релиза алгоритма. Так, сначала известный в западных SEO-кругах специалист Барри Шварц (Barry Schwartz) по горячим следам в день выхода статьи заявил о том, что алгоритм стал выкатываться на текущей неделе, а через несколько дней другой специалист Джордж Нгуен (George Nguyen) назвал точную дату: 21 октября, которую потом растиражировали различные отраслевые СМИ. 
Впрочем, не заметить изменения в поиске действительно не мудрено, даже учитывая тот факт, что специалисты Google оценивают, что они затронут каждый десятый запрос на английском языке. Дело в том, что улучшения касаются длинного хвоста микрочастотных запросов на естественном языке, которые попросту выпадает из поля зрения сеошных систем мониторинга выдачи. В связи с этим вспоминаются яндексовские релизы алгоритмов «Палех» и «Королев», которые также практически не затронули традиционные сферы интересов SEO-индустрии в поисковой выдаче, хотя сотрудники Яндекса, несомненно, придавали им большое значение. Судя по всему, то же самое происходит и с последствиями внедрения алгоритма BERT. 
Так что SEO-специалисты, на мой взгляд, могут расслабиться и последовать совету евангелиста поиска Google Дэннни Салливана (Danny Sullivan), данному им в своем Твиттере: «There's nothing to optimize for with BERT, nor anything for anyone to be rethinking. The fundamentals of us seeking to reward great content remain unchanged.» (в вольном переводе – «Не нужно ничего оптимизировать под BERT, равно как и что-то переосмысливать. Наши фундаментальные основы искать достойный контент остаются неизменными.»). Беспокоиться, пожалуй, стоит лишь «выжигателям» семантики по инфозапросам, которым стоит задуматься о повышении качества своих статей «на все случаи жизни».
Впрочем, любые изменения в поиске многие владельцы сайтов теперь будут связывать именно с алгоритмом BERT. Показателен любопытный диалог, состоявшийся во время видеовстречи для вебмастеров сотрудника Google Джона Мюллера (John Mueller). Владелец сайта, который ноябре упал по высокочастотным запросам на 4-5 страницу, сохранив при этом позиции по низкочастотному хвосту, обвинил в этом падении алгоритм BERT. Демонстрируя тем самым полное непонимание природы алгоритма, и получив от Мюллера ожидаемый ответ, что ситуация с его сайтом связана с рутинными изменениями алгоритма, не имеющими отношения к технологии BERT.
Полагаю, что если с позициями в выдаче Google и любого другого сайта в ноябре произошли значительные изменения, то очень вряд ли в этом повинен BERT.
Что же касается русскоязычных запросов, то пока не совсем ясно, насколько широко применяется к ним алгоритм BERT и применяется ли вообще, хотя Панду Наяк в своей в статье упоминает, что он используется для улучшения поиска по всему миру. 
Как один из примеров работы алгоритма Панду Наяк приводит англоязычный запрос «parking on a hill with no curb», демонстрируя как улучшилась выдача с учетом слова “no”, прежде игнорировавшегося:
Посмотрим, что происходит в выдаче по русскоязычным аналогам этого запроса. Запрос «парковка на склоне если нет бордюра» обрабатывается корректно, в первых двух сниппетах мы видим, что документы должны содержать ответ на вопрос:
Однако, чуть изменив запрос на «парковка на склоне без бордюра», мы видим, что сниппеты первых мест выдачи уже не указывают на то, что в документе содержится ответ на вопрос:
Кстати, Яндекс с его «Королевым» решает эту задачу аналогично. В первом случае сниппеты второго и третьего места содержат ответ на вопрос:
А вот во втором случае – нет:
В общем, алгоритмам обработки запросов на естественном языке в обоих поисковиках еще явно есть над чем поработать.


вторник, 22 октября 2019 г.

«Кошелек или жизнь?» – как понравиться асессорам Google

5 сентября 2019 года вышла очередная версия Руководства Google для асессоров. Ну, а 24 сентября стартовал очередной апдейт алгоритма ранжирования – September 2019 Core Update. Уже стало традицией, что обновления этого Руководства непременно предшествуют скорому знаковому обновлению алгоритма ранжирования. Так, например, предыдущее обновление случилось 16 мая 2019-го года, а уже в начале июня выдачу по многим тематикам основательно перетряхнул June 2019 Core Update. А предшествовавшее ему обновление Руководства от 20 июля 2018-го года ознаменовалось в начале августа 2018-го знаменитым Medic Update
Эти явно неслучайные совпадения заставляют подходить к изменениям в Руководстве Google для асессоров с большим вниманием. Да и сотрудник Google Дэнни Салливан в свое время заявлял, что руководство для асессоров является ключом к обновлениям основного алгоритма. Лично мне показались заслуживающими пристального внимания изменения в следующих разделах.
Во-первых, значительно обновился раздел 2.3 Your Money or Your Life (YMYL) Pages. Указанные в нем категории были изменены, изменился также и порядок их представления.  


Первое место заняла категория «Новости и текущие события» («News and current events»), что может означать, что Google повысил приоритет этой категории среди других источников YMYL контента. Сразу же вспоминается нашумевшая в западном SEO-сообществе история про то, как после последнего июньского апдейта алгоритма (June 2019 Core Update) сайт английской газеты Daily Mail потерял половину трафика из Google. Обращает на себя внимания также тот факт, что собственно новости выделены из более общей категории «Новостные статьи или публичные/официальные страницы, важные для информирования населения» («News articles or public/official information pages important for having an informed citizenry»).
Оставшаяся без новостей часть этой категории вместе с категорией «Правовая информация» («Legal information pages») сформировали новую категорию «Гражданское право, правительство и закон» («Civics, government, and law»), расположившуюся на втором месте списка. Кстати, июньский апдейт Google вместе с новостными ресурсами основательно «потрепал» и информационные сайты правовой сферы.
Категория «Покупки и финансовые операции» («Shopping or financial transaction pages») превратилась просто в «Покупки» («Shopping»). Судя по новому описанию этой категории, информационный контент, связанный с потребительской сферой, также является YMYL контентом наряду с онлайн-магазинами и другими страницами, где совершаются финансовые онлайн-операции.  Думаю, этот факт стоит учесть владельцам информационных ресурсов в этой сфере – обзорников, отзовиков и т.п.
Категория «Медицинская информация» («Medical information pages») оказалась переименована в «Здоровье и безопасность» («Health and safety»). Налицо явное расширение профессиональной медицинской темы на более общую информационную тему о здоровье в общем. Сразу же вспоминается нашумевший «медицинский» апдейт («Medic Update»), и не исключено, что можно ожидать повторения, затрагивающего большее количество информационных ресурсов данного направления.
Ну, и внизу списка появилась новая категория «Группы людей» («Groups of people»), судя по ее описанию, затрагивающая информационный контент, связанный с различными социальными группами. Есть повод задуматься владельцам различных «сообществ по интересам».
Также обращает на себя внимание тот факт, что в качестве носителя контента YMYL в новой редакции Руководства указаны не только страницы («pages»), но и темы («topics»), что может означать то, что страница может быть признана носителем YMYL контента в том случае, когда под определение YMYL попадает только часть ее содержимого, не являющееся основной целью страницы.  
Собственно, из всего вышеперечисленного можно сделать вывод, что количество ресурсов (особенно информационных), попадающих под определение носителей YMYL контента, может значительно увеличиться, а, значит, их владельцам придется основательно задуматься о соответствии их ресурсов обозначенным в пункте 3.2 Expertise, Authoritativeness, and Trustworthiness (E-A-T) Руководства Google для асессоров принципам E-A-T («Экспертность, Авторитетность и Надежность»). 
Анонимный или скопированный без указания авторства контент, размещенный на ноунейм сайтах теперь, похоже, будет иметь ничтожно мало шансов на хорошее ранжирование в YMYL темах. У контента должны быть обозначены конкретные авторы, равно как у сайта – владельцы. Даже если на сайте преобладает user-generated контент (форумы, Q&A сайты и т.п.), пользователи, его генерирующие, должны иметь индивидуальные профили, и чем больше в профиле будет информации, подтверждающей экспертность пользователя в данной теме, тем лучше. 
Не случайно абзац, добавленный в пункт 5.2 Very Positive Reputation Руководства Google для асессоров свидетельствует о достаточно высоких требованиях к уровню экспертизы создателей контента, особенно в профессиональных областях, таких как медицина:




Кроме того, о качестве и актуальности контента тоже придется позаботиться. Собственно, раскрытию понятия высококачественного основного контента (Main Content или МС) как раз посвящено еще одно значимое изменение в Руководстве Google для асессоров – значительное увеличение информации в пункте 5.1 Very High Quality MC:
 


В обновленной версии появилось описание признаков качества для новостного, художественного и информационного типов контента. Подчеркнуты важность оригинальности, точности, полноты, соответствия профессиональным стандартам, а также упоминания первоисточников в случае необходимости. 
В общем, чтобы не стать жертвой очередного апдейта Google, многим сайтам, похоже, придется основательно позаботиться о качестве своего контента и об авторитетности его авторов. Ну, или продолжать уповать на то, что прошлогодние слова сотрудника Google Джона Мюллера от том, что Google не смотрит на репутацию авторов контента при ранжировании сайта все еще остаются актуальными. Впрочем, апдейт покажет.

понедельник, 27 мая 2019 г.

Система аналитики Finteza – незамыленный взгляд

Пожалуй, мало мимо кого в русскоязычном сеошном мире прошла новость о продаже Сергеем Петренко после 18 лет владения легендарного Сёрча – старейшего и популярнейшего в сеошной среде форума вместе с новостным сайтом. Покупателем стала практически никому среди аудитории форума до того неизвестная компания Metaquotes. И практически сразу же после объявления Сергеем Петренко о сделке, в подвале Сёрча появилась реклама сервиса веб-аналитики Finteza. Как многолетний супермодератор Сёрча и колумнист сёрчевской новостной рассылки я не мог пройти мимо этого продукта, который показался мне по сути единственной ниточкой, связывающей нового владельца форума с сеошным миром.
На главной странице сайта аршинными буквами громко заявлена миссия данного продукта: «Комплексная аналитика и управление рекламой. Анализ трафика вебсайтов и мобильных приложений, изучение поведения пользователей, выявление бот-трафика и создание воронок конверсий». Звучит внушительно, и первым делом после регистрации я добавил туда свой SEO-блог, разместив выданный код на его страницах. При регистрации сайта несколько удивила смесь русского и английского языка в названии полей регистрационной формы:
Письмо о регистрации пришло также на английском. На мой взгляд, это смешение языков немного неудобно для пользователя системы.
Итак, зарегистрировав в системе свой сайт и разместив на нем выданный код счетчика, начинаем получать статистику по пользователям сайта. Набор отчетов в общем-то вполне стандартен – количество посетителей, просмотров и сессий; сайты, с которых они пришли с отдельными срезами поисковикам и соцсетям; срезы по типам устройства, операционным системам, браузерам, странам, просмотренным страницам и т.п. Несомненным плюсом системы является то, что эти срезы можно комбинировать, создавая довольно сложные фильтры. 
Естественно, отсутствуют самые интересные с точки зрения SEO-специалиста отчеты – по поисковым запросам. С тех пор как поисковики стали шифровать текст запросов в реферрере, эту статистику не сможет получить ни один сторонний счетчик. Лично с моей точки зрения очень полезной была бы система аналитики, которая смогла бы в своих отчетах объединить данные по поисковых запросах из Яндекса и Google. Конечно, пользователю для этого ей пришлось бы дать доступ к счетчикам Метрики и Analytics, откуда система могла бы импортировать нужные данные и интегрировать в свою статистику, но думаю, оно того стоило бы. Так что могу лишь пожелать разработчикам Финтезы подумать в этом направлении. Если, конечно, это технически и организационно возможно. Потому как, если вдруг получится агрегировать данные от двух крупнейших поисковиков Рунета и совместить их со своей статистикой, то это будет просто бомба для сеошников. 
Довольно любопытным мне показался отчет о качестве трафика, которое Финтеза оценивает по своим внутренним критериям. С чувством глубокого удовлетворения я обнаружил, что трафик у меня на блоге исключительно качественный (аж на 93 полновесных процента) ☺
Но, собственно, статистика посещений не есть главная функция Финтезы. Главная функция, как мы помним, – аналитика трафика.
Из аналитических возможностей статистических отчетов, несомненно, стоит отметить события и воронки конверсий. Для отслеживания конкретного события (заполнение формы, нажатие на кнопку, клик по ссылке, загрузка страницы и т.п.) необходимо будет, зарегистрировав его в системе, разместить полученный код треккера в соответствующем месте кода на страницах своего сайта.
Далее из различных событий можно строить воронки конверсий. В качестве этапов воронок можно также добавлять также факт посещения пользователем определенной страницы. На мой взгляд, получился достаточно полезный и, главное, удобный инструмент. Так, например, я узнал, что страницу «Услуги» на моем блоге посетило всего двое из семидесяти (т.е. примерно 3%) пользователей, прочитавших последнюю статью, да и то один из этих двоих оказался ботом:
 
Мотаю на ус, что надо основательно подумать над привлечением пользователей блога на страницу «Услуги».
Через пару дней после регистрации в системе пришло письмо (опять-таки на английском) о том, что я могу создать на своем сайте рекламную зону и собирать статистику показов баннеров. Никаких баннеров у меня на сайте не было, но ради эксперимента почему бы и не поставить? Доступна дюжина размеров от кнопки 88х31 до полноразмерного баннера 468х60, но можно задать и свой. Я выбрал полноразмерный и решил водрузить туда баннер самой Финтезы. Жаль, на их сайте я не нашел партнерской программы, и мне пришлось вырезать баннер из шапки Серча и подгонять под нужный размер, чтоб начать гнать на Финтезу траффик со своего блога совершенно безвозмездно. ☺
После создания рекламной зоны размещаем выданный код у себя на сайте в том месте, где планируется показ баннера.
А затем уже можно создавать рекламную кампанию. Ее можно таргетировать по странам и территориям, юзер-агентам, задать расписание показа.
Также можно добавлять и другие различные условия по таргетингу аудитории – пол, язык, диапазон ip адресов, привязка местоположения к определенным географическим координатам и т.д. и т.п. – в общем-то, довольно богатый набор критериев. 
Созданную рекламную кампанию связываем с созданной рекламной зоной.
Затем для созданной рекламной кампании нужно загрузить баннеры. Для этого создаем рекламную группу, и уже в неё загружаем заготовленный с такими трудами баннер.
В общем-то всё. Теперь не забываем активировать рекламную кампанию с помощью соответствующего слайдера, и наслаждаемся появлением рекламного баннера у себя на сайте ☺
Ну, а затем занимаемся любимым делом вебмастера – рефрешим статсы ☺. Ну, а статсы, как я уже отмечал выше, в системе достаточно мощные. К срезу статистики по конкретной рекламной зоне можно применять всевозможные комбинации фильтров, а также отслеживать события и строить воронки. К примеру, я узнал, что CTR финтезовского баннера в шапке моего сайта составляет 9,68%, причем трафик на 99% качественный. Эх, Финтеза, почему у тебя еще нет партнерской программы? ☺
В общем, на мой взгляд, получился достаточно симпатичный и гибкий инструмент. Если б еще решили вопрос с импортом данных о поисковых запросах из Метрики и Аналитикса – цены бы ему не было.

понедельник, 15 апреля 2019 г.

Исследуем новые операторы before: и after: в Google

9 апреля 2019 года Google в официальном твиттере разработчиков поиска порадовал неожиданной новостью – вводом новых операторов поиска before: и after:.
В последнее время, что в Google, что в Яндексе, наблюдается отчетливая тенденция на урезание поискового функционала (вспомнить хотя бы недавнюю отмену Google оператора info:), а тут вдруг случается его расширение. Новые операторы по сути являются некоторыми аналогами яндексовского оператора date: и позволяют фильтровать поисковую выдачу в определенные временные периоды по дате последнего изменения документов (в терминах Google, причем довольно непрозрачных, как мы убедимся далее). Подобные фильтры бывают полезны при решении ряда задач SEO-аналитики, и, в целом, отрадно, что в Google теперь тоже есть подобная возможность.
Однако, к моему сожалению, в данном случае не произошло унификации поисковых функционалов двух крупнейших поисковиков Рунета, и, хотя с помощью операторов before: и after: в Google и date: в Яндексе можно решать аналогичные задачи, однако логика применения операторов все-таки различается. Так, например, для того, чтобы найти релевантные запросу документы за определенную дату в Google, в отличие от Яндекса, придется сооружать конструкцию из двух операторов. И, как мы убедимся далее, все равно не получается найти корректного решения.
В данной статье я постараюсь исследовать некоторые свойства новых операторов Google, взяв в качестве «подопытного кролика» сайт своего SEO-блога
На момент написания статьи Google показывает в выдаче 63 страницы с этого сайта, причем, в силу небольшого числа страниц это число нетрудно проверить, просто сосчитав количество результатов на странице, с настроенной выдачей по 100 результатов:
Однако применение к результатам поиска операторов before: или after: с заведомо покрывающими все возможные результаты значениями, оставляет в выдаче только по 40 результатов:
И действительно, можно найти проиндексированные страницы с сайта, применение к которым операторов before: и after: дает пустую выдачу. Например:
Получается, что не все страницы имеют дату с точки зрения операторов before: и after: (а в данном случае это без малого четверть страниц с сайта), даже не смотря на наличии даты в сниппете. Этот факт следует учитывать при анализе выдачи с использованием данных операторов.
Теперь попробуем составить конструкцию для поиска документов в Google за определенную дату.   Для главной страницы исследуемого сайта Google показывает на момент написания статьи в сниппете дату 11 февраля 2019 года (что хорошо видно из первого сниппета статьи). Главная страница находится в выдаче, если в эту дату взять в качестве значения как для оператора before:, так и для оператора after:
Если же для оператора before: дату уменьшить на один день, а для оператора after: дату увеличить на один день, то главная страница исчезает из выдачи, что явно свидетельствует о том, что ее дата с точки зрения этих операторов – именно 11 февраля 2009:
Причем, отметим, что количество страниц выдачи в обоих случаях уменьшается на две (в первом – с 35 до 33, во втором – с 7 до 5). Логично предположить, что с датой 11 февраля 2019 года на сайте по мнению Google должно находиться две страницы.
Попробуем сконструировать запрос, скомбинировав оба оператора с одинаковым значением 2019-02-11. Ожидаемо видим в выдаче главную страницу, однако здесь что-то явно не так. На втором месте страница с другой датой в сниппете, а всего результатов 63 – как если бы операторы к запросу не применялись:
Получается, что подобная конструкция (когда значения операторов совпадают) является некорректной. Ведь такая же картина наблюдается, если выбирать такие значения операторов before: и after:, которые задают пустой временной промежуток:
Каким же тогда должен быть запрос, которым можно найти выдачу в Google за определенную дату? Искомый результат получаем, если увеличить на один день значение оператора before: или же увеличить на один день значение оператора after:, то есть расширив фильтр с одного дня на два. И вот они, те самые два искомых документа от 11 февраля 2019 года:
Однако, в данном случае, нам просто повезло, что на сайте нет документов, датированных днем ранее или днем позже, которые тоже должны были попасть в эту расширенную на два дня выдачу. В чем мы можем убедиться, изменив границы двухдневного окна на период, когда есть документы, датированные идущими подряд днями:
Итого имеем, что на текущий момент задачу поиска документов за определенный день в Google с помощью новых операторов решить корректно, увы, нельзя. В отличие от Яндекса, где на подобную задачу как раз и ориентирован оператор date:.
И в заключение хочется обратить внимание на довольно странную логику определения даты документа в Google. Так, главная страница исследуемого сайта на момент написания статьи имеет дату 11 февраля 2019, что показывается в сниппете и подтверждается выдачей, сформированной с помощью операторов before: и after:. Однако в том же сниппете мы видим фрагмент текста, который относится к новости с гораздо поздней датой:
 
Почему же Google выбрал в качестве даты страницы дату новости двухмесячной давности при том, что страница явно проиндексирована не далее, как несколько дней назад, причем ее контент не один раз за это время изменился, остается только догадываться.
В общем, в сухом остатке имеем, что данное нововведение Google несомненно достойно того, чтоб его приветствовать, однако при его использовании для задач SEO-аналитики необходимо учитывать определенные нюансы.

Blog Archive

Технологии Blogger.