суббота, 25 февраля 2023 г.

Про индексацию страниц пагинации

Мысли про пагинацию. Индексировать или не индексировать?

Считаю, что в случае списков (например, товаров в категории или статей по теме) для нормальной перелинковки конечных страниц просто необходимо позволять роботу проходить по ссылкам пагинации. При этом наличие страниц пагинации в индексе совершенно необязательно.

Сделать это можно двумя способами:

1) Директива canonical со всех страниц пагинации на первую страницу.

2) Мета robots со значением noindex, follow для страниц пагинации кроме первой.

Первый способ, на мой взгляд, предпочтительней. Про рекомендацию Google не использовать первую страницу пагинации в качестве канонической знаю, однако опыт подсказывает обратное. Но могут быть нюансы, когда поисковик игнорирует canonical, но массово выкидывает страницы пагинации из индекса как малоценные или дубли. Тогда использовать второй способ.

Закрывать пагинацию от индексации в robots.txt с помощью директив Disallow или Clean-param (в Яндексе, если пагинация задается get-параметром в URL) категорически не рекомендую.


суббота, 18 февраля 2023 г.

Google учит, как SEO ссылки расставлять

На днях Google обновил контент на англоязычной версии страницы документации по ссылкам.  

Интересно изменение заголовка страницы с "Make your links crawlable" на "SEO Link Best Practices for Google".

Среди прочего показался любопытным следующий момент:

As a fallback, Google can use the title attribute as anchor text if the <a> element is for some reason empty.

<a href="https://example.com/ghost-pepper-recipe" title="how to pickle ghost peppers"></a>

Честно говоря, не совсем понимаю, по каким причинам содержимое тега <a> можно оставлять пустым. Ведь в этом случае ссылка будет не видна пользователю. И еще более странным видится то, что в этом случае вполне легально содержимое атрибута title будет считаться анкором такой невидимой ссылки.

Еще один любопытный момент - плохими  обозначены так называемые "безанкорные" ссылки, которыми сеошники так любят "разбавлять" анкор-файлы:

Bad (too generic):

<a href="https://example.com">Click here</a> to learn more.

<a href="https://example.com">Read more</a>.

Learn more about our cheese on our <a href="https://example.com">website</a>.

We have an <a href="https://example.com">article</a> that provides more background on how the cheese is made.

А хорошими ссылками обозначены как-раз таки акорные, главное, чтоб были не слишком длинные.


среда, 15 февраля 2023 г.

PageRank - течет или не течет?

Удивительно, но до сих пор немало сеошников верят в то, что статический вес страницы рассчитывается по классической формуле PageRank образца 1997 года, и что он может куда-то там утечь по ссылкам со страницы.

Меж тем давным-давно уже ходит байка про бывшего сотрудника Гугла, заявившего, что аж с 2006-го года классический алгоритм PageRank заменен на некий более экономный в расчетах. Что в общем-то вполне логично. Но так как новой формулы никто не знает, то многие предпочитают верить в старую )

В общем, рекомендую в работе сосредоточиться на том, кто и как ссылается на вас, а не на том, сколько ссылаетесь вы. Ну, конечно, при условии, что ссылаться надо все-таки на хороших ребят )


вторник, 7 февраля 2023 г.

О геозависимости запросов с топонимом

Увидел тут в одном чате дискуссию про то, какими следует считать запросы, содержащие в себе топоним - геозависимыми или геонезависимыми.

Здесь все зависит от того, что считать геонезависимостью. Независимость выдачи по запросу от региона пользователя или вообще от какого-либо региона. 

На мой взгляд, второе определение будет более корректным. Запросы с топонимами зависят от региона, который в них указан, и поэтому их следует считать геозависимыми.

Да и сам Яндекс в своей статье "Поиск с учётом  региона" особо оговаривает случай, когда город указан в запросе, в подразделе о результатах регионального поиска, т.е. геозависимых.


пятница, 3 февраля 2023 г.

"Неиспользуемые" факторы ранжирования Яндекса

Итак, продолжаем копаться в файле factors_gen.txt. Мысли по поводу факторов с пометкой TG_UNUSED.
Многие комментаторы априори записали такие факторы в разряд неиспользуемых. Но я думаю, что не все так просто.
В описании фактора FI_MATRIXNET читаем: "Ко всем факторам применяется MatrixNet - формула (TG_UNUSED - чтобы предотвратить вхождние в какие-либо формулы)", в описании фактора FI_URL_SHOWS_WITH_NEXT_PAGE_CLICKS_P10 еще интереснее: "Фактор используется в SelectionRank. TG_UNUSED: не должен входить в формулы во избежание обратной связи".
Итак, получается факторы с такой пометкой не используются в Матрикснете из-за опасности положительной обратной связи. Но вполне себе могут использоваться в других частях модели ранжирования. В том же SelectionRank - осталось только понять, что это такое ). Или, например, в антиспаме. Или в добавке из полиномов, которая точно была раньше, и, возможно, есть и сейчас - предлагаю присмотреться к описанию факторов FI_FULL_POLYNOM, FI_FAST_POLYNOM, FI_FILTER_POLYNOM, FI_META_POLYNOM.
Так что я бы не сбрасывал такие факторы со счетов. Кстати, интересно, что такую пометку имеет фактор FI_PAGE_RANK.

среда, 1 февраля 2023 г.

Как сеошники Матрикснет вскрывали

Наверное, только совсем далекий от интернета человек еще не слышал о недавней утечке данных из Яндекса. Естественно, такое событие не могло не поднять ажиотаж на рынке SEO. Многие сеошники начали искать, чем бы можно поживиться в 40+ гигабайтах утекших данных. Первым объектом стал файл factors_gen.txt со списком 1922 факторов ранжирования. Добыча была, прямо сказать, не слишком жирная, так как кроме краткого описания факторов в списке ничего не было. И понять, насколько важен тот или иной фактор, не представлялось возможным. Можно было только порефлексировать типа «Гляди-ка, догадались учитывать наличие цифр в URL, наверное в минус» или «Надо же, они считают количество заглавных букв в теге title».

Но потом один въедливый иностранец по имени Michael King опубликовал статью, в которой продемонстрировал некий файлик nav_linear.h. В нём некоторым факторам были сопоставлены некоторые коэффициенты, как положительные, так и отрицательные. Вот тут уже у сеошников образовалось широкое пространство для творчества. И постепенно этот мутный список с непонятной развесовкой факторов начал завладевать их умами. Почему-то они решили, что эти коэффициенты и есть самые что ни на есть настоящие веса факторов ранжирования и начали на их основе разрабатывать рекомендации по покорению топов поисковой выдачи Яндекса. И уже на полном серьезе от разных лиц зазвучали призывы отказываться от доменов в зоне .ru, так как в списке это отрицательный фактор. И менять их на домены в зоне .com, так как этот фактор обозначен, как положительный. Правда совсем уж неудобные нестыковки комментаторы старались обходить стороной, и пока еще никто не призывал отказаться, к примеру, от использования в тексте всех слов запроса подряд, хотя в файле этот фактор имеет отрицательный коэффициент.

Списочек факторов с развесовками упорядочили и выложили на Github, однако вдруг в комментариях там отметился не кто иной, как Ден Расковалов, бывший сотрудник отдела качества поиска Яндекса. Он заявил, что "nav_linear.h has nothing to do with ranking web search results in Yandex search."

Ну, а окончательно паззл складывается, если сопоставить название взбудоражившего сеошные умы файла с коэффициентами – nav_linear.h – с названием одного из факторов – FI_NAV_LINEAR, отвечающим за классификацию неких «полунавигационных» запросов. Вот так вот. Один фактор. Про классификацию запросов. Вскрытие Матрикснета отменяется. Можно менять домены .com обратно на .ru )

Blog Archive

Технологии Blogger.