Агентство поискового маркетинга
Украины №1 с 2006 года

Спасибо! Ваша заявка успешно отправлена.
В ближайшее время с вами свяжется специалист.

Закрыть

Как писать для SEO-роботов?

Как писать для SEO-роботов?  - фото 1

Традиционный взгляд на копирайтинг заключается в том, чтобы писать для людей, а не для роботов. С другой стороны, если внимательнее присмотреться к рекомендациям поисковых систем, нельзя не заметить, что большинство из них все-таки рекомендуют учитывать тот факт, что текст будет анализироваться машиной. Стало быть, писать нужно не только для людей, но и для роботов в том числе?


О каких именно рекомендациях поисковых систем идет речь

Поисковые системы настойчиво продвигают семантическую разметку, в частности – shema.org. Были созданы и другие альтернативные варианты (большая часть из которых не прижились, но сам факт их наличия может рассказать о многом). Следовательно, отсюда можно уже сделать вывод о том, что необходимо сделать так, чтобы текст был понятен роботам. Причем, как можно видеть, в этом направлении постоянно прилагаются значительные усилия.

Помимо shema.org, поисковые системы рекомендуют максимально использовать нативную семантику, заложенную в стандарт HTML5, придерживаться четкой структуры текста, выделять важные моменты с помощью специальных тэгов, использовать подзаголовки и списки, и так далее и тому подобное. Значит, не достаточно просто написать текст, который будет понятен человеку?

Конечно, поисковые системы стремятся к тому, чтобы понимать текст на естественном языке как можно лучше. Но сказать, что Google понимает естественный язык, это явное преувеличение. Разработчики добились немалых успехов в этом направлении, но до идеала еще очень и очень далеко. Вот почему мы не можем просто писать для людей, не обращая внимания на роботов.


Исходная точка

Чтобы понять, что вообще происходит, нужно вернуться на шаг назад.

Изначально поисковые системы при анализе контента полагались исключительно на ключевые слова и ссылки. Ключевые слова в понимании поисковой системы – это не более чем набор символов, выстроенных в определенную последовательность. Обработка языка сводилась к тому, чтобы сделать морфологический разбор текста, дабы учесть небольшие вариации (словоформы).



Для того чтобы текст был релевантным запросу, нужно было сделать так, чтобы последовательность символов в поисковой строке пользователя и последовательность символов на целевой странице совпадали между собой, желательно – вплоть последнего символа. В какой-то момент, в качестве усовершенствования разработчики позволили системе учитывать синонимы. И это, пожалуй, все.

Такая система работала неплохо, но при этом особенно не впечатляла. Однако в последнее время мы видим существенный прогресс. Работа поисковой системы и сопутствующих сервисов сегодня действительно может впечатлить.


Что изменилось

Поисковые системы во главе с Google, за последний год значительно продвинулись вперед.
 
  • Качество поисковой выдачи стало существенно выше, что может заметить каждый активный пользователь интернета. Результаты ранжируются адекватно, практически никогда первые позиции не занимают сайты, которые того не заслуживают.
  • Расширенные сниппеты стали значительно лучше и охватывают больше тематик.
  • В поисковой выдаче появляются результаты, которые вовсе не содержат запрашиваемых ключевых слов (но при этом эти результаты всегда релевантные запросу);
  • Голосовые помощники и диалоговые системы очень быстро развиваются и набирают невероятную популярность в мире.
  • Многие сервисы Google в последнее время становятся доступными на очень многих языках.
  • Существенный прогресс был достигнут в области машинного перевода. Google Translate показывает превосходный результат при переводе почти с любого языка на любой другой.

Эти примеры наглядно показывают, что произошло что-то действительно существенное. А именно – был совершен серьезный прорыв в понимании машиной естественного языка. В настоящий момент тексты для поискового робота – это уже не просто последовательность символов, как было некогда, а что-то большее.


Граф знаний и семантика

По-видимому, все изменилось 1 июля 2018 года, когда Google запустил новую систему индексации Mobile First. Именно с этого момента начались самые интересные изменения, о которых идет речь. Можно предположить, что с большой долей вероятности, цель была не только в том, чтобы сделать акцент на мобильных устройствах, но заодно обновить фундаментальные основы анализа контента. Во всяком случае, результаты говорят именно об этом.



Основной всего является Google Natural Language – система анализа естественного языка, демоверсия которой доступна публично и которую можно протестировать на официальном сайте Google. Суть заключается в том, что Google строит граф знаний и вычленяет из текста сущности, после чего устанавливает связи между этими сущностями.

Таким образом, речь идет не о последовательностях символов, а об абстракциях более высшего порядка, которые позволяют роботу значительно лучше понимать естественный язык. Этот алгоритм многоуровневый и включает в себя несколько этапов:
 
  • Токенизация и разбиение предложения на отдельные термины:
  • Определение частей речи;
  • Определение лемм (словоформ);
  • Установление взаимосвязей между отдельными токенами;
  • Определение сущностей и предметная категоризация;
  • Разбор зависимостей;
  • Взвешивание важности каждого токена в предложении;
  • Определение интонации и эмоционального окраса;
  • Функциональный анализ высказывания (цель);
  • Определение типа контента (рецепт, инструкция, событие, рецензия);
  • Вторичное понимание текста на основе его структуры.

Что важно понимать – сущности никак не зависят от языка. Граф знаний Google строится таким образом, чтобы быть полностью независимым от слов. Собственно, слова (и, если разобраться более глубоко, даже визуальные образы) – это лишь символы, которые указывают на истинное значение (смысл), который в свою очередь является по большей части чистой семантикой (графом знаний).

Алгоритм основанный на семантике и анализе сущностей значительно эффективнее, потому что он позволяет системе искать релевантный контент игнорируя «шум». Под «шумом» понимаются особенности того или иного языка, орфография, стиль письма, конкретные ключевые слова и термины и тому подобное. Поисковая система становится в состоянии искать смысл, а не цепочки из символов. Этим объясняется существенный прогресс, который можно наблюдать в последнее время практически во всех сервисах Google.


Проблемы

Основная проблема, с которой приходится сталкиваться разработчикам поисковой системы при переходе на сущности и семантический разбор контента – это нехватка вычислительных ресурсов. Несмотря на то, что Google имеет огромные ресурсы, они не бесконечны, в то время как количество контента, которое требуется обработать, колоссально и, более того, увеличивается изо дня в день.

Другая проблема связана с особенностями машинного обучения и нейронных сетей. Дело в том, что искусственный интеллект, который используется поисковыми системами, работает таким образом, что любой результат его работы имеет вероятностный характер.

Когда поисковая система распознает на изображении какой-либо объект или определяет сущность в тексте, это означает, что существует высокая вероятность, что данный объект является чем-либо. Например, система может определить, что с вероятностью 44% в тексте речь идет о телефоне, но с вероятностью 36% речь идет о вертолете. При этом всегда существует ненулевая вероятность, что речь идет о любом другом объекте, который только может существовать в природе. Это приводит к тому, что у поисковой системы зачастую нет уверенности в том, о чем идет речь.

Наконец, учитывая все вышесказанное, можно сформулировать некоторые практические советы о том, как писать для роботов, чтобы продвигать контент легче и проще.

Как писать для роботов

 
  1. Соединяйте вопросы с ответами. Вопрос чаще всего является ключевой фразой для поиска. Но легко ли найти поисковой системе ответ в вашем контенте? Если вопрос находится в начале статьи, а ответ в середине, это может затруднить понимание. Робот может решить, что он просто не в состоянии найти ответ и с высокой долей вероятности ошибется. А это значит – данный контент не будет высоко ранжироваться, даже если он превосходного качества. Например: «Что такое SEO? SEO это – (и дальше идет четкое определение, после чего можно дать более развернутый ответ, а затем обозначить следующий вопрос)». Особенно это важно для расширенных сниппетов и голосового поиска.
  2. Избегайте неясных местоимений. Такие слова как «этот», «эти», «это», «он», «оно» могут существенно затруднить понимание текста. Особенно когда в одном предложении встречаются несколько местоимений, каждое из которых ссылается на разные сущности. Едва ли Google способен уверенно разбирать такие предложения со всеми вытекающими отсюда последствиями.
  3. Пишите проще. Можно стать слишком умным для поисковой системы. Чтобы этого не произошло, есть смысл писать контент так просто и ясно, как будто читать его будет ребенок. В MS Word существует функция определяющая удобочитаемость текста, которая может помочь.
  4. Устраняйте неоднозначности. Например, если речь идет о художественном произведении, в описании следует уточнить: о книге идет речь или об экранизации. Если об экранизации, то о какой именно. Также следует уточнять единицы измерения. Названия населенных пунктов зачастую имеют двойников, единицы измерения бывают самыми разными в различных ситуациях.

Понимая общее направление, в котором двигаются поисковые системы и некоторые особенности этого процесса, не так сложно создавать отличный контент с учетом поисковых роботов. Если говорить совсем коротко – для роботов следует писать как можно проще, чтобы упростить им задачу по разбору семантики и извлечению смысла. 
Оставить заявку