LSI-текст или SEO-текст? Останется только один

Латентно-семантический анализ был запатентован в далеком 1988 году, так что в SEO, которое уже не первый год умирает, не произошло ничего нового. Об LSI-текстах активно заговорили года 2-3 назад, когда поисковики начали свирепствовать, выкатывая новые и новые апдейты алгоритмов. В 2015 году компании начали повально экспериментировать с LSI.

О том, как и зачем создавать LSI-тексты сегодня для SEO завтра, рассказала Наталья Кирик из WordFactory.

 

 LSI-текст-или-SEO-текст-Останется-только-один

Один из самых-самых FAQ, который нам не задавали до 2015 года, звучит так:
— Вы делаете LSI-тексты?
— Что???

 

LSI — латентно-семантический индекс

LSI позволяет поисковикам анализировать тексты на странице с точки зрения их релевантности тематике (по ключевым словам) и рекомендовать читателю наиболее подходящие (содержащие максимальное количество ключевых слов, но использованных в тексте без потери смысла и переспама).

Например, вы ищете в поисковике «LSI-текст». Робот найдет сотни статей, в том числе с одноименными названиями компаний, аббревиатурами терминов из других отраслей науки. На первых местах в выдаче будут все тексты, связанные с LSI-копирайтингом и SEO. А корпоративные сайты и информация о терминах из других отраслей будут где-то на 101-й странице.

При этом SEO-текст формата 2009 года с высокой плотностью ключевых слов, часто не относящихся к теме статьи, в большинстве тематик будет ниже в выдаче, чем качественный LSI-текст. Мы говорим «в большинстве тематик», потому что на сегодняшний день в ТОПе всё еще есть сайты с SEO-текстами и с плотностью ключевых слов 50%.

А теперь научный подход.

Ольга Кубрак, руководитель студии интернет-маркетинга Gorde:

LSI-тексты — это тексты, посвященные тематике ключа, в которых используются естественные словоформы и синонимические слова/фразы к продукту или услуге, который мы хотим продать. Например, когда в тексте встречается не только «орбитрек», но и «эллиптический тренажер».

Алексей Чекушин, SEO-эксперт Kokoc.com:

Есть LSI в классическом смысле — сингулярное разложение терм-документной матрицы, которое уменьшает ее размерность до заранее выбранного числа k. Таким образом, мы разбиваем всю нашу коллекцию на k тематик и можем говорить о принадлежности термина (слова) к той или иной тематике. Для интересующихся предлагаю прочитать статью об LSI на habrahabr. В «бытовом» смысле, или применительно к SEO LSI — это использование тематических слов при написании текстов.

В SEO есть три основных подхода к этому:

  1. Использование подсветок.
  2. Частотный словарь по ТОПу.
  3. Анализ с использованием всей коллекции документов Яндекса.

Разберем их подробнее.

1. Использование подсветок. Это то, что лежит на поверхности, поэтому легко используется. Что подсвечивает поиск? Во-первых, синонимы. Во-вторых — геоуказание (для геозависимых запросов), в-третьих, — какие-то слова по теме.

Например:

 

Использование подсветок

Зеленой рамкой выделены синонимы, желтой – геоуказание, красной – дополнительные слова подсветки

Но сколько слов мы можем вытащить из подсветок? 3-5? Иногда чуть больше, но меньше десяти. Для полноценного написания тематического текста это не годится. Поэтому профессионалы этот способ не используют.

2. Частотный словарь — это когда мы составляем список слов, встречающихся в ТОПе и напротив каждого из них пишем, сколько раз оно встретилось. Чем больше раз слово встретилось в ТОПе (на большем количестве сайтов), тем более «тематическим» оно считается.

Этот метод уже значительно лучше простых подсветок. Если в ТОП-10 Яндекса содержатся качественные тексты, то метод показывает себя очень хорошо. Например, по запросу «пластиковые окна» почти все тексты хорошие и можно таким образом выделить необходимые для написания текста слова.

3. Анализ с использованием всей коллекции документов Яндекса. Он заключается в том, что анализируется не ТОП-10 и даже не ТОП-1000, а используется язык запросов Яндекса для работы со всей его коллекцией целиком. Этот метод дает существенно лучшие результаты, чем простой частотный словарь.

Вот пример анализа фрагмента текста по сложному для предыдущего метода запросу «сауна на двоих»:

язык запросов Яндекса 

Здесь, чем более «зеленое» слово, тем больше оно соответствует запросу. Чем более «красное» — тем меньше. Серым цветом обозначены служебные слова.

Как видите, текст почти полностью «красный». Неудивительно, ведь убрав из него слово «сауна», мы вообще не поймем, о чем речь. А вот как с этим же текстом справляется классификатор, построенный на базе анализа только ТОП-10:

анализ только ТОП 10 

Здесь многие нетематические слова стали зелеными. Происходит это потому, что качество текстов в ТОП-10 в целом низкое.

LSI позволяет показывать тематические статьи вашего сайта по синонимичным словам, которые могут быть даже не использованы на странице. Например, когда поисковые системы с легкостью понимают, что запрос «купить ноут» является релевантным для сайтов, предлагающих купить ноутбук/компьютер. То же касается «купить мобилку»: робот может выдать сайты, продвигающиеся по запросу «купить мобильный телефон».

Часто встречаются в поисковой выдаче синонимы, не имеющие одинакового корня в слове.

Благодаря такому понятию, как LSI, поисковые системы очень быстро улавливают новые тренды различных неологизмов и могут формировать более релевантную поисковую выдачу, отвечая на потребности пользователя. Эту систему практически можно назвать искусственным интеллектом.

Как сформировать LSI-ядро для текста?

  1. Анализируем запросы читателей: что ищут те, кто интересуются вашей тематикой (например, «как узнать, что мой кот хочет меня убить», «как узнать, что мой кот любит меня»).
  2. Анализируем аналогичные сайты: смотрим, что уже сделано, и делаем лучше, тщательнее, детальнее.
  3. Анализируем статистику, полученную в ходе контекстной рекламы (возможны нестандартные, неожиданные запросы, по которым вас находят клиенты или читатели).

LSI-текст и SEO-текст образца 2009 года: найдите отличия

В ТЗ на создание LSI-текста нет требований о плотности LSI-ключей. LSI-ключ — это, скорее, сигнал, что вот этот термин должен быть, этот вопрос важен для читателя и мы должны на него ответить.

Не требуется делать прямое вхождение LSI-ключевика — поисковик найдет его словоформу благодаря общему контексту отрывка, другим словам и терминам. Так, поисковик определит, показывать вам сайт компании LSI International или определение LSI на сайте контент-студии.

LSI: противопоказаний нет

Главный недостаток методики, о котором говорят эксперты, — цена. Для аналитики требуются соответствующие ресурсы, специалисты и время. Правильный LSI-текст стоит дороже обычного SEO-текста. Для полного раскрытия темы часто нужно не менее 10 000 символов, по сравнению со стандартными 2000 знаков без пробелов для SEO. Да и написать лонгрид предметно, без воды, могут только авторы с соответствующей специализацией (профильное высшее образование, опыт работы по специальности), а их услуги стоят дороже.

Самые требовательные специалисты утверждают, что LSI — соревнование с лучшими, попытка их догнать, но не перегнать.

Виталий Подовжний, SEO-специалист Morgenn Group:

Идея LSI в том, чтобы на основе контента, который ранжируется в ТОП-10, сделать выводы о наиболее упоминаемых словоформах основных ключевых слов, а также найти сопутствующие ключевые запросы, которые необходимо упомянуть для полноты ответа для робота поисковой системы.

Работа над контентом в SEO часто поточная, поэтому формировать ТЗ вручную слишком долго. Так люди и пришли к автоматизации через LSI-анализ, который дает ответы на вопросы, какие ключи и в каком объеме нужны.

Проблема в том, что этот метод приводит к модели «Ахиллес и черепаха» (одна из апорий древнегреческого философа Зенона). Мы догоняем тех, кто в ТОПе, но перегнать или оторваться от них не сможем, так как наш контент построен на основе конкурентов и ничего дополнительно полезного или нового не добавляет.

С другой стороны, этот подход все же дает ТОП-10 по запросам, то есть и целевой трафик, а Яндекс все пропагандирует: дайте что-то большее, чем есть сейчас в интернете, и получите высокие позиции. Многие работают по принципу Парето — их устраивают те 80%, полученные за 20% усилий, потраченные на LSI.

LSI: почему это важно?

Мы уверены, что нет ничего лучше качественного текста, написанного на основании тщательной аналитики. Но образцовым можно назвать и текст, например, для интернет-магазина запчастей, написанный дипломированным инженером-машиностроителем или инженером СТО, хорошо структурированный, вычитанный профессиональным редактором.

По сути, собирая LSI-ключи для текста, SEO-эксперт делает то же, что и аналитик, собирающий данные для всестороннего раскрытия темы в статье. То же делает опытный эксперт, когда пишет всеобъемлющую статью на основании всего своего опыта работы по конкретной теме. Только он не говорит, что делает LSI-текст.

Поэтому, когда мы спросили у экспертов, работают ли они с LSI, получили кардинально противоположные ответы: «Да, активно работаем», «Нет, мы пишем качественные, предметные, детальные информативные статьи». При этом цель и у первых, и у вторых одна — качественный контент, отвечающий на вопросы читателя. Неудивительно, что в 2015 году мы выполняли ряд проектов для тематик, в которых сайты с LSI-текстами были в ТОП-10 своих категорий.

 

По материалам Netpeak

Советую также прочитать на gsi-pngs.ru:


2e001c21