Текстовые факторы ранжирования. Оптимизация контента. Спам.
Текстовые факторы ранжирования. Оптимизация контента. Спам.
Текстовые факторы ранжирования – это то содержимое html-страниц на сайте, которое оценивает с помощью специальных формул поисковик. Робот сканирует страницу, выделяет ключевые слова, считает их делает вывод: будет ли полезна информация пользователю, стоит ли предлагать эту страницу в выдаче. То есть определяет текстовую релевантность – соответствие содержимого html-страницы запросу пользователя. Текстовая релевантность учитывается наряду с другими факторами ранжирования: ссылками, поведением пользователей на сайте и др. (мы говорили о них в теме про работу поисковых систем). Поэтому важно понимать, как оцениваются текстовые факторы поисковиком и что можно сделать, чтобы улучшить (оптимизировать) их.
Текстовая релевантность
Для расчета текстовой релевантности поисковые системы используют несколько методик. Все они основаны на подсчете ключевых слов (анкоров) в тексте страницы.
Самый популярный метод – определение TF-IDF, расчет веса слов в тексте по формуле:
,
где TF – количество раз, когда ключевое слово (КС) встретилось в тексте / количество всех слов в тексте,
IDF - важность (редкость встречаемости) КС (общее количество документов / количество документов, в которых встречается это КС)
Эта формула оценивает, насколько термин (ключевое слово) важно для конкретного документа относительно остальных документов в коллекции поисковой системы. То есть, чем чаще термин встречается в документе по сравнению с остальными проиндексированными поисковиком документами, тем лучше.
Например, вас интересует как чинить форсунки Delphi. Тогда поисковик, вероятно, в начале выдачи покажем вам статью с подробным описанием, что такое форсунки Delphi и как их чинят. Потому что благодаря формуле TF-IDF, робот посчитал ключевые слова («чинить форсунки Delphi) в этом тексте, соотнес с другими тематическими документами в своей коллекции и решил, что в этой непопулярной теме, именно эта статья является «экспертной». И предложил ее вам на ваш запрос.
Другая методика расчета текстовой релевантности документа – алгоритм ВМ25.
Как видим, числитель в формуле представляет знакомая уже TF – частота встречаемости термина в документе. Также имеет значение показатель |D| - это длина документа, и avgdl – средняя длина документа в коллекции. И в формуле учитывается знакомый нам IDF – редкость термина.
Отличие этого алгоритма в том, что он рассчитывается отдельно по всем зонам документа. Не только по самому тексту, но и по заголовку (title) и описанию (description) документа, по заголовкам h1- h6 и выделениям внутри текста, и даже по текстам исходящих ссылок и по URL-адресу документа. И таким образом получается, что по формуле ВМ25 даже 4-5 ключей (анкоров) в тексте бывает достаточно для хорошего результата. Просто они должны быть расположены в стратегически важных местах.
Важно: важно не просто насыщать тексты на сайте ключами, но и располагать их в названии документов, заголовках, использовать в ссылках и URL, включать в description. Приоритетные ключевые слова лучше ставить в начало заголовка. Особое внимание уделите заполнению и включению анкоров в title и description, потому что именно они формируют сниппет. А привлекательный для пользователя сниппет – гарантия того, что он посетит сайт.
скрин – урл, тайтл, дескрипшен. Сниппет
Оптимизация контента. Текстовый спам.
Как видим, релевантность текста запросу определяется формулами, которые нацелены на анализ ключевых слов. Казалось бы, просто включаем в любой текст на сайте максимум пользовательских запросов – и вуаля, сайт в ТОПе. Раньше так и было. Но сейчас, если просто «нашпиговать» текст ключевыми словами, это вызовет скорее обратный эффект – сайт не только просядет в выдаче, но и попадет под поисковые фильтры за спам.
Почему? Поисковые роботы сильно «поумнели» и стали предпочитать богатый на семантику (максимально полно раскрывающий тему и отвечающий на запрос пользователя) контент. За превышение оптимального числа вхождений ключевых слов (это число, кстати, никто точно не знает), они помечают текст как спам. То же самое делают асессоры. Кроме того, когда пользователь переходит на страницу, не отвечающую его запросу, он быстро уходит и
Важно: Высокая плотность ключей, «переоптимизация» текста, создает эффект прессинга и ухудшает пользовательский опыт. Формулы расчета оптимального количества вхождений анкоров в текст не существует, но есть данные, что Google и Яндекс настораживают тексты с плотностью ключей выше 7-9% (не только прямые вхождения, но и словоформы). Переспам страницы ведет к наложению фильтров, бану, запрету на индексацию или исключение из индекса.
Как повысить текстовую релевантность, чтобы не попасть при этом под фильтры? Оптимизировать вхождения анкоров в текст. Для этого
- употребляйте ключи в тексте органично, используйте словоформы, избегайте неестественных конструкций;
- включайте синонимы и слова, которые связаны с тематикой материала, в свой текст;
- прописывайте ключевые слова в анкоре как можно ближе друг к другу;
- форматируйте текст с помощью заголовков, выделений, списков;
- располагайте ключи как можно ближе к началу текста, включайте их в название текста, в заголовки, title, description;
- попробуйте прописывать атрибуты ALT для изображений, в том числе, включая в них ключевые слова.
Но не только переоптимизация ключей в тексте или их неестественное употребление портит пользовательский опыт. Поисковые системы оценивают и другие параметры документа:
- уникальность
С определения уникальности текста поисковый робот начинает анализ текстовой релевантности. «Заимствованные» тексты легко распознаются и могут даже не попасть в индекс. Некоторые оптимизаторы прибегают к функции автоматически сгенерированного текста. Такие будут уникальными на 100%. Но это тоже текстовый спам.
Важно: Используйте для наполнения сайта авторские тексты, профессиональный рерайтинг и копирайтинг. Не забывайте проверять уникальность текстов, используя, например, text.ru/, content-watch.ru. Если текст вынужденно неуникальный (описание товара, технические характеристики), работайте над добавочной ценностью: добавляйте фото, отзывы и т.п. Защищайте тексты на своем сайте от плагиата, отправляя их в раздел «Оригинальные тексты» в Яндекс.Вебмастер и публикуя в социальной сети Google +.
скрин? как защищать тексты?
- объем текста
Объем текста напрямую на релевантность не влияет, но он задает параметры TF-IDF, а они отражаются на выдаче. Google и Яндекс не указывают оптимальный объем текста, но в среднем этот показатель составляет от 1 до 4 тыс. знаков, в зависимости от тематики и целей страницы. Можно опираться на объемы текстов конкурентов из ТОПа. Необходимый минимум – хотя бы 500 символов на странице, иначе она даже может не попасть в индекс.
Важно: Доказано, что пользователи плохо читают длинные тексты, особенно без форматирования. В то же время объемные документы лучше ранжируются Google. Попробуйте разбить длинный текст на два и указать в публикациях ссылки друг на друга (сделать перелинковку). Если у вас на каких-то страницах недостаточно контента (менее 500 символов), подумайте, какой контент туда можно добавить.
- наличие ошибок
Ошибки в текстах ищут асессоры. Google в своей инструкции асессорам говорит, что качество материалов оценивается как низкое, «если на его создание не потрачено достаточно времени, сил и знаний». И ошибки в лексике, грамматике, орфографии – лучшее тому подтверждение. Тексты с ошибками вызывают раздражение пользователей и ухудшают ранжируемость сайта.
- актуальность и полезность
Люди терпеть не могут тратить время на бесполезный текст «ни о чем». Поэтому общие, не несущие смысла фразы, общеизвестные факты и контент, размещенный ради контента (а не для людей) приводит к ухудшению пользовательских факторов. Помимо сигналов поведения пользователей (быстро покидают страницу, например), поисковые системы анализируют и метки асессоров – реальных людей, которые присваивают каждому документу метку с оценкой его релевантности – может текст быть полезным пользователю или нет. И все это влияет на позицию сайта в выдаче.
Поисковые системы анализируют поведение пользователей на сайте и видят, как быстро пользователь покидает страницу. Кроме того, над оценкой полезности и актуальности материала трудятся реальные люди – асессоры. Они
Что касается актуальности, то устаревшая информация, особенно в сфере новостей и технических новинок, провоцирует недоверие к сайту.
Важно: Не нужно стараться всеми силами быстрее попасть в индекс, размещая на страницах сайта набор слов с ключами. Сосредоточьтесь лучше над качеством наполнения сайта. Контент и сам сайт должны отвечать модели EAT (expertise, authoritativeness, trustworthiness) – компетентность, авторитетность, достоверность. В противном случае вы получите ухудшение поведенческих факторов и понижение сайта в выдаче.
Итого: SEO оптимизация текстовых факторов состоит в том, чтобы сделать контент на сайте 1. Полезным пользователю 2. Полезным для продвижения. И обе эти вещи взаимосвязаны. Просто насытить бесполезный неактуальный текст ключевыми словами и ждать высоких позиций в ТОПе – не вариант. Это приведет только к падению пользовательских факторов и попаданию под фильтры. Правильная стратегия – выделить семантическое ядро и размещать на сайте такие материалы, которые будут включать в себя грамотно размещенные ключевые слова (поисковые запросы) и в то же время действительно будут полезными для пользователей.