Кластеризация данных

При составлении семантического ядра для сайта одним из этапов будет кластеризация данных. Это процесс разбивки ключевых слов на группы (кластеры). Похожие ключи собираются в один кластер, а ключи в разных кластерах должны максимально отличаться. В результате вы получаете сформированную основу для создания контента для сайта.

Конечно, можно попробовать сгруппировать популярные поисковые запросы вручную, основываясь на логическом мышлении. Более грамотный подход — сравнивать не только слова, но и результаты поисковой выдачи по каждому ключу. Как это работает?

  • берутся для сравнения два запроса;
  • сохраняется список url из поисковой выдачи по каждому из них (достаточно первых 10);
  • сравнение на наличие совпадений;
  • при совпадении 3-5 результатов можно объединять ключевики в один кластер.

Автоматизированный процесс кластеризации данных позволяет сэкономить несколько недель рабочего времени. Такой подход помогает исключить ошибки человеческого фактора. Например, схожие между собой по тексту поисковые запросы могут относиться к разным сферам: один будет представлен на информационных сайтах, а второй (обычно со словом “купить”) — на коммерческих. В таком случае, поисковая выдача покажет совершенно разные ссылки, и продвигать эти запросы лучше отдельно, а не лепить все в одну статью.