Домой / SEO / Основы машинного обучения для SEO-специалистов

Основы машинного обучения для SEO-специалистов

Все мы слышали термины «машинное обучение» и «обучаемые алгоритмы», но действительно ли мы их понимаем? Знаете ли вы, чему конкретно они могут обучиться и как они это делают? Если нет, то вам, как и любому SEO-специалисту и автору контента, будет полезно прочесть эту статью.

Для начала стоит напомнить, что алгоритм – всего лишь математический процесс. Не стоит ждать появления в ближайшие годы полноценного искусственного интеллекта. Однако математический алгоритм может выявлять определенные шаблоны развития событий и на основе анализа данных прогнозировать вероятность их наступления.

Виды процессов машинного обучения

В зависимости от целей разработчика, процессы машинного обучения могут выстраиваться по-разному. Даже в случае с поисковыми роботами процессы могут различаться. Наиболее распространенные подходы – машинное обучение на основе статистического мышления и машинное обучение на основе индуктивного мышления (не стоит удивляться терминологии – очевидно, что термин «мышление» не вполне применим к компьютерным программам. Тем не менее, в данном контексте общепринят именно такой термин).

Статистическое мышление

Статистическое мышление подразумевает сбор данных и прогнозирование вероятности наступления событий, которые наблюдались ранее. К примеру, если алгоритм со статистическим мышлением рассчитает, что в 80% наблюдаемых ранее случаев вороны оказывались черными, он сделает вывод, что и в будущем при наблюдении 80% всех ворон окажутся черными.

Индуктивное мышление

Индуктивное мышление сходно со статистическим в том, что оно также подразумевает формулирование выводов, но при этом целью его использования является подтверждение или опровержение определенных предположений. К примеру, у нас есть теория: собака в случае опасности станет кусаться. Программа с индуктивным мышлением соберет результаты испытаний и в зависимости от частотности наступления того или иного события либо подтвердит теорию, либо опровергнет ее.

Ни статистическое, ни индуктивное мышление не позволяют учитывать случайные события до тех пор, пока они не представляют значительный процент от общего числа наблюдаемых событий. Когда такое случается, выявленные схемы развития событий могут стать значительным фактором в статистической модели, тогда как в индуктивной модели они повлияют на результаты лишь косвенно.

Что это значит в контексте поисковых алгоритмов

Представьте, к примеру, что какой-то алгоритм разработан так, чтобы определять, насколько релевантны конкретные результаты поиска по отношению к конкретному запросу. Индикатором релевантности может служить, к примеру, показатель отказов. Если показатель отказов не превышает определенный порог, ссылка признается релевантной, что подтверждает точность работы алгоритма ранжирования. Это пример использования статистического мышления.

С другой стороны, алгоритм, разработанный для обнаружения проплаченных ссылок, может анализировать такие элементы, как страницы, проплатившие размещение ссылок на сайте продавца – это, с учетом других факторов, может позволить ему рассчитать вероятность наличия проплаченных ссылок и на вашу страницу на сайте того же продавца. После расчета первичной вероятности алгоритм затем проанализировал бы другие сигналы и факторы, которые подтвердили бы или опровергли его теорию.

Знаем ли мы наверняка, что поисковые системы действительно пользуются такими моделями в подобных случаях? Разумеется, нет. Это всего лишь один из множества возможных вариантов. Нам важнее другое – чему в обеих моделях мышления может научиться поисковый алгоритм? Со статистической моделью все довольно просто. Когда алгоритм решает, что 80% ворон будут черными, он может выстроить соответствующий прогноз; чисто вероятностный анализ, основанный на статистических данных. В случае с индуктивным мышлением процесс несколько более тонок — обычно в него включается ряд других сигналов, каждый со своим собственным значением и «весом». Этот процесс подразумевает выстраивание нелинейной кривой вероятности, которая может быть очень сложной.

В приведенном выше примере сигналами могут служить количество других сайтов, которые подозреваются в покупке ссылок у конкретного продавца, вероятностный анализ этих подозрений, история сайтов, включенных в анализ, и так далее. Объединив данные сигналы в общей математической формуле, алгоритм может высчитать значение вероятности нарушения сайтом правил, в случае превышения которого сайт будет подвергаться понижению рейтинга или блокировке.

Машинное обучение в поисковых запросах и алгоритмах определения рейтинга

Так чему же алгоритмы могут научиться, а чему – нет? Как уже говорилось выше, искусственный интеллект остается пока всего лишь отдаленной мечтой. Анализ же эмоциональной окраски, хоть многие и не воспринимают его всерьез, все же, по нашему мнению, возможен. К примеру, определить, являются ли поисковый запрос или фраза на странице окрашенными негативно или позитивно вполне возможно. Впрочем, более сложные понятия – такие, как сарказм, ирония или юмор – по-прежнему за пределами понимания компьютера. Но по поисковому запросу вроде [плохое обслуживание клиентов] поисковая система на первой же странице выдаст результаты с ключевыми словами «плохой», «некачественный» и «худший», содержащимися в основном теле текста, заголовке и/или URL страницы.

О программе qalv

Смотрите также

Продвижение неизбежно – бесплатными методами в топ

Продвижение неизбежно – бесплатными методами в топ

    Продвижение неизбежно – довольно звучное название очередного конкурса среди блоггеров, оптимизаторов и вебмастеров. …

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *