paleh-yandeks

Новый поисковый алгоритм Палех Яндекс или знакомство с Жар-птицей

комментариев 49

Spread the love

Яндекс Палех

Друзья, я рада приветствовать вас на Blog-Bridge.ru. Вы, наверное, уже слышали новость о новом алгоритме Палех? Яндекс как поисковая система постоянно совершенствует свои алгоритмы обработки информации.

Вот и в этом году он анонсировал запуск нового алгоритма с креативным названием «Палех».

Я буквально недавно узнала эту новость и сразу обратила на это внимание. Думаю, что многие блогеры и веб-мастера тоже заинтересовались данной информацией.

Кроме того, мы ведь не так давно запустили новый эксперимент и я теперь полностью погружена в его реализацию.

Эксперимент «Комплексное продвижение блога». В ходе данного эксперимента вы узнаете: какими методами мы будем продвигать блог, какие из них окажутся эффективными и какие результаты они принесут; какой прирост посещаемости будет у нас ежемесячно; какими способами мы будем набирать подписную базу; как будут задействованы социальный сети; какими сервисами мы будем пользоваться для выполнения поставленных задач; и многое другое.

Ведь что мы сейчас наблюдаем в Сети? Сайтов, блогов и веб-порталов становится всё больше и больше, и вот чтобы давать максимально точные ответы на запросы пользователей, Яндекс начал использовать нестандартные подходы в обучении своих поисковых роботов.

Цель создания нового поискового алгоритма – улучшить качество предоставляемых ответов в выдаче для пользователей. Предыдущие поисковые модели подбирали информацию по соответствию ключевым словам. Новая модель на основе нейронных сетей умеет подбирать информацию по смыслу. Представляете? И это не фантастика!

Ещё одна интересная разработка нового метода поиска «Палех» — распознавание изображений. Поисковые роботы смогут различать образы на картинках – например, деревья или дома. И это тоже не фантастика 🙂

Итак, друзья, если вам хочется узнать побольше про этот подход и познакомиться с Жар-птицей Яндекса поближе, то приглашаю к прочтению

Как соотносятся запросы с образом Жар-Птицы

Наверняка, первый вопрос, который возникает, после прочтения названия алгоритма: «А почему собственно Палех?» Кстати, я подумала об этом в первую очередь. Есть еще среди моих читателей такие индивиды?

Название алгоритма у Яндекса «Палех» напрямую связано с палехской живописью. Ведь если вспомнить, то именно на росписях знаменитых художников часто использовался образ Жар-птицы. Я даже помню на уроках ИЗО пыталась нарисовать что-то из этого художественного жанра.

Но вернемся к теме нашей статьи.

Яндекс разделяет все поисковые запросы на три большие группы, которые соответствуют клюву, туловищу и длинному хвосту Жар-птицы.

  • Первая группа – это высокочастотные запросы. Люди запрашивают ответы на них ежесекундно. О чем это могут быть запросы? Это новости, погода, такие распространённые вопросы «Как сбить температуру?» и тому подобные. Сам список высокочастотных запросов не велик – поэтому они составляют клюв Жар-птицы.
  • Вторая группа — среднечастотные запросы. Их список значительно шире, поэтому они составляют туловище птицы.
  • Третья группа – низкочастотные запросы. Это очень редкие и своеобразные запросы, многие из которых задаются единожды в истории поиска. Если все эти уникальные запросы сложить вместе, получится гигантская цифра: 100 млн. запросов ежедневно. Вы только вдумайтесь в эту цифру! Именно поэтому низкочастотные запросы составляют пышный и длинный хвост Жар-птицы.

Алгоритм «Палех» призван находить релевантные ответы на запросы из «длинного хвоста», чтобы не оставлять миллионы пользователей без ответа.

Статья в тему:

Как проверить релевантность страницы онлайн: самый крутой сервис

Что такое поисковая выдача Яндекса и Гугл или зачем нужен ТОП

Чем отличаются редкие запросы от обычных?

Редкие запросы не рассчитаны на прежние алгоритмы поисковых роботов. Например, люди пытаются, так сказать, по-человечески спросить у Яндекса ту или иную информацию.

Приведу конкретный пример из моего недавнего опыта. Решила дать послушать дочке песенку, которая нравилась мне в детстве, но я не помню ни её названия, ни кто поёт. И в поисковую строку Яндекса мне пришлось вбивать единственную  строчку, которая всплыла в моей памяти "растет на болоте зеленая трава". Яндекс, конечно же, нашел мне эту песню, и мы и наслушались, и натанцевались под нее. Вот мой запрос —  это редкий, поскольку не все ведь будут искать эту песню именно по этой строчке 🙂

Сюда же можно отнести и запросы от детей и подростков: «какой мне посмотреть интересный мультик, только не про пони».

Согласитесь, что высокочастотные запросы обрабатываются тысячи раз, поэтому Яндексу известна статистика поведения пользователей на каждый запрос из выдачи. А редкие запросы требуют индивидуального подхода, потому что по ним нет статистики – какие ответы подходят, а какие нет.

Вот чтобы различать и понимать смысл уникальных вопросов и были придуманы нейронные сети.

neyronnyie-seti

Как используются нейронные сети в алгоритме «Палех» Яндекс

Давайте теперь поговорим немного о нейронной сети.

В последние несколько лет они положительно зарекомендовали себя в обработке естественной информации: текстовой, звуковой и графической.

Что же из себя представляют эти сети?

Нейронные сети — это «искусственный интеллект», который после машинного обучения успешно распознает информацию.

Например, во время обучения им показывают картинки слона в ряду с другими картинками, обозначая изображения со слонами за положительные примеры, а все остальные – за отрицательные. Или сообщают нейронной сети набор характерных черт слона: длинный хобот, большие уши и так далее.

Изображения без слонов и не характерные черты выдают за отрицательные примеры. Это позволяет находить верные изображения на запрос: «картинка со слоном» из миллиона других.

Принцип обучения нейронных сетей в алгоритме «Палех» тот же, только он помогает роботам соотносить поисковые запросы с текстами и заголовками на сайтах. Нейронной сети показывают ряд примеров: положительных и отрицательных.

Таким образом, нейросеть учится распознавать, насколько заголовок и текст отражают информацию, которую ищут люди.

trehsotmernoe-prostranstvo

Как информация обрабатывается в трёхсотмерном пространстве

Думаю, сложно поспорить с тем фактом, что особенность любого компьютера в том, что ему легче работать с числами. Поэтому Яндекс и придумал, чтобы нейронные сети переводили заголовки страниц на ресурсах в числа.

В Сети размещаются миллиарды различных заголовков. Они разбиваются нейронными сетями на группы, каждая из которых состоит из трёхсот чисел. Таким образом, все документы, занесённые после обработки информации в базу Яндекса, измеряются координатами в трёхсотмерном пространстве. Да, друзья, вы не ослышались, именно трёхсотмерное!

В этом же ключе планируется работать с текстами веб-порталов.

Разобраться в такой системе для робота так же просто, как человеку представить систему координат с двумя осями х и y. Только для человека понятно двухмерное пространство, а для робота – трёхсотмерное. После того как заголовки или текст переводятся в числа и попадают в трёхсотмерное пространство, они представляют собой точку с координатами на оси (почти как в учебнике по алгебре).

Переведённые в числовой эквивалент заголовок и текст запроса располагают в одной системе координат. Таким образом, они представляют собой две точки в трёхсотмерном пространстве. В принципе все логично и достаточно просто.

Благодаря нахождению запроса и ответа в одном измерении, нейронной сети легко понять, насколько они друг другу соответствуют. Близкое расположение говорит о том, что текст точно отвечает на вопрос. И тогда именно его робот и даст в выдаче.

Технология перевода информации в числа и их последующего измерения в системе координат получила название семантического вектора.

semanticheskiy-vektor

Перспективы развития семантического вектора

Изначально технология семантического вектора была задумана для улучшения качества выдачи на редкие запросы из «хвоста Жар-птицы». Но после короткого промежутка времени она дала положительные результаты, и стала использоваться в других сервисах.

Сейчас технология семантического вектора помогает выдавать максимально точные изображения на запросы пользователя. А в обозримом будущем предполагается исследовать в трёхсотмерном пространстве целые полотна текстов с ресурсов. Вообщем то ли еще будет 🙂

Нейронные сети всё время совершенствуются и выводят на новый уровень взаимодействие человека и компьютера. Благодаря нестандартному подходу подбора информации по смыслу – поисковая система в перспективе сможет отвечать на вопросы не хуже, чем человек. К этому в принципе все и движется.

***

Друзья, на этом буду заканчивать свой пост. Интересна ли вам была данная информация? Как планируете ею воспользоваться? Делитесь в комментариях ))

С вами была Екатерина Калмыкова, 

пока-пока!

49 ответов на “Новый поисковый алгоритм Палех Яндекс или знакомство с Жар-птицей”

  1. Привет, Катя! С большим интересом прочитала о Палех, удивительно, я даже не знала. Спасибо, что так доходчиво разъяснила все тонкости, хотя еще не поняла все плюсы и минусы этого подхода, посмотрим через время как это будет работать. =-O

    1. Уже работает пару месяцев этот алгоритм, только анонс вышел недавно. А я то все думал, с чего посещаемость так резко вверх пошла.

  2. Екатерина, спасибо, для меня это совершенно новая информация. Не во всём конечно сразу разобралась, но смысл понятен.

  3. Сколько новшеств! Принцип понятен, получается, что и ключевые слова, которые мы так тщательно подбираем, не так уж и важны? Роботы сами в состоянии понять, о чем идет речь и надо ли статью выдавать в поиск? *LOL*

  4. Спасибо Екатерина за такой интересный обзор. Я слышала про изменения в поисковых запросах, но, не знала как называется этот проект. Красивое название). Да, сейчас всё очень меняется быстро и постоянно быть привязанными к конкретным запросам сложновато. Хотя, я понимаю, что без этого никуда. Я тоже частенько ищу что-то даже по двум словам, потому что не помню всю фразу и нахожу то, что нужно. Удивительно, но, это здорово).

    1. Арина, по двум словам я часто ищу, в последнее время я целые предложения вбиваю в поиск. Пример в статье описывала 🙂 и так довольно частенько. Что-то после рождения дочери с памятью моей случилось ))

  5. Катюша, спасибо за полезную информацию, Читала про этот новый алгоритм, меня он порадовал, сейчас будет легче продвигаться, если научиться хорошо работать с хвостами.

  6. Спасибо, что познакомили с таким новшеством. Но чтобы они не придумывали, я думаю блогеры сумеют подстроится под изменения.

  7. Сразу конечно, все понять трудновато, но суть уловила. Хотя правильно делать заголовки было всегда важно. Но с другой стороны слишком длинные тоже не хорошо.

  8. Очень интересно, сама не слышала про такую новость. Ничего не стоИт на месте, теперь надо все переварить, и понять как это можно использоваться во благо своему блогу (помимо информативных заголовков) ))

  9. Яндекс заставляет нас блогеров плясать под его дудку и этот танец пляшеться уже не первый год 🙁 По другому никак...

  10. Очень интересно. Здорово, что возникают новые прогрессивные алгоритмы. Теперь будем наблюдать))

  11. Спасибо, Екатерина. Про новый алгоритм Яндекса слышала, разобраться не было времени, спасибо вашей статье, посмотрим как это будет работать...

  12. Да, я тоже уже читала про этот алгоритм. Посмотрим, как это будет потом работать. Все равно, это создано для удобств пользователей.

  13. Привет, Катя!

    На самом деле не все усвоил и понял. Насколько я понял, Палех будет проводить поиск по заголовкам, а следовательно, чем ближе по значению будут заголовок и поисковый запрос, тем выше будет располагаться блог в поисковой выдаче по этому запросу.

    По сути своей ничего не меняется, только поиск будет ориентирован не на тайтлы, а на заголовки? Ну и ссылки, получается, никакого веса иметь не будут.

    Сложно это все для моего понимания.

    1. Там речь не только о заголовках. Основная мысль — роботы научились понимать синонимы. В анонсе Яндекса это звучит примерно так — пишите хоть SEO, хоть продвижение сайтов, хоть раскрутка — мы будем одинаково воспринимать вашу статью. Теперь статьи, заточенные под один из запросов могут автоматом получить высокие позиции по запросам, которые являются синонимами.

    2. Вов, привет!

      Палех будет помогать Яндексу состыковывать поисковый запрос и заголовки страниц, даже при отсутствии у них общих ключевиков, то есть нейросеть будет улавливать смысл, а не лексику.

  14. Все, как и прежде, сводится к качеству материала: в поисковой выдаче будут выше те сайты, которые полностью оправдывают ожидания пользователей (а теперь и роботов). 😉

    1. Да, только теперь роботы будут понимать смысл, даже если ключевой запрос не будет упомянут в статье. Мне понравился пример от Серпстата, если например, пользователь вбивает в поиск «Джек-Воробей», то Яндекс даст в выдаче ресурсы с названием фильма. Хотя слова разные, поисковик свяжет их по смыслу.

  15. Какие бы алгоритмы не изобретали поисковые системы, они делают все, чтобы помочь пользователю найти ответ на свой вопрос, а задача блогера подготовить полный ответ

  16. Чего только не изобретет команда Яндекса! Спасибо за информацию, ничего до этого момента про данный алгоритм не знал!

  17. Отличный алгоритм, я его действие почувствовала еще когда его тестировали, сразу посещаемость вверх пошла. Яндекс вообще молодец, стремительно развивается и совершенствуется. с Палехом гораздо легче работать.

    1. Галина, применительно к своему блогу я пока не заметила действие нового алгоритма Палех от Яндекса. Сейчас наблюдаю за некоторыми позициями, позже хочу написать о своих наблюдениях в Блогер-шоу.

  18. Здравствуйте Катя!

    К своему стыду ничего не слышала об этом алгоритме — узнала только из Вашей статьи. Сразу не все в голове отложилось, но почитаю еще раз и все станет на место. Тоже буду анализировать, как введение нового алгоритма отразится на некоторых позициях и посещаемости в целом. спасибо! 😛

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Похожие записи