Новый поисковый алгоритм Палех Яндекс или знакомство с Жар-птицей

Яндекс Палех

Друзья, я рада приветствовать вас на Blog-Bridge.ru. Вы, наверное, уже слышали новость о новом алгоритме Палех? Яндекс как поисковая система постоянно совершенствует свои алгоритмы обработки информации.

Вот и в этом году он анонсировал запуск нового алгоритма с креативным названием «Палех».

Я буквально недавно узнала эту новость и сразу обратила на это внимание. Думаю, что многие блогеры и веб-мастера тоже заинтересовались данной информацией.

Кроме того, мы ведь не так давно запустили новый эксперимент и я теперь полностью погружена в его реализацию.

Эксперимент «Комплексное продвижение блога». В ходе данного эксперимента вы узнаете: какими методами мы будем продвигать блог, какие из них окажутся эффективными и какие результаты они принесут; какой прирост посещаемости будет у нас ежемесячно; какими способами мы будем набирать подписную базу; как будут задействованы социальный сети; какими сервисами мы будем пользоваться для выполнения поставленных задач; и многое другое.

Ведь что мы сейчас наблюдаем в Сети? Сайтов, блогов и веб-порталов становится всё больше и больше, и вот чтобы давать максимально точные ответы на запросы пользователей, Яндекс начал использовать нестандартные подходы в обучении своих поисковых роботов.

Цель создания нового поискового алгоритма – улучшить качество предоставляемых ответов в выдаче для пользователей. Предыдущие поисковые модели подбирали информацию по соответствию ключевым словам. Новая модель на основе нейронных сетей умеет подбирать информацию по смыслу. Представляете? И это не фантастика!

Ещё одна интересная разработка нового метода поиска «Палех» — распознавание изображений. Поисковые роботы смогут различать образы на картинках – например, деревья или дома. И это тоже не фантастика 🙂

Итак, друзья, если вам хочется узнать побольше про этот подход и познакомиться с Жар-птицей Яндекса поближе, то приглашаю к прочтению

Как соотносятся запросы с образом Жар-Птицы

Наверняка, первый вопрос, который возникает, после прочтения названия алгоритма: «А почему собственно Палех?» Кстати, я подумала об этом в первую очередь. Есть еще среди моих читателей такие индивиды?

Название алгоритма у Яндекса «Палех» напрямую связано с палехской живописью. Ведь если вспомнить, то именно на росписях знаменитых художников часто использовался образ Жар-птицы. Я даже помню на уроках ИЗО пыталась нарисовать что-то из этого художественного жанра.

Но вернемся к теме нашей статьи.

Яндекс разделяет все поисковые запросы на три большие группы, которые соответствуют клюву, туловищу и длинному хвосту Жар-птицы.

  • Первая группа – это высокочастотные запросы. Люди запрашивают ответы на них ежесекундно. О чем это могут быть запросы? Это новости, погода, такие распространённые вопросы «Как сбить температуру?» и тому подобные. Сам список высокочастотных запросов не велик – поэтому они составляют клюв Жар-птицы.
  • Вторая группа — среднечастотные запросы. Их список значительно шире, поэтому они составляют туловище птицы.
  • Третья группа – низкочастотные запросы. Это очень редкие и своеобразные запросы, многие из которых задаются единожды в истории поиска. Если все эти уникальные запросы сложить вместе, получится гигантская цифра: 100 млн. запросов ежедневно. Вы только вдумайтесь в эту цифру! Именно поэтому низкочастотные запросы составляют пышный и длинный хвост Жар-птицы.

Алгоритм «Палех» призван находить релевантные ответы на запросы из «длинного хвоста», чтобы не оставлять миллионы пользователей без ответа.

Статья в тему:

Как проверить релевантность страницы онлайн: самый крутой сервис

Что такое поисковая выдача Яндекса и Гугл или зачем нужен ТОП

Чем отличаются редкие запросы от обычных?

Редкие запросы не рассчитаны на прежние алгоритмы поисковых роботов. Например, люди пытаются, так сказать, по-человечески спросить у Яндекса ту или иную информацию.

Приведу конкретный пример из моего недавнего опыта. Решила дать послушать дочке песенку, которая нравилась мне в детстве, но я не помню ни её названия, ни кто поёт. И в поисковую строку Яндекса мне пришлось вбивать единственную  строчку, которая всплыла в моей памяти "растет на болоте зеленая трава". Яндекс, конечно же, нашел мне эту песню, и мы и наслушались, и натанцевались под нее. Вот мой запрос —  это редкий, поскольку не все ведь будут искать эту песню именно по этой строчке 🙂

Сюда же можно отнести и запросы от детей и подростков: «какой мне посмотреть интересный мультик, только не про пони».

Согласитесь, что высокочастотные запросы обрабатываются тысячи раз, поэтому Яндексу известна статистика поведения пользователей на каждый запрос из выдачи. А редкие запросы требуют индивидуального подхода, потому что по ним нет статистики – какие ответы подходят, а какие нет.

Вот чтобы различать и понимать смысл уникальных вопросов и были придуманы нейронные сети.

neyronnyie-seti

Как используются нейронные сети в алгоритме «Палех» Яндекс

Давайте теперь поговорим немного о нейронной сети.

В последние несколько лет они положительно зарекомендовали себя в обработке естественной информации: текстовой, звуковой и графической.

Что же из себя представляют эти сети?

Нейронные сети — это «искусственный интеллект», который после машинного обучения успешно распознает информацию.

Например, во время обучения им показывают картинки слона в ряду с другими картинками, обозначая изображения со слонами за положительные примеры, а все остальные – за отрицательные. Или сообщают нейронной сети набор характерных черт слона: длинный хобот, большие уши и так далее.

Изображения без слонов и не характерные черты выдают за отрицательные примеры. Это позволяет находить верные изображения на запрос: «картинка со слоном» из миллиона других.

Принцип обучения нейронных сетей в алгоритме «Палех» тот же, только он помогает роботам соотносить поисковые запросы с текстами и заголовками на сайтах. Нейронной сети показывают ряд примеров: положительных и отрицательных.

Таким образом, нейросеть учится распознавать, насколько заголовок и текст отражают информацию, которую ищут люди.

trehsotmernoe-prostranstvo

Как информация обрабатывается в трёхсотмерном пространстве

Думаю, сложно поспорить с тем фактом, что особенность любого компьютера в том, что ему легче работать с числами. Поэтому Яндекс и придумал, чтобы нейронные сети переводили заголовки страниц на ресурсах в числа.

В Сети размещаются миллиарды различных заголовков. Они разбиваются нейронными сетями на группы, каждая из которых состоит из трёхсот чисел. Таким образом, все документы, занесённые после обработки информации в базу Яндекса, измеряются координатами в трёхсотмерном пространстве. Да, друзья, вы не ослышались, именно трёхсотмерное!

В этом же ключе планируется работать с текстами веб-порталов.

Разобраться в такой системе для робота так же просто, как человеку представить систему координат с двумя осями х и y. Только для человека понятно двухмерное пространство, а для робота – трёхсотмерное. После того как заголовки или текст переводятся в числа и попадают в трёхсотмерное пространство, они представляют собой точку с координатами на оси (почти как в учебнике по алгебре).

Переведённые в числовой эквивалент заголовок и текст запроса располагают в одной системе координат. Таким образом, они представляют собой две точки в трёхсотмерном пространстве. В принципе все логично и достаточно просто.

Благодаря нахождению запроса и ответа в одном измерении, нейронной сети легко понять, насколько они друг другу соответствуют. Близкое расположение говорит о том, что текст точно отвечает на вопрос. И тогда именно его робот и даст в выдаче.

Технология перевода информации в числа и их последующего измерения в системе координат получила название семантического вектора.

semanticheskiy-vektor

Перспективы развития семантического вектора

Изначально технология семантического вектора была задумана для улучшения качества выдачи на редкие запросы из «хвоста Жар-птицы». Но после короткого промежутка времени она дала положительные результаты, и стала использоваться в других сервисах.

Сейчас технология семантического вектора помогает выдавать максимально точные изображения на запросы пользователя. А в обозримом будущем предполагается исследовать в трёхсотмерном пространстве целые полотна текстов с ресурсов. Вообщем то ли еще будет 🙂

Нейронные сети всё время совершенствуются и выводят на новый уровень взаимодействие человека и компьютера. Благодаря нестандартному подходу подбора информации по смыслу – поисковая система в перспективе сможет отвечать на вопросы не хуже, чем человек. К этому в принципе все и движется.

***

Друзья, на этом буду заканчивать свой пост. Интересна ли вам была данная информация? Как планируете ею воспользоваться? Делитесь в комментариях ))

С вами была Екатерина Калмыкова, 

пока-пока!

Поделись с друзьями:

Комментариев: 45

  1. Елена Прекрасная

    Привет, Катя! С большим интересом прочитала о Палех, удивительно, я даже не знала. Спасибо, что так доходчиво разъяснила все тонкости, хотя еще не поняла все плюсы и минусы этого подхода, посмотрим через время как это будет работать. =-O

    Ответить
    1. Екатерина Калмыкова

      Лена, привет! Ага посмотрим. Насколько я знаю, он уже работает, поэтому надо уделять больше внимание заголовкам ))

      Ответить
    2. Дмитрий

      Уже работает пару месяцев этот алгоритм, только анонс вышел недавно. А я то все думал, с чего посещаемость так резко вверх пошла.

      Ответить
      1. Екатерина Калмыкова

        Дмитрий, прям сильно вверх пошла?

        Ответить
  2. Наталья

    Очень сложно. Как же нам вести блог, если такие сложности доступны только роботам

    Ответить
    1. Екатерина Калмыкова

      Наталья, думаю, вести также, как вы и вели его до Палеха. Посмотрим как отразиться его применение на поисковой выдаче, мне тоже интересно.

      Ответить
  3. Елена

    Екатерина, спасибо, для меня это совершенно новая информация. Не во всём конечно сразу разобралась, но смысл понятен.

    Ответить
    1. Екатерина Калмыкова

      Елена, да, я постаралась передать смысл Палеха более доступно. Рада, что у меня получилось!

      Ответить
  4. Ирина Лукшиц

    Сколько новшеств! Принцип понятен, получается, что и ключевые слова, которые мы так тщательно подбираем, не так уж и важны? Роботы сами в состоянии понять, о чем идет речь и надо ли статью выдавать в поиск? *LOL*

    Ответить
    1. Екатерина Калмыкова

      Думаю, ключевые слова важны и нужны. Но также стоит более серьезно отнестись к заголовкам, поскольку на них роботы теперь будут обращать особое внимание.

      Ответить
  5. Арина Широкова

    Спасибо Екатерина за такой интересный обзор. Я слышала про изменения в поисковых запросах, но, не знала как называется этот проект. Красивое название). Да, сейчас всё очень меняется быстро и постоянно быть привязанными к конкретным запросам сложновато. Хотя, я понимаю, что без этого никуда. Я тоже частенько ищу что-то даже по двум словам, потому что не помню всю фразу и нахожу то, что нужно. Удивительно, но, это здорово).

    Ответить
    1. Екатерина Калмыкова

      Арина, по двум словам я часто ищу, в последнее время я целые предложения вбиваю в поиск. Пример в статье описывала :) и так довольно частенько. Что-то после рождения дочери с памятью моей случилось ))

      Ответить
  6. Алевтина

    Катюша, спасибо за полезную информацию, Читала про этот новый алгоритм, меня он порадовал, сейчас будет легче продвигаться, если научиться хорошо работать с хвостами.

    Ответить
    1. Екатерина Калмыкова

      Алевтина, здравствуйте! Да, в том числе и с хвостами работать надо, а не забывать про них.

      Ответить
  7. Иван

    Спасибо, что познакомили с таким новшеством. Но чтобы они не придумывали, я думаю блогеры сумеют подстроится под изменения.

    Ответить
    1. Екатерина Калмыкова

      Согласна, блогеры они такие :)

      Ответить
  8. Алёна Кравченко

    Все меняется, улучшается, усовершенствуется, спасибо, за информацию!

    Ответить
    1. Екатерина Калмыкова

      Да, ничего не стоит на месте, в том числе и поисковые алгоритмы.

      Ответить
  9. Ольга Смирнова

    Сразу конечно, все понять трудновато, но суть уловила. Хотя правильно делать заголовки было всегда важно. Но с другой стороны слишком длинные тоже не хорошо.

    Ответить
    1. Екатерина Калмыкова

      Да, заголовок всегда был важным элементом статьи, который привлекает читателя в первую очередь. Теперь нужно и робота привлекать им :)

      Ответить
  10. Анастасия

    Очень интересно, сама не слышала про такую новость. Ничего не стоИт на месте, теперь надо все переварить, и понять как это можно использоваться во благо своему блогу (помимо информативных заголовков) ))

    Ответить
    1. Екатерина Калмыкова

      Помимо заголовков, необходимо больше внимания уделять «хвостам» ключевой фразы.

      Ответить
  11. Алина

    Яндекс заставляет нас блогеров плясать под его дудку и этот танец пляшеться уже не первый год :( По другому никак...

    Ответить
    1. Екатерина Калмыкова

      Яндекс хочет, чтобы каждый пользователь находил на свой вопрос ответ. Для этого вот даже нейросети привлекает ))

      Ответить
  12. Елена

    Я тоже с интересом прочитала о новом алгоритме. Раньше о нем не слышала.

    Ответить
    1. Екатерина Калмыкова

      Елена, Яндекс недавно его запустил, поэтому, наверное, и не слышали.

      Ответить
  13. Юлия

    Очень интересно. Здорово, что возникают новые прогрессивные алгоритмы. Теперь будем наблюдать))

    Ответить
    1. Екатерина Калмыкова

      Да, будет интересно посмотреть работу Палеха на практике.

      Ответить
  14. Лидия (tytvkysno.ru)

    Спасибо, Екатерина. Про новый алгоритм Яндекса слышала, разобраться не было времени, спасибо вашей статье, посмотрим как это будет работать...

    Ответить
    1. Екатерина Калмыкова

      Мне тоже любопытно посмотреть, как нейросети будут соотносить информацию и выбирать наиболее релевантную статью для выдачи.

      Ответить
  15. Таисия

    Да, я тоже уже читала про этот алгоритм. Посмотрим, как это будет потом работать. Все равно, это создано для удобств пользователей.

    Ответить
    1. Екатерина Калмыкова

      Таисия, он уже работает. Готовлю материал на эту тему ))

      Ответить
  16. Владимир

    Привет, Катя!

    На самом деле не все усвоил и понял. Насколько я понял, Палех будет проводить поиск по заголовкам, а следовательно, чем ближе по значению будут заголовок и поисковый запрос, тем выше будет располагаться блог в поисковой выдаче по этому запросу.

    По сути своей ничего не меняется, только поиск будет ориентирован не на тайтлы, а на заголовки? Ну и ссылки, получается, никакого веса иметь не будут.

    Сложно это все для моего понимания.

    Ответить
    1. Дмитрий

      Там речь не только о заголовках. Основная мысль — роботы научились понимать синонимы. В анонсе Яндекса это звучит примерно так — пишите хоть SEO, хоть продвижение сайтов, хоть раскрутка — мы будем одинаково воспринимать вашу статью. Теперь статьи, заточенные под один из запросов могут автоматом получить высокие позиции по запросам, которые являются синонимами.

      Ответить
    2. Екатерина Калмыкова

      Вов, привет!

      Палех будет помогать Яндексу состыковывать поисковый запрос и заголовки страниц, даже при отсутствии у них общих ключевиков, то есть нейросеть будет улавливать смысл, а не лексику.

      Ответить
  17. Диля

    Все, как и прежде, сводится к качеству материала: в поисковой выдаче будут выше те сайты, которые полностью оправдывают ожидания пользователей (а теперь и роботов). ;)

    Ответить
    1. Екатерина Калмыкова

      Да, только теперь роботы будут понимать смысл, даже если ключевой запрос не будет упомянут в статье. Мне понравился пример от Серпстата, если например, пользователь вбивает в поиск «Джек-Воробей», то Яндекс даст в выдаче ресурсы с названием фильма. Хотя слова разные, поисковик свяжет их по смыслу.

      Ответить
  18. Надежда

    Какие бы алгоритмы не изобретали поисковые системы, они делают все, чтобы помочь пользователю найти ответ на свой вопрос, а задача блогера подготовить полный ответ

    Ответить
    1. Екатерина Калмыкова

      Да, Надежда, верно написали, что поисковики хотят, чтобы каждый пользователь не уходил от них без ответа. Палех будет помогать Яндексу в этом деле.

      Ответить
  19. Дмитрий

    Чего только не изобретет команда Яндекса! Спасибо за информацию, ничего до этого момента про данный алгоритм не знал!

    Ответить
    1. Екатерина Калмыкова

      Теперь, Дмитрий, и вы будете в курсе ))

      Ответить
  20. Галина Некрасова

    Отличный алгоритм, я его действие почувствовала еще когда его тестировали, сразу посещаемость вверх пошла. Яндекс вообще молодец, стремительно развивается и совершенствуется. с Палехом гораздо легче работать.

    Ответить
    1. Екатерина Калмыкова

      Галина, применительно к своему блогу я пока не заметила действие нового алгоритма Палех от Яндекса. Сейчас наблюдаю за некоторыми позициями, позже хочу написать о своих наблюдениях в Блогер-шоу.

      Ответить
  21. Ирина Рыбчанская

    Здравствуйте Катя!

    К своему стыду ничего не слышала об этом алгоритме — узнала только из Вашей статьи. Сразу не все в голове отложилось, но почитаю еще раз и все станет на место. Тоже буду анализировать, как введение нового алгоритма отразится на некоторых позициях и посещаемости в целом. спасибо! :P

    Ответить
    1. Екатерина Калмыкова

      Ирина, здравствуйте. Да, мне тоже интересно как Палех повлияет на выдачу. Пока наблюдаю...

      Ответить

Оставить комментарий

=) 8) :( ;( ;) :P :-D =-O :-! *IN LOVE* %) *CRAZY* *LOL* ]:-> *MACHO* *EEK*