+7 (495) 266-62-87
Москва

Всё о новом алгоритме Google BERT: принцип работы, особенности, применение

19.11.2019
50

BERT (Bidirectional Encoder Representations From Transformers) – новый алгоритм от Google. Проект призван упростить поиск нужных данных в сети: вне зависимости от того, как составлен запрос, будут учтены нюансы, значение предлогов, система теперь понимает целые предложения, а не только отдельные слова или короткие словосочетания.

Когда появился алгоритм BERT?

Эта идея зародилась еще в 2017 году, а к 2018 подготовлена концепция проекта. 21 октября 2019 года Google выкатил алгоритм, но пока он работает исключительно для поисковых запросов на английском языке.

Для улучшения понимания определенных фрагментов, BERT применяется в 25 странах. В дальнейшем, предстоит объемная работа, чтобы используемая модель распространилась на все используемые для поиска языки.

google_bert.jpg

BERT: что собой представляет этот алгоритм?

BERT – словно переводчик, который помогает машинам и людям научиться понимать друг друга. Модель базируется на нейросетях, благодаря чему система анализирует естественный язык и может различать контекст. Улучшилось и понимание предлогов, способных в корне изменить значение фразы. Это явно видно на простом примере: «four to seven» и «a quarter to seven» – предлог одинаковый, но смысл словосочетания полностью меняется. Раньше это понимание было недоступно поисковым системам, из-за чего пользователю было сложно найти требующуюся информацию.

Это алгоритм с открытым исходным кодом, доступным для просмотра или изучения.

BERT: принцип работы

Традиционно нейросети обучаются на определенном порядке слов (слева направо). Новый алгоритм обладает принципиальным отличием – он определяет смысл слова на основании всего словосочетания, учтя все окружающие слова.

Компания Google продемонстрировала пользователям возможности BERT. Например, если ранее на запрос «книги по литературе для взрослых» поисковая система предлагала учебники для старшеклассников, то теперь результаты поиска будут соответствовать информационным нуждам пользователя.

Станет ли BERT универсальным решением?

Алгоритм не будет применен для всех поисковых запросов, так как его основная задача в том, что понять разговорные фразы или длинные предложения. Он придет на помощь и в том случае, если предлоги имеют решающее значение и способны изменить смысл словосочетания. Для коротких фраз или поиска, в котором использованы названия компаний, подобная система не актуальна. Поэтому она затрагивает около 10% англоязычных вопросов пользователей из США.

BERT или RankBrain?

Это две разные технологии. RankBrain предназначен для того, чтобы скорректировать результат в соответствии с данными, рассчитанными обычными алгоритмами. Технология анализирует текущий запрос в соотношении с запросами, используемыми ранее. На основании этого и корректируется итоговый результат.

RankBrain помогает найти результаты, даже при отсутствии ключевых слов. Поисковая система понимает, что пользователю необходимо найти одну из всемирно известных достопримечательностей, даже если в строку поиска не было введено её точное название.

Задачи BERT принципиально иные. Он изучает всю фразу – слова, окружающие основной запрос, помогают лучше понять его смысл. Соответственно, этот алгоритм может быть использован и вместе с RankBrain, но только для длинных предложений.

Что изменит BERT?

BERT поможет усовершенствовать и Google Assistant. Ответы на информационные запросы станут точнее.

На текущий момент технология не используется в рекламных продуктах, но в дальнейшем возможно её применение в соответствующих сервисах, что значительно повысит актуальность демонстрируемых объявлений.

google_bert1.jpg

Оптимизация сайта

Согласно заявлению представителей компании Google, никаких изменений в оптимизации с учетом нового алгоритма, не предвидится. Основной задачей по-прежнему остается наполнение страниц качественным контентом, который интересен и полезен для пользователей, а также соответствует ключевым запросам.

На конференции «Optimization 2019» высказал своё мнение по этому поводу и Михаил Шакин, автор известного блога. Он посетовал на отсутствие экспертов, а также указания авторства. В некоторых тематиках, например, медицина, подобный подход просто-напросто недопустим. Большинство статей «пусты», из-за чего сайт лишен возможности занять первые страницы поисковых систем. Созданием контента должны заниматься эксперты, которые ранее публиковались, давали интервью, выступали с этой темой, а соответственно, отлично разбираются в мельчайших нюансах. Поисковые системы всё это учитывают. С появлением BERT принципы оптимизации остались неизменны, основной упор – качество текстов.

Создатель компании Zyppy, Сайрус Шепард, заметил некоторую особенность нового алгоритма. В ответ на запрос пользователя, BERT подбирает ресурсы с идентичными данными. Соответственно, если сформировано определенное мнение и ведущие порталы его поддерживают, то сайт, который предоставляет информацию, идущую вразрез с остальными, явно серьезно проиграет в этой информационной гонке.

Поделиться:
Яндекс.Метрика Яндекс цитирования Участник проекта CMS Magazine