Как SmartQuery ускоряет синтаксический анализ поисковых запросов на месте с помощью Querqy
Автор: Рудольф Батт | Опубликовано: | Категория: Образование
Знаете ли вы Querqy? Если у вас есть поисковая система на основе Lucene — в большинстве случаев это Solr или Elasticsearch — вы должны были слышать о Querqy. Звучит примерно так: « Quirky »! Это мощный механизм анализа и улучшения запросов. Он использует различные рерайтеры для добавления контекста к входящим поисковым запросам. Самый простой переписчик использует ручную настройку правил для добавления синонимов, фильтров и повышения и понижения для окончательного запроса Lucene. Большее количество переписчиков обрабатывает декомпозицию, нормализацию числовых единиц и замены.
Устойчивость к ошибкам знать, когда сказать, когда
Если вы используете другую поисковую систему, у вас, скорее всего, есть аналогичные инструменты для обработки синонимов, фильтрации и т. д. Так что этот пост также для вас, потому что у всех поисковых систем есть одна большая проблема: правила должны поддерживаться вручную! И все эти правила не устойчивы к ошибкам. Итак, давайте посмотрим на некоторые примеры.
Пример 1 — опечатка в поиске по сайту
Ваше правило: Синоним «мобильный» = «смартфон» Запрос: «мобильный чехол» Как видите, это правило не будет соответствовать из-за отсутствия буквы «е» в слове «мобильный». Так что в этом примере покупатель не увидит чехлы для смартфонов.
Пример 2 — состав поискового запроса
То же правило, другой запрос: «мобильный кейс» Опять же, синоним не будет применяться, так как слова разделены неправильно. Для таких запросов вам следует подумать о переписывании слов Querqys.
Пример 3 — порядок слов в поисковом запросе
Ваше правило: женская одежда = женская одежда Запрос: «одежда для женщин» или «верхняя женская одежда» Уникальная проблема возникает при использовании правил для нескольких слов. Будет много случаев, когда порядок изменится, и правила больше не будут совпадать.
Это всего лишь несколько примеров сборки, но их гораздо больше. Ни один из них не является фундаментальным, но они быстро накапливаются. Кроме того, разные языки сопряжены с другими нюансами и сложными проблемами правописания. Для нас, в Германии, словосочетания являются одной из существенных проблем. По нашему опыту, не менее 10-20% поискового трафика содержат запросы с такими ошибками. И мы знаем, что есть еще больше возможностей для улучшения. Наша рабочая гипотеза предполагает, что около 30% трафика можно перефразировать в унифицированную и исправленную форму.
Какие у вас есть варианты? Ну, вы могли бы добавить еще много правил, но вы столкнетесь со следующей проблемой: Сложность.
Мы видели множество самодельных конфигураций поиска с тысячами правил. Со временем это становится проблематичным, поскольку меняется основа продукта. Значение старых правил приводит к неожиданным результатам. Например, синоним «брюки» и «джинсы» когда-то был хорошей идеей, но поскольку данные изменились, у вас много несоответствий, потому что между тем слово «джинсы» ссылается на множество разных понятий.
SearchHub — интуитивно понятный поиск на месте!
Благодаря SearchHub мы сокращаем количество ручных правил, объединяя орфографические ошибки, варианты состава и порядка слов, а также концептуально похожие запросы.
Если вы еще не знакомы с SearchHub, наше решение группирует разные запросы с одинаковым намерением и выбирает лучшего кандидата. Затем, наступает время поиска, мы превращаем нежелательные варианты запроса в их лучший вариант соответственно.
Что это значит для ваших правил? Во-первых, вы можете сосредоточиться на безошибочных, унифицированных и стандартных запросах. SearchHub обрабатывает все орфографические ошибки, варианты композиций и варианты порядка слов.
Кроме того, вы можете отказаться от добавления правил, чтобы добавить контекст к вашим запросам. Например, может возникнуть соблазн добавить «яблоко», когда кто-то ищет «iphone». Но это может привести к ложным срабатываниям при поиске аксессуаров для iPhone от разных брендов. SearchHub, с другой стороны, только добавляет контекст к запросам, в которых люди ищут такие связи. В случае неоднозначных запросов вы можете дополнительно разделить эти запросы на два уникальных намерения.
Используйте лучшие инструменты
Querqy великолепен. Он позволяет добавить недостающие знания к запросам пользователя. Но не злоупотребляйте им для решения таких задач, как нормализация запросов и формулировка унифицированных намерений; для этого есть SearchHub. Сочетание этих инструментов создает идеальный симбиоз. Каждый из них увеличивает эффективность другого. Использование обоих сделает ваш метод анализа запросов точно настроенным решением.
респ.dvi
%PDF-1.5 % 1 0 объект > эндообъект 5 0 объект > эндообъект 2 0 объект > ручей 2011-07-05T11:40:42+02:00dvipsk 5.526b Copyright 1986, 1993 Radical Eye Software2011-07-05T11:41:01+02:002011-07-05T11:41:01+02:00Acrobat Distiller 9.