Форум LessWrong.ru

Главное => Сообщество рационалистов => Тема начата: Kroid от 10 Ноябрь 2018, 16:38

Название: Плохой поисковый движок
Отправлено: Kroid от 10 Ноябрь 2018, 16:38
Поисковый движок lesswrong.ru не умеет в морфологию и словоформы. Время от времени, когда хочу найти нужную статью, но не помню название, бывает сложно через него пробиться.

К примеру, сравните результаты:
https://lesswrong.ru/search/node/бабочка (https://lesswrong.ru/search/node/бабочка)
https://lesswrong.ru/search/node/бабочке (https://lesswrong.ru/search/node/бабочке)

А еще не обрабатывает опечатки:
https://lesswrong.ru/search/node/бабачка (https://lesswrong.ru/search/node/бабачка)

Я не знаю, как именно это тут реализовано, но, может, стоит сделать что-то вроде поиска по триграммам?
Название: Re: Плохой поисковый движок
Отправлено: nar от 11 Ноябрь 2018, 02:02
До чего дошли, уже морфологию за стандартную возможность поиска считают. Всё же нет, обычный поиск - это поиск побуквенных совпадений и никак иначе. Всё остальное - сразу намного сложнее и в нормальном виде в общем-то доступно только поисковым гигантам коих всего несколько в мире. В сильно упрощённом - доступно и рядовым участникам, но всё равно сложно и это надо ставить специальный софт, выходящий за рамки веб-движка.
Название: Re: Плохой поисковый движок
Отправлено: Kroid от 11 Ноябрь 2018, 16:38
Цитировать
доступно только поисковым гигантам

Да ладно, не таким уж и гигантам. Даже дополнительных баз данных можно не ставить, достаточно обычной реляционной. Тот же простгрес практически из коробки поиск по триграммам поддерживает. По мускулу я не специалист, но гугл первую же ссылку вываливает:
https://dev.mysql.com/doc/refman/5.7/en/fulltext-search-ngram.html
Название: Re: Плохой поисковый движок
Отправлено: Alaric от 12 Ноябрь 2018, 13:38
По теме мне сложно что-то сказать, однако, на всякий случай я укажу, что в будущем всякие пожелания или сообщения об ошибках на сайте лучше, по возможности, добавлять в список задач на github'е: https://github.com/lesswrong-ru/lesswrong-ru/issues

Всё-таки этот форум крайне редко посещают те, кто действительно чем-то занимаются по сайту.