Форум LessWrong.ru
Главное => Сообщество рационалистов => Тема начата: Kroid от 10 Ноября 2018, 16:38
-
Поисковый движок lesswrong.ru не умеет в морфологию и словоформы. Время от времени, когда хочу найти нужную статью, но не помню название, бывает сложно через него пробиться.
К примеру, сравните результаты:
https://lesswrong.ru/search/node/бабочка (https://lesswrong.ru/search/node/бабочка)
https://lesswrong.ru/search/node/бабочке (https://lesswrong.ru/search/node/бабочке)
А еще не обрабатывает опечатки:
https://lesswrong.ru/search/node/бабачка (https://lesswrong.ru/search/node/бабачка)
Я не знаю, как именно это тут реализовано, но, может, стоит сделать что-то вроде поиска по триграммам?
-
До чего дошли, уже морфологию за стандартную возможность поиска считают. Всё же нет, обычный поиск - это поиск побуквенных совпадений и никак иначе. Всё остальное - сразу намного сложнее и в нормальном виде в общем-то доступно только поисковым гигантам коих всего несколько в мире. В сильно упрощённом - доступно и рядовым участникам, но всё равно сложно и это надо ставить специальный софт, выходящий за рамки веб-движка.
-
доступно только поисковым гигантам
Да ладно, не таким уж и гигантам. Даже дополнительных баз данных можно не ставить, достаточно обычной реляционной. Тот же простгрес практически из коробки поиск по триграммам поддерживает. По мускулу я не специалист, но гугл первую же ссылку вываливает:
https://dev.mysql.com/doc/refman/5.7/en/fulltext-search-ngram.html
-
По теме мне сложно что-то сказать, однако, на всякий случай я укажу, что в будущем всякие пожелания или сообщения об ошибках на сайте лучше, по возможности, добавлять в список задач на github'е: https://github.com/lesswrong-ru/lesswrong-ru/issues
Всё-таки этот форум крайне редко посещают те, кто действительно чем-то занимаются по сайту.