Плохой поисковый движок

Автор Тема: Плохой поисковый движок  (Прочитано 3580 раз)

Kroid

  • Ветеран
  • ****
  • Сообщений: 779
  • +62/-7
    • Просмотр профиля
Плохой поисковый движок
« : 10 Ноября 2018, 16:38 »
  • (+)0
  • (−)0
  • Поисковый движок lesswrong.ru не умеет в морфологию и словоформы. Время от времени, когда хочу найти нужную статью, но не помню название, бывает сложно через него пробиться.

    К примеру, сравните результаты:
    https://lesswrong.ru/search/node/бабочка
    https://lesswrong.ru/search/node/бабочке

    А еще не обрабатывает опечатки:
    https://lesswrong.ru/search/node/бабачка

    Я не знаю, как именно это тут реализовано, но, может, стоит сделать что-то вроде поиска по триграммам?

    nar

    • Ветеран
    • ****
    • Сообщений: 312
    • +26/-27
      • Просмотр профиля
    Re: Плохой поисковый движок
    « Ответ #1 : 11 Ноября 2018, 02:02 »
  • (+)0
  • (−)0
  • До чего дошли, уже морфологию за стандартную возможность поиска считают. Всё же нет, обычный поиск - это поиск побуквенных совпадений и никак иначе. Всё остальное - сразу намного сложнее и в нормальном виде в общем-то доступно только поисковым гигантам коих всего несколько в мире. В сильно упрощённом - доступно и рядовым участникам, но всё равно сложно и это надо ставить специальный софт, выходящий за рамки веб-движка.

    Kroid

    • Ветеран
    • ****
    • Сообщений: 779
    • +62/-7
      • Просмотр профиля
    Re: Плохой поисковый движок
    « Ответ #2 : 11 Ноября 2018, 16:38 »
  • (+)0
  • (−)0
  • Цитировать
    доступно только поисковым гигантам

    Да ладно, не таким уж и гигантам. Даже дополнительных баз данных можно не ставить, достаточно обычной реляционной. Тот же простгрес практически из коробки поиск по триграммам поддерживает. По мускулу я не специалист, но гугл первую же ссылку вываливает:
    https://dev.mysql.com/doc/refman/5.7/en/fulltext-search-ngram.html
    « Последнее редактирование: 11 Ноября 2018, 18:30 от Kroid »

    Alaric

    • Старожил
    • *****
    • Сообщений: 1 744
    • +175/-17
      • Просмотр профиля
      • Мой ЖЖ
    Re: Плохой поисковый движок
    « Ответ #3 : 12 Ноября 2018, 13:38 »
  • (+)1
  • (−)0
  • По теме мне сложно что-то сказать, однако, на всякий случай я укажу, что в будущем всякие пожелания или сообщения об ошибках на сайте лучше, по возможности, добавлять в список задач на github'е: https://github.com/lesswrong-ru/lesswrong-ru/issues

    Всё-таки этот форум крайне редко посещают те, кто действительно чем-то занимаются по сайту.