специализированных словарей для качественной нормализации географических адресов?
Не пробовал, но мелком заглядывал в libpostal - вроде довольно обширный охват вариантов.
У нас для геокодирования используем Sphinx (можно его форк Manticore). У них полнотекстовый поиск намного гибче и быстрее постгресового, но и оперативки кушает пропорционально объёму данных.
ну это внешнее решение, как я понял беглым взглядом. мне бы для tsvector'а
к сожалению я ограничен репозиторием astra linux, поэтому все сфинксы, эластики и т.д мимо
Тогда подсмотреть их правила для русского и сварганить что-то своё. В синонимы (ака "с" = "село") постгрес умеет.
вдруг уже есть что то готовое) так то словарик сокращений ул. пл. пр-т и т.д у меня уже есть
Обсуждают сегодня