select to_tsquery('russian', 'аудит') выдает 'ауд' например
или это в словарь ручками вводится для заимствованных слов?
Правила разбиения слов на лексемы (стэмминг) задаются в словаре. По умолчанию в Постгресе используется snowball - у него очень упрощённые представления о грамматике языка). Вы можете использовать свой словарь (например https://postgrespro.ru/docs/postgrespro/14/hunspell-dict и тогда "аудит" скорее всего будет стэмится по другому.
Конкретно для русского я бы ещё посоветовал посмотреть на rusmorph : https://obartunov.livejournal.com/195950.html
спасибо, взял на заметку, в работе пригодится, как раз надо искать слова которые подлежат обезличиванию при обфускации данных
Обсуждают сегодня