(допустим текстового формата, т.е. текст из них доступен, не картинка)
нужно: делать поиск по бд и по файлам.
что посоветуете использовать, куда копнуть, какой search engine умеет индексировать текст из файлов и бд?
Ну самый хардкорный вариант - написать сервис-индексер который будет ловить ивент на изменение данных (из сервис баса или по HTTP получать инфу о апдейте) и складывать данные в какой нибудь Elasticsearch или любую другую СУБД оптимизированную для поиска
Думаю это можно сделать даже ажур функцией или лямбдами в авс
ну вот хочется готовое что-то, если есть. скармливать файл сервису, он создаёт слепок и хранит у себя
ну ты предлагаешь сканить текст и выцеплять оттуда слова и складывать в индекс руками. может есть умнее варианты
Я скорее говорил про подход в целом
та в целом я с тобой согласен и понимаю как это.
Вроде если скормить эластику в поле парвильного типа текст он его автиматически разобьет на всякие индексы для фулл текст сеч
Ну тоесть твой вопрос касается не источников данных а скорее оптимизированного поиска?
меня интересует есть ли сервисы, которым я скормлю файл и она там магию под капотом сделает. дальше я этому сервисы даю запрос и он мне возвращает файлы, в которых есть эти слова
Эластик умеет в full text search, нужно правильно запрос построить будет. Залить туда файл можно точно также как ты заливаешь туда любой другой текст
Обсуждают сегодня