которые содержат текст. Необходимо фильтровать и отбрасывать всё то, что не нужно, тобиш по определённым критериям текст нужен.
Какие вообще есть алгоритмы и принципы решения подобных задач? Где мне копать, что поискать? Первое что пришло в голову - фильтрация по ключевым словам, но насколько это рационально ...
Нужно больше конкретики. Тут от полнотекстового поиска и кастомных индексов до «прогнать каждую запись через регекс», в зависимости от объёмов и от того что реально нужно делать
Обсуждают сегодня