количество текстов, сейчас нужно найти совпадения и частоту по каждому тексту большого количества фраз. Проблема в том что я не уверен какие будут задачи в будущем, решения типа elasticsearch не предоставляют данных например по частоте слова внутри конкретного текста (только по всей выборке), поэтому не понятно... Сейчас все лежит в mongodb и как-то хреново...
Это не то что тебе нужно ? https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-termvectors.html
Обсуждают сегодня