в json формате
Всё это нужно каким-то образом хранить(желательно json. думаю PostgreSQL или ClickHouse) и вывести ввиде диаграммы частоту слов и оценки
Допустим выбрал какую-то бд, это надо будет несколько тысяч отзывов сохранить в памяти из запроса в бд, или лучше в файл, а потом генератором пройтись? Хотя для дальнейшей обработки всё же нужны будут все отзывы с текстом🤔
Или может при парсинге формировать нужную структуру и вставлять в реляционную БД, а после выгрузить всё и проходить по тексту(частота слов)
если ответов немного (несколько тысяч — это ерунда), то можно вообще не морочиться и хранить все в файлах. процессинг уже будет зависеть от задач аналитических. сначала концептуально задачку решить и прототип сделать и взвесить, а потом уж про базы и архитектуру говорить.
Обсуждают сегодня