и морфологически разбор слов в них.
Морфологический разбор слова представлен в виде тегов (1 тэг —строка длиной в 4 символа, всего тегов 115, в разборе может присутствовать до 10).
Не совсем понятно, как быть: хранить в таблице записи сообщений и разбор слов в виде двумерного массива из слов и их тэгов, или писать в таблицу по одному слову и сделать для каждого тэга по отдельному столбцу.
Со вторым вариантом кажется легче будет искать что-то по тэгам, а с первым легче будет группировать данные по сообщениям. Нужно и то, и другое. Возможно я вообще не туда смотрю, и можно сделать иначе.
Есть у кого-нибудь идеи?
Количество тегов может расти?
Теоретически, да
есть залитые данные в таблице? можно посчитать кол-во уникальных комбинаций тегов?
Обсуждают сегодня