но каждой реплики по 1, и я хочу обучить бота естественно, чтобы он понимал интенты по каждой реплике, а для этого нужно по 10 примеров скажем. В общем мне нужна аугментация данных, в нете кое-что нашел, да и можно скрипт написать, который будет на синонимы менять, но это плохо, тк нет смыслового контроля за этим.
Может есть модель типа sent2vec чтобы близкие по смыслу приям предложения выдавала? ну русском
Tsne?
Ближе всего к этому задача перефразирования (гуглим NLP Paraphrasing). Я рассматривал статьи по теме полгода назад, ничего подходящего мне для схожей задачи увы не нашел. Может появилось.
Обсуждают сегодня