векторной БД храним эмбединги текстов / информации, запрос конвертим в вектор и ищем К ближайших соседей или сколько надо, а потом на базе результатов, которые подсунули ллм на вход - задаем вопрос относительно контекста.
На этом этапе верное направление мысли?
Если да, то допустим, что в БД есть информация о ставке по кредиту - 13.2… эту инфу надо обновить… выставить 13.5… как с этим обстоят дела у векторах БД, с изменениями типа UPDATE WHERE?
У меня пока одна мысль относительно решения этой задачи - в мета хранить позиционную информацию об исходном тексте, при изменении исходной информации - строить эмбединг, удалять вектор, пересчитывать новый и вставлять.
Насколько это решение концептуально верно / реализуемо / возможно?
можно эти факты изначально извлечь, заменить в тексте какими-то служебными полями типа <СТАВКА>, тогда вектора пересчитывать не надо будет, а потом просто подставить при необходимости
Да, тоже хорошее решение. Про пересчет вектора мысль была в том, что так можно держать актуальным инфу в БД, если изменились, формулировки в каком-то абзаце, например и эту инфу надо учесть в последующей обработке. Тогда, в целом, вроде особых проблем с фактологией может и не быть, если под ковром держать выдачу исходную и иметь возможность в случайный момент времени проверить данные
Обсуждают сегодня