То, что в статье уже стало baseline для обучения, но на практике в проде это не работает)
Ничего толком не выдает по вопросам&ответам, можно не пыжиться ?
Сама идея рабочая (в какой то мере), полностью разговорного чат-бот помощника не сделать, но если смотреть под углом вопрос - ответ работать будет. Но так легко реализовать как в статье - не получится, там много работы с анализом и подготовкой данных к которым необходимо обращаться. В этой статье как и везде - ембеддинги делаются наугад, так же наугад они и будут тянуться каждый раз. + к этому, если что-нибудь важное случайно разделить пополам - то привет галлюцинации и пошло поехало в глубь) Типо такого систему реализовать - можно, я просто к тому, что это не будет так просто, легко и радужно как в статье (а еще лангчейн - только мешает по факту)
Какой-то тогда сейчас самый качественный Q&A по своему набору документов сделать?
Почему лангчейн мешает?
Потому что это просто обертка над API + промты, проще сделать все тоже самое самому, при этом не быть зажатым ограничениями их либы
Если хочешь из коробки то попробуй privateGPT, h2ogpt
Он помогает в начале. Это классная коллекция примеров. Но по мере развития продукта, он начинает мешать и отваливается
Отваливается да, но где не работает относительно легко перенаследоваться и переделать как требуется. В целом имхо в лангчейне классное абстрагирование
Обсуждают сегодня