170 похожих чатов

Всем привет! А какие есть бест практис, чтобы хранить большие

обьемы текстов, при этом делать поиск как по самим текстам, так и по метаданным и по заранее извлеченным фичам?

8 ответов

8 просмотров

бейзикли любая векторная бд для продакшена...

ну или эластик...

Mairna- Автор вопроса
Sergey Bratchikov
бейзикли любая векторная бд для продакшена...

Спасибо! А можно какой-нибудь пример из своей практики?

Mairna
Спасибо! А можно какой-нибудь пример из своей прак...

Лучше примера из практики на выбор любой нужной вам бдшки мне кажется сложно найти https://github.com/openai/chatgpt-retrieval-plugin/tree/main/datastore Отдельно в папке examples можете еще и докерфайлы найти нужные доя развертывания В папке docs инструкция по установке почти для каждого провайдера

Mairna
Спасибо! А можно какой-нибудь пример из своей прак...

Милвус не берите, он поднимает 100 (ну ладно 4) контейнера, при индексации больших объемов данных начинает падать с ошибками на гоу, хотя клиент на питоне. На гитхабе мне так и не ответили почему и что делать. Эластик тоже не берите, по шардам ищет последовательно (следовательно очень медленно). Квадрант и редис всс - топ!

Etki
> по шардам ищет последовательно Эм

Вернее по сегментам, но смысл тот же We do segment searches serially. So, comparing your two open KNN search tickets this is what I think is happening. You are on a single node with a single shard. That single shard has 49 segments, each seems to be an OK size (at least a GB or so). But, this then means, on a single node, you are exploring 49 different HNSW graphs. In the future, we want to make KNN work in parallel on the same shard but with different segments, but right now, that doesn't happen.

Похожие вопросы

Обсуждают сегодня

Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
48
привет всем. Народ, кто-нибудь работал с мультипоточностью? Где посмотреть/ что почитать посоветуете? В идеале чтоб материал был максимально сжатый, времени читать например в...
Serg Vish
18
Всем привет! Скажите, никто не пытался уменьшить размер процесса ssl, которые ассоциируется с открытым соединением (не помню точное название этого процесса, но там была какая-...
Алексей
20
This is a big issue. Just by being a citizen of a country, you are denied to contribute to Open Source software: https://youtu.be/L5Ec5jrpLVk?si=1iIuHnMPbCB4anV-
Sharuzzaman Ahmat Raslan
72
а проверьте, собирается ли у кого сейчас транк лазаря через делюкс? у меня вот: fpcupdeluxe: info: Lazarus Native Installer (BuildModuleCustom: UserIDE): LazBuild: building Us...
Iluha Companets
20
добрый день. возможно ли изменить цвет окон лазаруса? Как?
Budemposmotret
35
Мне тут приспичило встроить в программу форматировние текста SQL, расставить переносы строк и отступы так, чтобы лучше читалось. Я что-то свое изобразил, оно после ключевых сл...
Sergey Bodrov
11
А какие существуют способы обработки ошибок выделения памяти в ядре? Т.е., допустим, есть функция, которая возвращает адрес свободной страницы в физической памяти и диапазон в...
disba1ancer
51
Господа, а кто-нибудь сталкивался с размещением на TTabControl/TTabSheet множества контролов (> 100) с последующими External: Access violation? Вот буквально на ровном месте. ...
Dmitry
29
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
18
Карта сайта