72 похожих чатов

Есть http://conceptnet.io/ (семантическая сеть, в которой данные представляются ввиде троек:

"src_url", "relation", "dst_url"; где "url" по сути язык + слово). Дамп в CSV занимает почти 10 гигов.
Делаю либу, которая будет её использовать. У них есть либа на Python, с помощью которой можно развернуть базу и делать запросы. Однако, оно использует PostgreSQL, а либа будет использоваться лингвистами, которые могут не осилить поднять PostgreSQL, поэтому очень хотелось бы использовать что-то типа SQLite. Очень похоже, что графовые DBMS подошли бы, однако я не нашёл такой, чтобы она не требовала демона, имела Python интерфейс и быстро работала. Попробовал SQLite с такой схемой — очень медленно работает, потому что постоянно пишет на диск, хотя я `commit`не вызываю.
Какие решения вы бы порекомендовали?

3 ответов

22 просмотра

Не надо скульллайт, имхо

Ещё Firebird можно рассмотреть. Он, например, традиционно умеет работать в embedded-режиме: запускаться, как библиотека вместе с приложением, работать с файлом базы, завершаться тоже с приложением.

Тут надо использовать то, что задачу потянет, а не то, что лингвисты смогут поставить, это однозначно.

Похожие вопросы

Обсуждают сегодня

Ребята, всем привет. Подскажите, пожалуйста, можно ли как-то через бота понять, что этого бота добавили в группу\канал и выдали ему права администратора?
Artem Stormageddon
9
Привет, такой вопросик появился кажется ли вам что Rust слишком сложный/строгий для высокоуровневого программирования и слишком "безопасный"/строгий для низкоуровневого?
Крокант
10
Это переведённый текст с английского. Я не говорю на русском, но могу использовать переводчик Телеграм. Приветствую! Я начинающий веб-разработчик и все еще учусь. В настояще...
𐩱𐩪𐩣𐩱𐩲𐩺𐩡
2
А какие существуют способы обработки ошибок выделения памяти в ядре? Т.е., допустим, есть функция, которая возвращает адрес свободной страницы в физической памяти и диапазон в...
disba1ancer
51
Всем привет. Хотел бы написать для себя свою ос. Причины: 1) нужен опыт в чем-то 2) будет меньше весить 3) свое, но там будут свои задумки Я понимаю что нужно писать для всег...
Shadow Akira
18
А не хотим ли мы развлечься? 😉 Но так чтобы с пользой для наших профессиональных навыков?? 👨‍🎓👩‍🎓 Предлагаю на октябрь запланировать тестовый запуск новой командной игры "Игр...
Andrii Kurdiumov
2
Всем привет! Скажите, никто не пытался уменьшить размер процесса ssl, которые ассоциируется с открытым соединением (не помню точное название этого процесса, но там была какая-...
Алексей
20
5? да там все 10
Boris Vinogradov
12
Привет всем! Почему этот код не срабатывает при добавлении или удалении пользователя из чата? bot.on('chat_member', async (ctx) => { console.log(ctx); }) bot.launch({allo...
Alexander
5
у кого сколько оперативы на базе данных ?
АДИЛЬБЕК
4
Карта сайта