В зависимости от того, какой характер нагрузки, решения могут быть

Question

Big Data Science :: AI / Big Data / Machine Learning / MLOps

В зависимости от того, какой характер нагрузки, решения могут быть

очень разными. Чего больше: чтения или записи? Выборки последовательные или рандомные? По каким критериям идет выборка? Как планируется шардить данные, какие требования к резервированию? и т.д. т т.п… В перспективе: под узкие специфичные задачи на больших масштабах, как правило, выгоднее свое кастомное хранилище, написанное на си (возможно, как плагин к какой-то системе). Только не надо с этого начинать, поставьте любую СУБД (ту же maria) и дойдите с ней хотя бы до N гигабайт .)

#database #programming #russian #software

0

31.08.2016

1 ответов

39 просмотров

Skeptic · Accepted Answer

Больше записи. Выборки рандомные, чаще по ключевым полям, но относительно редкая часть запросов будет по LIKE %бла%блабла%. Про шардинг пока не думал, предполагается все хранить на одном сервере, соответственно, на одной ноде СУБД. Сохранность данных очень важна, но там, скорее всего, будет RAID с полным зеркалированием. Начинать со своего велосипеда тоже не очень-то хочется )

215 похожих чатов

В зависимости от того, какой характер нагрузки, решения могут быть

1 ответов

Похожие вопросы