очень разными. Чего больше: чтения или записи? Выборки последовательные или рандомные? По каким критериям идет выборка? Как планируется шардить данные, какие требования к резервированию? и т.д. т т.п… В перспективе: под узкие специфичные задачи на больших масштабах, как правило, выгоднее свое кастомное хранилище, написанное на си (возможно, как плагин к какой-то системе). Только не надо с этого начинать, поставьте любую СУБД (ту же maria) и дойдите с ней хотя бы до N гигабайт .)
Больше записи. Выборки рандомные, чаще по ключевым полям, но относительно редкая часть запросов будет по LIKE %бла%блабла%. Про шардинг пока не думал, предполагается все хранить на одном сервере, соответственно, на одной ноде СУБД. Сохранность данных очень важна, но там, скорее всего, будет RAID с полным зеркалированием. Начинать со своего велосипеда тоже не очень-то хочется )
Обсуждают сегодня