шардов, 2 реплики. Каждая нода по 16 ядер и 128Gb RAM). В операции INSERT Пробуем использовать движок S3 с указанием SETTINGS distributed_ddl_task_timeout=0, insert_deduplicate=0, max_threads = 16, max_insert_threads=16 и видим что данные загружаются со скростью 1.5 million rows/s. Затем исходя из рекомендаций по оптимизации загрузки, настраиваем на каждой ноде max_threads = 16, max_insert_threads=16 и пробуем загружать через S3Cluster и получаем примерно такую же скорость или даже чуть меньше. Что мы делаем не так и как добиться прироста скорость загрузки данных через S3Cluster?
А вы точно не упёрлись в произвоительность MinIO? > получаем примерно такую же скорость На всех нодах в сумме?
https://altinity.com/blog/loading-100b-rows-in-minutes-in-altinity-cloud Почитайте
Обсуждают сегодня