которыми наполняется эта таблица, достаточно разреженные (в одной записи может быть 20-30 полей)
Сейчас мы инсертим json’ами, но мощностей не хватает немного.Впорос: если инсертить tsv, много ли производительности можно выиграть?Стоит ли игра свеч?
Инсертим блоками по 10к записей.
Да. Но если у вас изначально данные в json то нужно будет учитывать потери конвертации на вашей стороне
от двух раз в части парсинга. Вы попробуйте сделайте тестовую таблицу с точно такой же структурой, и выгрузите из основновной миллион в формате json и в формате tsv и вставьте в тестовую
в целом у меня есть возможность управлять форматом изначальных данных Они сначала из кафки читаются питоном, который конвертирует их в словари, а потом одной пачкой заталкивает по http
Раз так и так конвертируете, делайте тсв, потом траблшутить проще
Еще авро есть ща, тоже должен быть ок
Обсуждают сегодня