Привет коллеги! Подскажите пожалуйста, как корректно оценить средний вес столбцов

Question

Привет коллеги! Подскажите пожалуйста, как корректно оценить средний вес столбцов

в таблице?
Есть задача, сократить объем инсерта. Сокращать планирую построением топа самых жирных вставляемых полей(с дальнейшим анализом нужности). Размер изначально пустой таблицы после инсерта составляет 45гб. В таблице 600 полей. Я посчитал средний вес каждого поля функцией avg(datalehgth(colName)). Однако после сложения всех средних значений веса столбцов и умножении на кол-во строк, я получаю 7.5гб а не 45. То есть что-то я явно делаю не так. Подскажите пожалуйста, как можно корректно построить топ самых тяжёлых столбцов в табле? (Также в табле большая часть нулевых столбцов без значений, но они как я понимаю не должны иметь существенного веса)

#programming #russian #sql

0

10.10.2023

11 ответов

103 просмотра

Gopneg

а каким образом ты будешь сокращать? ну допустим ты узнал что 10, 100 и 555 поля больше всех

0

10.10.2023

Zakhary Автор вопроса

Gopneg
а каким образом ты будешь сокращать? ну допустим т...

Эти поля передам в продуктовую команду для анализа необходимости их хранения для дальнейшего расчета

0

10.10.2023

Gopneg

Zakhary
Эти поля передам в продуктовую команду для анализа...

из-за каких-то 45гб будешь людей напрягать? причем даже не 45, а скажем гб 10 тебе скинут

0

10.10.2023

Zakhary Автор вопроса

Gopneg
из-за каких-то 45гб будешь людей напрягать? причем...

Буду напрягать, работа такая 😂

0

10.10.2023

Roman Sergeev

Вам надо просто посчитать sum(datalength) для каждой колонки Дальше оно с точностью до фактического fillfactor и нюансов типа одного бита на null даст нужное Вероятно, вам стоит почитать про секционирование и columnstore

0

10.10.2023

Zakhary Автор вопроса

Roman Sergeev
Вам надо просто посчитать sum(datalength) для кажд...

Спасибо я попробую

0

10.10.2023

Yuriy T

План запроса и понимание всего процесса есть? Вдруг у тебя там селект тупит который используется для вставки

0

10.10.2023

Zakhary Автор вопроса

Yuriy T
План запроса и понимание всего процесса есть? Вдру...

Селект Каунт по условию работает секунд 15. Топ 100 с сортировкой по условию в пределах минуты. Как я вижу с логикой селекта проблемы маловероятны.

0

10.10.2023

Sergey Gladkikh

Потому что пустое поле не означает что под него не выделено место. Скопируй интересующую колонку (одну) во временный объект с той же метадатой и замерь его размер

0

10.10.2023

Zakhary Автор вопроса

Sergey Gladkikh
Потому что пустое поле не означает что под него не...

Спасибо попробую. Правда пока не представляю как это сделать для 600 столбцов

0

10.10.2023

Ilya Zviagin · Accepted Answer

Ilya Zviagin

600 полей в таблице?

0

10.10.2023

169 похожих чатов

Привет коллеги! Подскажите пожалуйста, как корректно оценить средний вес столбцов

11 ответов

Похожие вопросы