184 похожих чатов

Это 20 TB уже пожатых, Delta + ZSTD. partition pruning

хочу!

залил рандомные 500gb raw данных и вижу вот такое распределение по датам:

SELECT
year(data_time) AS year,
count(*) AS cnt
FROM r2
GROUP BY year
ORDER BY year ASC

┌─year─┬────────cnt─┐
│ 1900 │ 1717 │
│ 1970 │ 336 │
│ 1991 │ 10 │
│ 1993 │ 1 │
│ 1998 │ 1 │
│ 1999 │ 7 │
│ 2000 │ 56 │
│ 2001 │ 74706 │
│ 2002 │ 424137 │
│ 2003 │ 27645 │
│ 2004 │ 31 │
│ 2005 │ 62790 │
│ 2006 │ 65497 │
│ 2007 │ 20372 │
│ 2008 │ 507930 │
│ 2009 │ 1053681 │
│ 2010 │ 321839 │
│ 2011 │ 399510 │
│ 2012 │ 88383979 │
│ 2013 │ 189136342 │
│ 2014 │ 380106969 │
│ 2015 │ 607335989 │
│ 2016 │ 801748373 │
│ 2017 │ 1257747968 │
│ 2018 │ 1810193807 │
│ 2019 │ 2366066940 │
│ 2020 │ 3058931244 │
│ 2021 │ 3963027933 │
│ 2022 │ 2998302621 │
│ 2023 │ 15 │
│ 2026 │ 7 │
│ 2029 │ 16670 │
│ 2032 │ 20 │
│ 2045 │ 6 │
│ 2051 │ 81 │
│ 2059 │ 905 │
│ 2060 │ 156 │
│ 2061 │ 6220 │
│ 2062 │ 20918 │
│ 2063 │ 92 │
│ 2081 │ 9 │
│ 2102 │ 28 │

когда залью оставшиеся 200TB картина немного измениться, но все равно 99% данных равномерно размажется по 10и годам, остальное раскидает практически рандомно (сбитые чаcы на датчиках).
какой ключ партиционирования посоветуете чтобы запросы с предикатом по timestamp работали максимально быстро? при toYYYYMM еще на этапе заливки raw данных будет too many parts per insert, т.к. исходные данные в csv сортированы по device_id, data_item_id
хотелось бы toYYYYMM для диапазона 2000-2030 и toYYYY для всего остального, но как это сформулировать?

1 ответов

10 просмотров

сделайте новую колонку, в которой либо настоящая дата, либо первое января, в зависимости от года, все данные года будут в январской партиции но и фильтровать в запросах надо будет по этой же колонке, а не по оригинальной

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Мужики. привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных элементов...
Kraszx
2
Товарищи, кто работа с iphelper? Или может я в самой логике ошибки фигачу, не пойму.... var ifTable : PMIB_IFTABLE; size, corSize: DWORD; Buffer ...
Warfarellen
4
я так понимаю, я так подозреваю, что создание такого плагина для человека, кто умеет писать плагины для делфи потребует минут 5-10 времени. но это мое подозрение. хотелось бы ...
Kraszx
7
Карта сайта