184 похожих чатов

Так как лучше всего заливать данные например из MSSQL в

ClickHouse, используя питон?

19 ответов

82 просмотра

быстрее всего через bcp экспортировать в TSV и заливать через clickhouse-client https://docs.microsoft.com/ru-ru/sql/relational-databases/import-export/import-and-export-bulk-data-by-using-the-bcp-utility-sql-server?view=sql-server-ver15 если одноразово если нет, то можно и через python нормально большими батчами

Slach [altinity]
быстрее всего через bcp экспортировать в TSV и зал...

да, но bcp не умеет экранировать, поэтому можно убить кучу времени на него впустую. Я пробовал с одним клиентом, в итоге написали генератор CSV файлов на go который читал MSSQL и писал CSV. python конечно тут использовать бессмысленно, только CPU насиловать

Vsevolod- Автор вопроса
Vsevolod
а если из вертики? Тоже через TSV?

я из вертики импорчу как TSV

Vsevolod
а если из вертики? Тоже через TSV?

по моему личному опыту из вертики быстро и удобно экспортировать в паркет.

Denny [Altinity]
я из вертики импорчу как TSV

а по скорости как? я может что делал не так, но экспорт в csv долго работал

Abazhurrr Bazhukhin
а по скорости как? я может что делал не так, но эк...

быстро, я не мерял особо, я делаю так echo "select * from " |Vsql -q -t -P format=unaligned | clickhouse-client

Vsevolod- Автор вопроса
Denny [Altinity]
я из вертики импорчу как TSV

а через пандас датафрейм имеет смысл пробовать или это плохая идея? Без файлов.

Vsevolod
а через пандас датафрейм имеет смысл пробовать или...

есть какой-то https://github.com/kszucs/pandahouse я не проверял

попробуйте datax

Vsevolod- Автор вопроса
Vsevolod
А что это?

https://github.com/alibaba/DataX/projects

мы используем несколько способов: 1) выгружаем через bcp из mssql и через clickhouse-client ипорт файла - очень быстро и просто, не нужно писать код 2) через DAG в airflow, пришлось написать operator для перекачки данных из mssql > clickhouse

Vsevolod- Автор вопроса
Bender Rodriguez
мы используем несколько способов: 1) выгружаем чер...

Интересует наиболее быстрые по времени варианты, объемы довольно приличные

Vsevolod
Интересует наиболее быстрые по времени варианты, о...

То, о чем говорил @den_crane, - это и есть быстрый по времени вариант отчасти, не требующий инструментов сверху

Мы из MSSQL тянем через insert select from jdbc(…)

Vsevolod
и как оно?

работает. Мы юзаем только копирование в лоб. Максимум с where version > XXX, полет нормальный. Про скорость не скажу - не меряли. Но у нас в mssql таблицы до 50М записей. Как на бОльших обьемах будет - не знаю

Похожие вопросы

Обсуждают сегодня

Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
И никого не интересует какие пакеты кто использует. ((% Заходишь на сайт симфони и видишь поддержку Украины - по законам РФ это ж экстремизм. Только никто не отказывается от с...
Am Ambrion
11
лучше скажите, причём тут паскаль?
Alexey Kulakov
36
Чтобы перехватить все нажимания буков на форме, надо хук ставить? Пробовал на форме ОнКейДаун, оно ловит клаву если фокус не на компоненте с вводом текста
Serjone
15
Народ! Впервые клиенту пришло письмо от РКН, у вас, дескать, есть яндекс метрика, а нигде не написано, что вы ее юзаете. Никто не сталкивался?
Sasha Beep
14
Всем привет! вывожу на общей стр дочерние ресурсыв каждом ресурсе галерея, и первая фотка должна выводиться на общей [!DocLister? &prepare=photo !]
Alekso
12
А можно вопрос? Мне сегодня сказали что у меня функция (которая просто заполняет массив значениями) не правильная void Full(double * arr, int n) { for (int i = 0; i < n; i...
† C E †
7
День добрый, подскажите пожалуйста, есть ли какой-то способ сказать ребару не компилировать определённое приложение? Всю доку их перечиатл ничего подобного не нашёл
Кирилл
14
Добрый вечер. Хочу чтобы у меня в классе поле было функцией, которая возвращает строку. Делаю так: interface ... TGetOutPath = function : String of object; ... protec...
Kirill Filippenok
12
Всем привет. Возможно ли выполнить код ahk без интерпритатора? Имея только скомпилированный ехе файл? Например как функция eval
proxy
6
Карта сайта