184 похожих чатов

Добрый день. Имеется Clickhouse-server 22.1.4.1 Есть таблица с ENGINE s3. CREATE TABLE cf_edge_logs (

ClientIP String,
...
...
OriginResponseDurationMs Int64
)
ENGINE = S3('https://storage.yandexcloud.net/bucket/{20220621..20221231}/*', 'AWS_ID', 'AWS_KEY', 'JSONEachRow', 'gzip')
SETTINGS date_time_input_format='best_effort';
В s3 расположены веб-логи.
Пытаюсь делать select * from cf_edge_logs
Получаю:
DB::Exception: inflateReset failed: data error: While executing S3. (ZLIB_INFLATE_FAILED)
Если ограничить limit'ом, то работает корректно.
Кто-нибудь сталкивался, как побороть?
Нашел тикет https://github.com/ClickHouse/ClickHouse/issues/412 , но решения что-то не нашел.

7 ответов

10 просмотров

уверены что у вас там в бакете только gzip данные лежат?

Ильдар- Автор вопроса
Slach [altinity]
уверены что у вас там в бакете только gzip данные ...

Тут - https://storage.yandexcloud.net/bucket/{20220621..20221231}/* да. Туда Cloudflare логи пишет в *.gz. Папка пока что одна только, но планируется больше(по дням).

а в чем смысл select * from cf_edge_logs ? хочется куда то вне clickhouse данные слить? или у вас INSERT INTO ... SELECT * FROM ?

Ильдар- Автор вопроса
Slach [altinity]
а в чем смысл select * from cf_edge_logs ? хочетс...

Да, из клика данные идут в инструмент визуализации данных, yandex DataLens. Я, пока что, сомневаюсь в работоспобности данной схемы, пробую только. Только SELECT Datalens -> CH -> S3

Ильдар
Да, из клика данные идут в инструмент визуализации...

мне кажется DataLens напрямую из s3 в целом может прочитать... clickhouse нужен только если захочется аггрегировать на его стороне но тогда надо данные туда тащить а не в S3 хранить не в MergeTree

Ильдар- Автор вопроса
Slach [altinity]
мне кажется DataLens напрямую из s3 в целом может ...

В самом datalens в подключениях s3 отсутствует. И доке datalens, на данный момент, только через ClickHouse. https://cloud.yandex.ru/docs/tutorials/datalens/storage-logs-analysis Немного подумаю, как быть дальше) Спасибо за ответ👍

Ильдар- Автор вопроса
Slach [altinity]
уверены что у вас там в бакете только gzip данные ...

Вы были правы. Cloudflare кладет один .txt файл. В таблице поправил *.gz - заработало Спасибо еще раз.

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Язык Си можно выучить за день? По книжке ANSI C на 230 страниц
Vincent Vegan
29
Привет, запускаю werf в dind в k8s, получаю ошибку на этапе build/beforeSetup: /.werf/stapel/embedded/bin/bash: /.werf/scripts/5898bdfe5214357d3706b879cc8d3d78460fb379607cbd...
florius0
7
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Есть какой-нибудь для Delphi/FPC T*Compression(Decompression)Stream на базе LZ4/Zstd/любой другой быстрый(и хорошо сжимающий) алгоритм А ещё лучше в pure pascal А ещё лучше од...
notme
7
Dim Dim, [02.07.2024 11:07] DB 0x62 Dim Dim, [02.07.2024 11:07] DB 0x66 Dim Dim, [02.07.2024 11:07] кто пояснит что это?
Dim Dim
14
Ошибка: segmentation fault (core dumped) Код: pastebin.com/BEsNNSSV Сообщение от компилятора: отсутствует ОС: Arch Linux Ядро: x86_64 Linux 6.9.7-arch1-1 Процессор: Intel Cele...
sec
4
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
Кстати, я тут еще с одной темой столкнулся, вот учу я C++, на таком то ресурсе, а остальные постоянно советуют практиковаться, что то писать, проекты, но как писать если вот т...
aaswq1
7
Карта сайта