184 похожих чатов

Добрый день. Имеется Clickhouse-server 22.1.4.1 Есть таблица с ENGINE s3. CREATE TABLE cf_edge_logs (

ClientIP String,
...
...
OriginResponseDurationMs Int64
)
ENGINE = S3('https://storage.yandexcloud.net/bucket/{20220621..20221231}/*', 'AWS_ID', 'AWS_KEY', 'JSONEachRow', 'gzip')
SETTINGS date_time_input_format='best_effort';
В s3 расположены веб-логи.
Пытаюсь делать select * from cf_edge_logs
Получаю:
DB::Exception: inflateReset failed: data error: While executing S3. (ZLIB_INFLATE_FAILED)
Если ограничить limit'ом, то работает корректно.
Кто-нибудь сталкивался, как побороть?
Нашел тикет https://github.com/ClickHouse/ClickHouse/issues/412 , но решения что-то не нашел.

7 ответов

17 просмотров

уверены что у вас там в бакете только gzip данные лежат?

Ильдар- Автор вопроса
Slach [altinity]
уверены что у вас там в бакете только gzip данные ...

Тут - https://storage.yandexcloud.net/bucket/{20220621..20221231}/* да. Туда Cloudflare логи пишет в *.gz. Папка пока что одна только, но планируется больше(по дням).

а в чем смысл select * from cf_edge_logs ? хочется куда то вне clickhouse данные слить? или у вас INSERT INTO ... SELECT * FROM ?

Ильдар- Автор вопроса
Slach [altinity]
а в чем смысл select * from cf_edge_logs ? хочетс...

Да, из клика данные идут в инструмент визуализации данных, yandex DataLens. Я, пока что, сомневаюсь в работоспобности данной схемы, пробую только. Только SELECT Datalens -> CH -> S3

Ильдар
Да, из клика данные идут в инструмент визуализации...

мне кажется DataLens напрямую из s3 в целом может прочитать... clickhouse нужен только если захочется аггрегировать на его стороне но тогда надо данные туда тащить а не в S3 хранить не в MergeTree

Ильдар- Автор вопроса
Slach [altinity]
мне кажется DataLens напрямую из s3 в целом может ...

В самом datalens в подключениях s3 отсутствует. И доке datalens, на данный момент, только через ClickHouse. https://cloud.yandex.ru/docs/tutorials/datalens/storage-logs-analysis Немного подумаю, как быть дальше) Спасибо за ответ👍

Ильдар- Автор вопроса
Slach [altinity]
уверены что у вас там в бакете только gzip данные ...

Вы были правы. Cloudflare кладет один .txt файл. В таблице поправил *.gz - заработало Спасибо еще раз.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта