Здорово, коммунити! Я совсем новичок. Вопрос такой, допустим я положил

Question

Здорово, коммунити! Я совсем новичок. Вопрос такой, допустим я положил

в hdfs gzip файлы. Каждый файл представляет собой кучку json-строк, пусть что-то типа "src_ip:ip,dst_ip:ip,dst_domain:domain". Я имею какой-то инструмент в hadoop кластере, чтобы выгрузить эти файлы с какой-то фильтрацией, например по ip источника?

#hadoop #russian #software

0

27.08.2021

1 ответов

44 просмотра

Nikita Zavadsky Zavadsky · Accepted Answer

Nikita Zavadsky Zavadsky

Я загуглил и нашёл, что делали с помощью спарка https://stackoverflow.com/questions/37461837/reading-json-files-in-spark-and-filter-them-out-by-id

0

27.08.2021

52 похожих чатов

Здорово, коммунити! Я совсем новичок. Вопрос такой, допустим я положил

1 ответов

Похожие вопросы