Всем привет. беглый поиск по чату на тему альтернативы sqoop

показал, что прямой альтернативы (чтобы прям open source продукт) вроде нет. есть работающие и проверенные собственные наработки на spark, java, scala, python, кто-то даже shell-ом не стесняется пользоваться. посему вопрос, таки нет альтернатив или есть? что думаете относительно nifi?

24 ответов

23 просмотра

1. Скуп говно 2. Nifi старый комбайн, и это оверкилл 3. Берешь и пишешь исходя из специфики

Бронислав Житников
:nu-da-poshel-ya:

ну у людей явно нет целой толпы людей и надо из реляционок тащить

А что именно хочется от NIFI получить, NIFI может быть хорошим решением но он действительно тяжелый...

Dmitry Zuev
ну у людей явно нет целой толпы людей и надо из ре...

да ну, то что у нас целых 5 человек подпиливают NIFI 'это скорее следствие того что у нас много людей пилящих пайплайны и много разнообразных источников. А для небольших компаний хватить 1 человека не сильно больших ресурсов техники. Ну для реляционка - реляционка наверное можно придумать варианты получше... здесь я не спорю

Бронислав Житников
да ну, то что у нас целых 5 человек подпиливают N...

а вот даже интересно было бы устроить опрос, сколько людей в средней де команде а то сначала разговоры идут о том, что нет 5 человек а потом оказывается, что количество де исчисляется десятками )

Stanislav Lysikov
а вот даже интересно было бы устроить опрос, сколь...

потом выясняется что команд по 5 человек 10

мы когда делали выгрузки из датабаз, скууп хуже со странными типами работал (например, таймстемпы в лонги превращались) + еще пара проблем. спарком еще можно было прокидывать что-то, вроде select *, <хрень-экспр1>, <хрень-экспр2>.. в итоге сделали на спарке, выгружали > 500 таблиц в день, загружали merge-ом в delta lake

Скуп неживой Для спарка надо код писать NiFi в проде не пробовал Всё неудобно( Поэтому советую погонять Nifi, там хотя бы мышкой прямоугольники перетаскивать нужно

iKaleeninskii
Скуп неживой Для спарка надо код писать NiFi в про...

код написать - 1 раз. потом просто ямл докинуть. или 500 ямлов, по 1 на табличку

Сиплый
код написать - 1 раз. потом просто ямл докинуть. и...

это если все знают, что делать. А если нет, то написать пять раз, переписать шашнадцать, ямлы инвалидировать и переделывать каждый день(

Munir- Автор вопроса

в контексте вопроса интересует мнение окружающих на тулзы загрузки данных из разных источников в хранилище. найфай упомянут только за то, что имеет кучу коннекторов, что имеет историчность,, что встроено логирование и можно скрыть креды, что может графически отобразить схему загрузки. т.е. никакой другой обработки, кроме взять и положить. но очень интересно, также и почему точно нет. "сильно перегружен" аргумент конечно, но вдруг еще есть что-то конкретное? ну и да. вопрос был, какие есть еще решения....

Munir
в контексте вопроса интересует мнение окружающих н...

можно сделать кстати свою сборочку которая будет меньше нагружена и еще использовать для обработки на проде minify вместо nifi. Но если цель батчевые выгрузки с десятками гигабайт на выгрузку то наверное лучше не NIFI... (хотя батч на 100 ГБ можно же наверняка порезать на микробатчи :) )

Из opensource похожий функционал имеют продукты talend. Но зачем вообще его менять? Это бессмертная и простая утилита, например как DistCp. Она используется например в Informatica BDE, ODI вроде тоже, думаю и в talend тоже. Короче это АК в мире BigData)) для batch RDBMS -> hdfs.

Только он помер

Alex Leshkov
Только он помер

Ну не значит же что не работает в текущем варианте

Nikita B
Ну не значит же что не работает в текущем варианте

Это значит, что может в любой момент перестать работать. Т.е. имеет смысл искать замену и тем более не делать новое внедрение

Станислав
Из opensource похожий функционал имеют продукты ta...

если человека не устраивает Sqoop, то его скорее всего не устроит и DistCp

iKaleeninskii
это если все знают, что делать. А если нет, то нап...

согласен 😞 написать норм даже такую, казалось бы, простую вещь - не 1 вечера дело, даже для знающих. зато масштабировать удобно, т. к. пофиг, 20 там таблиц, или 2000 надо выгружать. с другой стороны, если база - три таблички и три строчки, то это оверкил

ну тут как всегда, срачик образовался 😁

Munir- Автор вопроса

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта