Всем привет. беглый поиск по чату на тему альтернативы sqoop

показал, что прямой альтернативы (чтобы прям open source продукт) вроде нет. есть работающие и проверенные собственные наработки на spark, java, scala, python, кто-то даже shell-ом не стесняется пользоваться. посему вопрос, таки нет альтернатив или есть? что думаете относительно nifi?

24 ответов

12 просмотров

1. Скуп говно 2. Nifi старый комбайн, и это оверкилл 3. Берешь и пишешь исходя из специфики

Бронислав Житников
:nu-da-poshel-ya:

ну у людей явно нет целой толпы людей и надо из реляционок тащить

А что именно хочется от NIFI получить, NIFI может быть хорошим решением но он действительно тяжелый...

Dmitry Zuev
ну у людей явно нет целой толпы людей и надо из ре...

да ну, то что у нас целых 5 человек подпиливают NIFI 'это скорее следствие того что у нас много людей пилящих пайплайны и много разнообразных источников. А для небольших компаний хватить 1 человека не сильно больших ресурсов техники. Ну для реляционка - реляционка наверное можно придумать варианты получше... здесь я не спорю

Бронислав Житников
да ну, то что у нас целых 5 человек подпиливают N...

а вот даже интересно было бы устроить опрос, сколько людей в средней де команде а то сначала разговоры идут о том, что нет 5 человек а потом оказывается, что количество де исчисляется десятками )

Stanislav Lysikov
а вот даже интересно было бы устроить опрос, сколь...

потом выясняется что команд по 5 человек 10

мы когда делали выгрузки из датабаз, скууп хуже со странными типами работал (например, таймстемпы в лонги превращались) + еще пара проблем. спарком еще можно было прокидывать что-то, вроде select *, <хрень-экспр1>, <хрень-экспр2>.. в итоге сделали на спарке, выгружали > 500 таблиц в день, загружали merge-ом в delta lake

Скуп неживой Для спарка надо код писать NiFi в проде не пробовал Всё неудобно( Поэтому советую погонять Nifi, там хотя бы мышкой прямоугольники перетаскивать нужно

iKaleeninskii
Скуп неживой Для спарка надо код писать NiFi в про...

код написать - 1 раз. потом просто ямл докинуть. или 500 ямлов, по 1 на табличку

Сиплый
код написать - 1 раз. потом просто ямл докинуть. и...

это если все знают, что делать. А если нет, то написать пять раз, переписать шашнадцать, ямлы инвалидировать и переделывать каждый день(

Munir- Автор вопроса

в контексте вопроса интересует мнение окружающих на тулзы загрузки данных из разных источников в хранилище. найфай упомянут только за то, что имеет кучу коннекторов, что имеет историчность,, что встроено логирование и можно скрыть креды, что может графически отобразить схему загрузки. т.е. никакой другой обработки, кроме взять и положить. но очень интересно, также и почему точно нет. "сильно перегружен" аргумент конечно, но вдруг еще есть что-то конкретное? ну и да. вопрос был, какие есть еще решения....

Munir
в контексте вопроса интересует мнение окружающих н...

можно сделать кстати свою сборочку которая будет меньше нагружена и еще использовать для обработки на проде minify вместо nifi. Но если цель батчевые выгрузки с десятками гигабайт на выгрузку то наверное лучше не NIFI... (хотя батч на 100 ГБ можно же наверняка порезать на микробатчи :) )

Из opensource похожий функционал имеют продукты talend. Но зачем вообще его менять? Это бессмертная и простая утилита, например как DistCp. Она используется например в Informatica BDE, ODI вроде тоже, думаю и в talend тоже. Короче это АК в мире BigData)) для batch RDBMS -> hdfs.

Только он помер

Alex Leshkov
Только он помер

Ну не значит же что не работает в текущем варианте

Nikita B
Ну не значит же что не работает в текущем варианте

Это значит, что может в любой момент перестать работать. Т.е. имеет смысл искать замену и тем более не делать новое внедрение

Станислав
Из opensource похожий функционал имеют продукты ta...

если человека не устраивает Sqoop, то его скорее всего не устроит и DistCp

iKaleeninskii
это если все знают, что делать. А если нет, то нап...

согласен 😞 написать норм даже такую, казалось бы, простую вещь - не 1 вечера дело, даже для знающих. зато масштабировать удобно, т. к. пофиг, 20 там таблиц, или 2000 надо выгружать. с другой стороны, если база - три таблички и три строчки, то это оверкил

ну тут как всегда, срачик образовался 😁

Munir- Автор вопроса

Похожие вопросы

Обсуждают сегодня

Всем привет. Нужна платная консультация от тех, кто сталкивался с октябрём в кластере или шарит оч хорошо в цмс. Проблема следующая: после переноса в кластер октябрь начал ...
wl
8
Добрый день, не подскажите, если в OC-V3 поменять страндартную директорию /storage/ на /storage2/ - не будет сильно много проблем ?
Max Dubovsky
32
а я честно сказать не понимаю - нахуя идти учиться на вышку или еще куда-либо и при этом нихуя не делать, типа зачем ? просто корку получить, а нахуй она нужна тогда ?
Eugene Неелов
7
'frakturBold' => ['𝖆', '𝖇', '𝖈', '𝖉', '𝖊', '𝖋', '𝖌', '𝖍', '𝖎', '𝖏', '𝖐', '𝖑', '𝖒', '𝖓', '𝖔', '𝖕', '𝖖', '𝖗', '𝖘', '𝖙', '𝖚', '𝖛', '𝖜', '𝖝', '𝖞', '𝖟', '𝕬', '𝕭', '𝕮', '𝕯'...
Roma
4
Каким то образом можно определить ширину экрана пользователя перед загрузкой partial-а? Надо рассчитать ширину кадров слайдера для ресайза картинок для container-fluid.
Point 111
22
зараз якщо створити файл core/custom/define.php з текстом <?php const NO_SESSION = true; можна позбутися сесійних кукі (що зручно, щоб не показувати людям банери про збір та в...
Artur Kyryliuk
1
А сколько часов мак держит зарядку в рабочем режиме? Например мой Redmi Mac (просто наклейка от айфона осталась, налепил) по началу держал часов 5 с парой открытых штормов и ...
Ross
8
я бы даже сказал не размер резюме, а слова, которые там написаны, потому что резюме может быть на несколько десятков страниц из-за 20 летнего опыта работы, но там в опыте буде...
Eugene Неелов
2
так а я не могу просто новый сделать ? я пробовал не прокатило но может чето упускаю
Максим
3
Ребят, было ли у вас так, что переменные в WebApp —tg-viewport-height, —tg-viewport-stable-height после метода expand не обновляются, а остаются в размерах, как было до expand...
Black
3
Карта сайта