активно дремио юзается, и даже была какая-то преза?
да, вполне активно
А есть преза или видосик какой? Или не ваш был? Тут просто есть у коллег мысль, что можно его забрать как прото-фичестор. Вот и хочу понять, надо ли лезть в тестирование, т.к. это не быстро.
хм, ну tech-dive под рукой нет, скорее могу на конкретные вопросы ответить
Да их чёт пока и нет, для меня это пока черный ящик.
Это sql-движок поверх любых источников с няшным интерфейсом. Топят за виртуализацию датасетов с материализацией при необходимости
Ну вот вроде звучит как кейс для фича стора, если ещё допилить модуль мониторинга и интеграцию с оркестратором. Но мне непонятно, насколько это производительное решение - норм ли оно будет поднимать фичи за большую историю (много жирных партиций в хадупе) и джойнить произвольно с таргетами, например, когда надо всего по 5-10 записей из каждой партиции вытащить, или же для этого лучше выбрать вначале потестить MPP.
фича стор это метаданные + оркестрация, движок под ними может быть любой (если он умеет делать федеративные запросы - это хорошо, но не обязательно)
у тебя под этот кейс и спарк, и трино, и дримиво подойдут
дело говорит!
Спарк кашляет. Долго.
дримиво кашляет не меньше
это не проблема фича стора
Мне кажется, что оркестрация и непосредственно выполнение etl должно лежать на отдельном инджесторе, который уже, в свою очередь, бесшовно интегрируется с фича стором, на стороне которого - мета, хранилки и мониторинг.
Обсуждают сегодня