Всем привет. Есть вопрос по Spark&Databricks&Delta. Дескрипшн что происходит У меня есть

сильвер таблицы разбитые скажем по кривым. От этих сильвер таблиц кормится голд слой (если округлить, по сути просто объединенная таблица по всем кривым).
Нужно обновлять эту голд таблицу с минимальным делеем (даже 5 минут сказали много, btw данные не для аналитики).
Навесить вьюшку нельзя, потому что запрос к вьюхе выполняется слишком долго (требование к времени выполнения простого запроса на голд таблице 1-2 сек, а с вьюхой >15-30c)
Материализованная вьюха от бриксов обновляется самое быстрое - 5 мин, так как под капотом DLT, которые долго расчехляются.
Грузить стримом нельзя, потому что на сильвер слое делаются мержи, а стрим будет падать на апдейтах.
Соответственно единственный (как я вижу) способ - батч. Я смогла ужать интервал обновления минут до 2-3х, но поступило предложение грузить апдейты сильвер таблиц сразу после апдейта самой сильвер таблицы в параллель.
Вопрос
Concurrency error при мерже - будет ли он происходить, если два параллельных мержа не затрагивают строки на апдейт друг друга, т.е. работают с данными из разных кривых, например если голд будет спартицирован по айди кривой? (я конечно все равно буду чекать, но если кто-то знает с берега сразу, сильно облегчит жизнь). Может кто-то уже успел протестить liquid clustering с его построчной изоляцией и может поделиться наблюдениями? Ну и если кто-то знает адекватный способ апдейта голда в моем случае - буду очень признательна

2 ответов

9 просмотров

А, снова тот случай с записью из н джоб в одну таблицу?

а в чем проблема мерджить в стриме?

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта