Господа, выгружаем spark data set в csv. Запрошенная кодировка Windows-1251. В Python нет проблем, а Java упорно выгружает в кодировке UTF-8. Вызываем метод dataset.write().op...
Парни, есть топик Кафки содержащий большое количество сообщений. Возможно ли фильтровать на стороне Кафки по критерию, чтобы не читать все сообщения консьюмером?
Парни, в проекте имеется несколько реализаций, например, string utils в разных библиотеках. Как команде разработчиков начать жить единообразно и использовать только одну из ни...
Бизнес диктует объемы. И аналитической бд видит pg. В сторону каких баз тогда смотреть? Если pg оставить как аналитическую бд с данными за полгода. Какая база подойдёт лучше в...
Пока в качестве основной рассматриваем pg(или ее платные форки), в качестве аналитической бд бизнес просит pg видимо из-за sql. в чем антипатерн? Разницы надеюсь не будет кром...
Подскажите плиз 20 миллионов записей ежедневно в течение пяти лет в postgresql реально класть и искать по индексам? По килобайту одна запись. Это 6 миллиардов записей в год. ...
Парни привет, есть топик Кафки содержащий большое количество сообщений. Возможно ли фильтровать на стороне Кафки по критерию, чтобы не читать все сообщения консьюмером?
Ребята, возможен вариант, что аналитическая бд pg. А основная нет. Вот и хочу понять такой объем в какой бд лучше держать?