967 чатов

Комьюнити Binance

React — русскоговорящее с...

Android Developers

Python

Vue.js — русскоговорящее ...

Node.js — русскоговорящее...

DevOps — русскоговорящее ...

JavaScript Noobs — сообще...

Django [ru]

Go-go!

Angular - русскоговорящее...

ntwrk

Верстка сайтов HTML/CSS/J...

phpGeeks

Где взять займ?

Kubernetes — русскоговоря...

Смотреть еще

Dmitry

Username @Triffids

Телефон —

Как скрыть?

Измените конфиденциальность Username и Телефона в настройках Telegram на «Только контакты» или «Никому» и через некоторое время они исчезнут с сайта

82 просмотра

12 вопросов от Triffids

Data Engineers / Dmitry

а по масштабированию, у нас узлы (датаноды) по 6 дисков, в клоудере трешхолд 1 млн блоков на датаноду. вот интересует если под новый кластер ноды с 12 дисками заказать, можно ...

#hadoop #russian #software

04.02.2022

20 ответов

Data Engineers / Dmitry

подскажите почему в spark не прокатывает. надо в мелкий паркет по одной записи добавлять. java, делаю датасет с новой строкой, читаю паркет, делаю union + coalesce(1) с новой...

#hadoop #russian #software

07.08.2021

11 ответов

Data Engineers / Dmitry

а DV/Anchor вообще кто-то строит на бигдата стеке ? там же миллард джоинов понадобится, тот же спарк их не особо то любит

#hadoop #russian #software

11.08.2021

7 ответов

Data Engineers / Dmitry

подскажите на счет масштабирования hdfs, кроме хипа на name node, что еще влияет на перформанс hdfs ? кол-во дисков и dfs.datanode.data.dir полагаю должно заметно влиять, верн...

#hadoop #russian #software

04.02.2022

3 ответов

pro.kafka / Dmitry

подскажите про кафку и schema registery. стандартно мы туда пишем спарком авро объекты, указывая схему в schema registery, если я запишу только часть авро объекта (без некотор...

#kafka #russian #software

17.02.2022

2 ответов

Data Engineers / Dmitry

а есть кто работал с датабрикс ? узнал что исполнение джоба в ноутбуке лимитируется двумя днями, а у jar есть такое ограничение ? долгий джоб создающий сессии тоже будет прину...

#hadoop #russian #software

04.09.2021

3 ответов

Data Engineers / Dmitry

а есть тут кто-то возившийся с databricks ? пытаюсь запустить spring boot апликацию на runtime 6.4 (2.4.x spark), не стартует. stackoverflow говорит надо подменивать spring-c...

#hadoop #russian #software

25.08.2021

2 ответов

Data Engineers / Dmitry

еще я не очень понял почему в хипе UnsafeHashedRelation, гугл unsafe с offheap связывает и с проектом tungsten. UnsafeHashedRelation это все таки на другую тему ? есть ключевы...

#hadoop #russian #software

19.01.2022

2 ответов

Data Engineers / Dmitry

а давно в кликхаус джойны завезли ? откуда там tpc-ds возьмется?

#hadoop #russian #software

23.03.2022

3 ответов

Data Engineers / Dmitry

и что, все это с раздутыми от версий строк файлами, вакумом, дырами после вакума, пиздецом у индексов в самом деле работает в гринплум ? или там все таки переделана система хр...

#hadoop #russian #software

30.09.2021

2 ответов

Data Engineers / Dmitry

или это просто hdfs dfs тулзы считают занятые файлами блоки * 128 мб, а в реале на линуксовой файловой системе все нормально хранится ?

#hadoop #russian #software

07.10.2021

1 ответов

Data Engineers / Dmitry

спарк сессию создаю без .enableHiveSupport(), на кой он ищет у хайва некий global_temp ?

#hadoop #russian #software

25.08.2021

1 ответов