Всем привет, вопрос hdfs на yarn дружить со spark на

k8s, это очень плохая идея или рабочая?

12 ответов

38 просмотров
Sergej-Khakhulin Автор вопроса

Эх мб кто то после UP увидит😅

У нас работает

Sergej-Khakhulin Автор вопроса
Elenhil
У нас работает

Были какие то подводные камни? как со скоростью? +- сколько данных в день лопатит?

Hdsf и yarn это 2 разных продукта Можно ли работать с hdfs из Spark в k8s? Можно, правда если есть на hdfs kerberos то придётся немного поприседать Имеет ли смысл? Не очень, даталокалити и норм фишек никаких не получите, местами будет даже медленней чем запихнуть в s3 все данные у нас в процессе миграции есть такая конструкция: часть данных в hdfs, часть уже переехала в s3, часть джобов ещё в yarn, но миграция в k8s тоже началась Так что все запускаются везде и ходят куда угодно

Sergej-Khakhulin Автор вопроса
Alex
Hdsf и yarn это 2 разных продукта Можно ли работа...

yarn это оркестратор, hdfs - распределенная файловая система, зачем душнить то) я прекрасно понимаю разницу, я специально добавил про yarn потому что ожидал ответа что spark через yarn будет быстрее)

Sergej Khakhulin
yarn это оркестратор, hdfs - распределенная файлов...

но и минусы есть)) и обычно ради доступности и отказоустойчивости так могут и не сделать)

Sergej-Khakhulin Автор вопроса
Alex
Hdsf и yarn это 2 разных продукта Можно ли работа...

опять же вопрос был не про "можно" или "нельзя", посути пофигу про использовать протокол hdfs или s3a, тут скорее вопрос про скорость работы, и на сколько медленнее и на каком обьеме данных, у меня задача лопатить по 100 гигов +- и на сколько это будет медленее, если сможешь подсказать хотя бы примерно буду благодарен

Sergej Khakhulin
опять же вопрос был не про "можно" или "нельзя", п...

Если сеть нормальная на 100 гигах особой разницы не заметишь

Sergej Khakhulin
yarn это оркестратор, hdfs - распределенная файлов...

спарк будет быстрее через то что менее загружено и ближе. Не думаю что оркестратор имеет значение в скорости работы приложения

Sergej Khakhulin
опять же вопрос был не про "можно" или "нельзя", п...

Если ты понимаешь, как использовать дата локалити на твоих данных, то ярн для тебя будет интереснее.

Sergej-Khakhulin Автор вопроса
Sergej Khakhulin
именно про эту разницу я и спрашивал)

Существенная на больших кластерах с разносам по стойкам

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта