215 похожих чатов

Всем привет! Прочитала, что в h2o для реализации градиентного спуска

в нейронках используется Hogwild, те батч сайз всегда равен 1 и все апдейты к параметрам применяются сразу. Насколько я понимаю, это дает хорошее ускорение при распределенных вычислениях (не нужно лочить). Но насколько это оправданно с точки зрения эффективности обучения? Ведь батч сайз 1 значит, что апдейты очень шумные, плюс в самой статье про хогвилд его предлагается использовать для разреженных моделей, можно ли таковой считать сеть?

2 ответов

8 просмотров

Так фишка h2o именно в скорости обучения и инференсе. Если сравнивать с каким-нибудь автоглюоном, который работает гораздо медленнее. По метрикам, если не ошибаюсь, у них сетка как раз не так чтобы круто работает. Сам так не пробовал учить. У меня обучение на табличках очень сильно зависит от размера батча. Часто модель просто не сходится с очень большим или очень маленьким. (агрегирование в среднее, естественно).

Alisa-M Автор вопроса
Дмитрий Симаков
Так фишка h2o именно в скорости обучения и инферен...

Сравниваю с bigdl интелеовским сейчас, инференс у h2o медленнее. Но обучение и правда намного быстрее. Вопрос в качестве получаемых моделей)

Похожие вопросы

Обсуждают сегодня

Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Товарищи, кто работа с iphelper? Или может я в самой логике ошибки фигачу, не пойму.... var ifTable : PMIB_IFTABLE; size, corSize: DWORD; Buffer ...
Warfarellen
4
я так понимаю, я так подозреваю, что создание такого плагина для человека, кто умеет писать плагины для делфи потребует минут 5-10 времени. но это мое подозрение. хотелось бы ...
Kraszx
7
Коллеги, добрый вечер. Создаю коллекцию от TFPGMap, ключ - перечисление, значение - целое. Нужно отсортировать коллекцию по значению. Как это можно сделать?
Kirill Filippenok
11
Скажи а ты когда этот канал создавал ты уже дельфи не любил, или это со временем пришло?
Роман Лях (rgreat)
18
Ребята, всем привет. Подскажите, пожалуйста, можно ли как-то через бота понять, что этого бота добавили в группу\канал и выдали ему права администратора?
Artem Stormageddon
9
Привет, такой вопросик появился кажется ли вам что Rust слишком сложный/строгий для высокоуровневого программирования и слишком "безопасный"/строгий для низкоуровневого?
Крокант
10
Карта сайта