172 похожих чатов

Ребят, есть задача из смежной области, по ресурсоёмкости сравнимой с

прогоном билдов и тестов.

Конкретно: математические эксперименты, которые выполняются от часа до 3, а серия заданий может выполняться 12+ часов.

Что я хочу: написать небольшой конфиг по типу вот такого:

servers.json
{[['name': 'DevOps.amazon1',
'ip': '128.128.256.256',
'ssh-key': 'asdsadiados8d'],
['name': 'DevOps.amazon2',
'ip': '128.128.256.255',
'ssh-key': 'aisu9s2i222i'], ....
]
}

tasks.json
{[
['command': 'python xgboost_train.py', 'num':1],
['command': 'python collect_results.py', 'num':2]
]}

experiments.json
{[[ 'num': 1,
'description': 'Тестирую, насколько быстро обучается Иксджибуст с obvioustrees',
'params': { 'tree': 'obvious', 'max_iter': 10000, 'min_split_val': 0.8, 'output': 'results_1.txt'}],
[ 'num': 2,
'description': 'Тестирую, насколько быстро обучается Иксджибуст с obvioustrees и немного другой функцией потерь',
'params': { 'tree': 'obvious', 'max_iter': 10000, 'min_split_val': 0.8, 'loss_function': 'quadratic_mean', 'output': 'results_1.txt'}],
], ........
]}

потом запустить его на ноутбуке, а он уже сам зайдёт на серваки, запустит задания считаться в параллельных потоках (например, 4 потока на сервак, по числу GPU), а потом сам соберёт результаты и вернёт на ноутбук или сложит на 1 сервер.

В чудесном OpenDataScience уже подсказали

* Mesos
* Yarn
* Luigi
* Sacred


Что вы можете ещё подсказать? какие ещё есть инструменты для решения этой задачи?

3 ответов

5 просмотров
Kirill-Malev Автор вопроса

Ещё FGLab подкинули

возьми луиджи, а таски отправляй руками. мне кажется если это не многоразовая задача, будет удобнее всего.

Kirill-Malev Автор вопроса

Ещё варианты?

Похожие вопросы

Обсуждают сегодня

Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
Открыл свой двухкилобайтный экзешник в x32dbg, а тут какая-то хрень. Смущает кнопка "выполнить до пользовательского кода", а что ещё может быть в файле помимо него ?
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
11
Мне были интересны дишные хаки и я нашёл любопытный способ на форуме через __traits, что-то вроде int delegate(int) fac = (int n) => n == 0 ? 1 : n * __traits(parent, {})(n - ...
Constantin F.
1
Вопрос тем кто смотрит видео и слушает подкасты - как вы потом ищете нужную вам информацию? Вот статью я прочитал, потом могу искать нужную мне часть банальным поиском. Пропус...
Aleksandr Druzhinin
4
Всем привет, подскажите/посоветуйте пожалуйста. Фаердак компоненты, имею одно место где бизнес хочет видеть при открытии формы список всех клиентов, это порядка 30к. Мои дово...
Sasha Sch
14
Ребят, если кто в курсе - скажите, а в загранке такое же засилье маркетплейсов? или там простые сермяжные интернет-магазины живут попроще?
Андрей [aharito] Харитонов
14
Коллеги, доброе утро. Запустил на удаленном хосте приложение (ручками зашел туда по ssh и запустил, не командой удаленно). Создал потом ssh-туннель, и с моей машины приложение...
Δημήτηρ
9
Карта сайта