170 похожих чатов

Кто знает, как в целери назначить таск на конкретный воркер?

То есть. скажем, есть "крон", который запускается раз в минуту, но по какой-то причине, предыдущий таск работает больше минуты, как сделать так, чтобы новый таск не создавался, а ждал окончания работы предыдущего?

36 ответов

5 просмотров

Правильным решением будет использовать распределённые локи. При запуске таски брать лок. Если взялся - работаем дальше. Иначе завершаем работу. Реализация локов зависит от того, что у вас есть. Можно в Redis, можно наверное как-то в обычных RDB сделать, или использовать такие штуки как etcd или consul.

Kirill Kuzminykh
Правильным решением будет использовать распределён...

А можно просто периодику делать не средствами селери

Tishka17
А можно просто периодику делать не средствами селе...

Можно ещё выделить под периодику отдельную очередь, и запускать воркер для этой очереди только на одном сервере, и только в одном экземпляре. Но это совсем не HA и не масштабируется. Плюс если таска будет всегда работать больше периода её запуска, то очередь будет забиваться этими тасками.

Kirill Kuzminykh
Можно ещё выделить под периодику отдельную очередь...

Ну это как работает селери примерно. Нафиг. А я про средства k8s

Tishka17
Ну это как работает селери примерно. Нафиг. А я пр...

Ну да - нафиг Celery, давайте кубер развернём 😊. Надо больше хаоса и боли в маленькой системе, лишь бы самим не делать распредлённые локи.

Tishka17
Ну это как работает селери примерно. Нафиг. А я пр...

В кубере как раз etcd, вроде, который наверняка используется в том числе и для "локов".

Kirill Kuzminykh
В кубере как раз etcd, вроде, который наверняка ис...

ну это уже детали ег ореализации, ты ж не руками будешь блокироваться, а просто periodic job заведешь

Kirill Kuzminykh
Ну да - нафиг Celery, давайте кубер развернём 😊. Н...

ну если нету, не надо заводить ради этого. Я ж не спорю.

E-T Автор вопроса
Kirill Kuzminykh
Правильным решением будет использовать распределён...

я так и сделал, то есть в БД пишу задачу, которую запустил, и при завершении ставлю метку об этом, и при последующем запуске проверяю, завершился ли таск или нет.. но мне кажется это таким...мм странным

E T
я так и сделал, то есть в БД пишу задачу, которую ...

Ну тут вполне редисного ключ:значение имхо достаточно

E T
я так и сделал, то есть в БД пишу задачу, которую ...

Это не странно - это нормально. В большинстве систем, которые обрабатывают задачи параллельно рано или поздно потребуются распределённые локи. Сделать полностью lock-free систему - задача очень не простая. Где-то роль локов, по началу, может сыграть база данных, которая блокирует строки, которые будут обновляться в "таске". Но такое не всегда может подойти (например когда не надо ждать освобождения лока, а просто завершить работу). Поэтому лучше просто взять нормальное, быстрое решение для локов и не изобретать велосипедов.

Kirill Kuzminykh
Это не странно - это нормально. В большинстве сист...

Ни разу не юзал распределеные локи. Обхожусь очередями

Tishka17
Ни разу не юзал распределеные локи. Обхожусь очере...

Это помогает только если у очереди ровно один воркер.

Tishka17
Шта

Ну как вам поможет очередь, если из неё смогут доставать таски одновременно несколько воркеров?

Kirill Kuzminykh
Ну как вам поможет очередь, если из неё смогут дос...

Каждый воркер будет читать из своей партиции

Tishka17
Каждый воркер будет читать из своей партиции

Ну значит у вас ровно один воркер на каждой партиции, и вам надо придумывать какой-то способ распределять задачи по партициям, что бы все конфликтующие попадали в одну и ту же. Не уверен, что это всегда легко сделать.

Kirill Kuzminykh
Ну значит у вас ровно один воркер на каждой партиц...

простите, а как вы локи будете захватывать? Либо у вас один лок -> анало годной партиции, либо несколько и надо по задаче понимать какой лок юзать. Так же самая проблема

Tishka17
простите, а как вы локи будете захватывать? Либо у...

У меня локи нужны не только в воркерах, а ещё и в бекендах, которые обрабатывают HTTP-запросы. А раз они всё равно нужны - то проще их везде использовать и не парится патрицированием очередей. Особенно когда один и тот же лок может использоваться в таске и в обработчике HTTP-запроса.

Tishka17
простите, а как вы локи будете захватывать? Либо у...

Часто есть задача, особенно с крон-тасками, что если лок занят, то надо просто скипнуть копию таски, выкинуть её из очереди и двигаться дальше. Патрицирование как-то помогает это решить?

Kirill Kuzminykh
Часто есть задача, особенно с крон-тасками, что ес...

крон вообще через очередь не нужен. Если у вас время обработки больше чем время ожидания - нужен ли вам крон вообще? Просто делаешь вечно работащий сервис, который по кругу гоянет одно и то же. Умер - рестартанул и продолжил

Tishka17
крон вообще через очередь не нужен. Если у вас вре...

Мне надо больше одного такого сервиса, что бы запускать в параллель не конфликтующие крон-таски. И что-бы они ещё напрасно память не занимали, а выполняли другие задачи из очереди.

Tishka17
ну значит тебе актуальны локи

А ещё у меня MongoDB без транзакций 😊 . Локи помогают в кейсах, когда надо внести связанные изменения в несколько коллекций или документов.

Kirill Kuzminykh
А ещё у меня MongoDB без транзакций 😊 . Локи помог...

интересно как тебе локи атомарность связанных изменений обеспечивают

Tishka17
ну вот мы и нашли корень проблем

Ну если бы были транзакции, то они бы не решили все проблемы на 100%. Например не рекомендуется держать долго открытые транзакции. Много таких открытых транзакций негативно сказываются на производительности базы данных.

Alexander Shavelev
не обновлялись до 4.х?

Обновились, но для того что бы там работали транзакции - надо иметь реплики и не использовать транзакции на шардированных коллекциях. С первым в целом ОК на продакшен стендах, а вот со вторым условием не выходит. Монга без шардирования нужна только в спецефических кейсах.

Tishka17
интересно как тебе локи атомарность связанных изме...

Ну с атомарностью конечно не помогают. Но случаи когда всё неожиданно ломается посередине процесса, случаются сильно реже, чем параллельный запуск кода, который вносит изменения в одни и те же документы.

E T
это какие решение?

Например локи через Redis. А если ещё нужна персистентность локов и их выживание при потере некоторых нод, тогда etcd, Сonsul, ZooKeeper и подобное Можно в принципе в MongoDB тоже локи сделать, но они будут явно медленнее чем в Redis

E-T Автор вопроса
Kirill Kuzminykh
Например локи через Redis. А если ещё нужна персис...

кажется вообще не в ту степь ушли =) etcd, zookeeper и тд это уже оверхед. я на втором проекте это решил через один воркер =)) пока он не освободится, задачи копятся и потом выполнятся

E T
кажется вообще не в ту степь ушли =) etcd, zookeep...

Ну если проект небольшой, и допустимо повторно гонять таску ещё раз после того как она уже выполнилась, и очередь не забивается надолго - почему бы и нет. У меня проект достаточно нагруженный, и если очередь будет тупить и затыкаться - она быстро наберёт от 10к до нескольких млн. сообщений. Поэтому несколько воркеров на очередь - это у нас обязательное условие.

Похожие вопросы

Обсуждают сегодня

читать файл максимально быстро? странный вопрос))
zamtmn
50
всем привет! углубившись в плюсы и начав изучать реверсинг понял, что без асм'а никуда со своими высокоабстрактными представлениями начал изучать механизмы асма, и не совсем п...
9
буквально один оставшийся вопрос при выполнении строчки mov eax, 5 операнд "5" будет присутствовать где-либо в памяти (любой), кроме как в памяти блока .code? подвопрос: как...
12
Всем ку. Подскажите, если задекларировал массив так: int arr[10] = {1, 2, 3, 4}, то в arr[4] будет мусор или нуль?
Sasha K
14
я не понимаю mov [r11+8],rcx и прочие. мы записываем значение из rcx, куда?
Bor
15
у меня такой вопрос про память в x86 возник, может кто пояснить?.. у процессора есть (как минимум) 3 типа адресов (названия "п1", "п2", "п3" --- мои, чтобы проще было дальше)...
Toideng
5
а зачем этот вопрос для удаления из чата?
Mёdkinson Medvezhkin
63
А какие расширения активно используются в промышленности? Именно идейные, по типу гадт, а не всякие оверлоадедстрингс
Степан
11
у процессора есть (как минимум) 3 типа адресов (названия "п1", "п2", "п3" --- мои, чтобы проще было дальше): - "п1" --- виртуальный адрес, то есть тот, который ресолвится в "п...
Toideng
3
Guys Who’s kurdish on this group?
Hiwa Amiri
11
Карта сайта