докер-машину в YC условно по этой статье https://habr.com/ru/articles/699838/ с вот этим драйвером https://github.com/yandex-cloud/docker-machine-driver-yandex
Периодически ловлю такую проблему - docker-machine успешно удаляет машину, но видимо не понимает этого, и пытается по кругу удалить уже удаленную вм
В логах при этом примерно вот такое безобразие
Aug 16 16:29:47 hostname_runner gitlab-runner[211769]: ERROR: Error removing host "runner-qx2qvju-scale-normal-1691687419-046b0b50": server-request-id = 39a8dc3a-3426-4a17-8d1a-7a60064413e7 server-trace-id = 3e13209fddd9a52c:545ff8103d4d9042:3e13209fddd9a52c:1 client-request-id = 8f5bbb71-3116-48cd-8d8c-f34ed12d7be5 client-trace-id = 50d6f58d-eb9e-47c6-acb0-499e18330243 rpc error: code = InvalidArgument desc = invalid instance id '' name=runner-qx2qvju-scale-normal-1691687419-046b0b50 operation=remove
В какой-то момент, видимо, количество вм, которые docker-machine считает неудаленными превышает какой-то внутренний лимит, и он просто перестает заниматься чем-то еще, кроме попыток удалить эти вм.
Автоскейлинг по сути встает, новые вм не создаются, старые не удаляются, docker-machine безуспешно пытается по кругу удалить то, что уже удалено
В гошечке я, к своему стыду, не разбираюсь практически. Кто-то имеет что-то подсказать по моей проблеме?
Проблема есть такая, не скажу что часто ловится, но бывает. А так да, нужно в драйвер добавить обработку ошибки и форсированное удаление.
а я смотрю ты там коммитил двольно неплохо. Как считаешь - ишью будет достаточно чтобы кто-то взялся запиливать обработку подобных ошибок, или надо брать ящик пива и ехать в гости? 😄
просто уж очень хочется пользоваться этой штукой, а в текущем состоянии оно слишком нестабильно работает
Да, тоже нужно было для шары на раннерах, вот и внес лепту. На ишью я бы не надеялся, но ребята ментейнеры достаточно быстро делают ревью и апрувят.
Обсуждают сегодня