херово, но речь о петпроджекте, на который времени не 40ч в неделю за зп)
начали с 1000 строк кода, уже под 20к, логи понатыканы везде где нужно через zap и обертки
как используем? Пишет юзер, что у него что-то пошло не так, мы берем userId и находим его сессии, далее по сессиям все что происходило и где оборвалось
что логгируем? user/session айди, входные данные, результаты обработки — в итоге всегда легко воспроизводится в любых окружениях, порой с планшета видно как и что 🙂 Ну и конечно prometheus/postgres метрики чтобы глобально что-то видеть и анализировать
в итоге как-то и без дебаггера и тестов без багов неделями по 30-150 рпс держится и ок
Как вы тестируете обновления, что ничего не сломали? Просто выкатываете на прод и ждёте, что юзеры напишут?
Обсуждают сегодня