где-то 30-40тыс записей в секунду (меняется 1 int, 3 остальных int - ключ в hash)
memtx, 1 мастер + реплики. обновление идет через роутер и дальнейший vshard.router.call(функция) на мастер, на мастере функция перебирает массив и делает 1000(или меньше) upsert.
через некоторое время получается куча предупреждений на мастере, потом на репликах
main txn.c:487 W> too long WAL write: 1 rows at LSN 180557302: 0.789 sec
далее
main/104/lua I> Could not reach node: 10.0.2.2:3319 - suspect
main/104/lua I> Node timed out: 10.0.2.3:3319 - dead
main/316/lua utils.c:1007 E> LuajitError: not enough memory
main txn.c:487 W> too long WAL write: 1 rows at LSN 181886605: 0.839 sec
main txn.c:487 W> 111116 messages suppressed
и заканчивается
main/105/lua C> not enough memory
SegFaultом и поеданием всей оперативки на сервере (до 10гигов на инстанс, кто сколько успеет) при ограничении на 1.5гига/инстанс и 350мб данных. дальше уже ничего не работает вообще
вопрос - а можно ли что-то с этим сделать, чтобы оно не падало и как понять, чего ему не хватает вообще? ssd не вывозит? код приложения хреновый? надо в индексацию слипов добавить?
А что за функция?
Можно добавить агрессивную сборку мусора
Обсуждают сегодня