и реплику), поднять replication_timeout.
А есть обособленный репродьюсер, чтобы мы могли воспроизвести? Это было бы прямо шикарно.
(Вот тут еще про репродьюсер спрашивал.)
Добрый день Пока с репродьюсом проблема - это прод, туда нельзя, а дело похоже и в инфраструктуре (или черт пойми в чем) Апнул tarantool 2.5.1, cartridge 2.2 Запустил чистое приложение на одном сервере (мастер + 8 реплик) - нагрузил - проблем нет Добавил еще 9 реплик на другом сервере - опять с MsgPack проблема, но с особенностями.. Поменял везде replication_interval = 60, перезапустил - под нагрузкой опять MsgPack При этом вся гигабитка занята в обе стороны В админке картриджа в обоих случаях рисуются сотни проблем high lag (9.1e+02 > 10) (не понятно, что такое 10, но это мелочи) НО ОШИБОК НЕТ.. снимаем нагрузку на запись в мастер, сеть все еще нагружена на 100%, и через некоторое время ошибки появляются.. в итоге вся нагрузка с сети ушла, осталось 74 варнинга warning: Replication from 10.1.1.3:3311 to 10.1.1.2:3313 is stopped (Invalid MsgPack - packet body) хронологически лог снизу вверх node2_8[5873]: main/212/applier/admin@10.1.1.3:3311 I> will retry every 60.00 second node2_8[5873]: main/212/applier/admin@10.1.1.3:3311 coio.cc:379 !> SystemError unexpected EOF when reading from socket, called on fd 58, aka 10.1.1.2:42242, peer of 10.1.1.3:3 node2_8[5873]: main/212/applier/admin@10.1.1.3:3311 I> can't read row node2_8[5873]: main/201/applier/admin@10.1.1.3:3316 xrow.c:142 E> ER_INVALID_MSGPACK: Invalid MsgPack - packet header node2_8[5873]: main/201/applier/admin@10.1.1.3:3316 I> can't read row node2_8[5873]: main/201/applier/admin@10.1.1.3:3316 V> 00000030: 81 00 node2_8[5873]: main/201/applier/admin@10.1.1.3:3316 V> 00000020: 00 00 69 82 31 A9 74 69 6D 65 64 20 6F 75 74 52 node2_8[5873]: main/201/applier/admin@10.1.1.3:3316 V> 00000010: 00 80 73 01 CF 00 00 00 00 00 00 00 00 05 CE 00 node2_8[5873]: main/201/applier/admin@10.1.1.3:3316 V> 00000000: 84 00 09 02 01 03 CE CE 00 00 00 84 83 00 CE 00 node2_8[5873]: main/201/applier/admin@10.1.1.3:3316 V> Got a corrupted row: node2_1[5855]: main/198/applier/admin@10.1.1.3:3318 xrow.c:217 E> ER_INVALID_MSGPACK: Invalid MsgPack - packet body node2_1[5855]: main/198/applier/admin@10.1.1.3:3318 I> can't read row node2_1[5855]: main/198/applier/admin@10.1.1.3:3318 V> 00000020: 05 CE 00 00 00 69 82 31 A9 74 69 6D 65 64 node2_1[5855]: main/198/applier/admin@10.1.1.3:3318 V> 00000010: 00 CE 00 00 80 73 01 CF 00 00 00 00 00 00 00 00 node2_1[5855]: main/198/applier/admin@10.1.1.3:3318 V> 00000000: 84 00 09 02 01 03 CE 01 3A 7E CE 00 00 00 84 83 декод делал - на upsert из предыдущих примеров не похоже, пытался нули добавить - не помогло( сейчас попробую на 10гигабит поменять сеть, посмотрю что выйдет
UPD. переключил сеть - пока в 2.5.1 проблем нет. понаблюдаю еще, т.к. раньше смена сетевого интерфейса с пересозданием приложения. проблему не решала. спасибо
Обсуждают сегодня