sl_status ;
st_origin | st_received | st_last_event | st_last_event_ts | st_last_received | st_last_received_ts | st_last_received_event_ts | st_lag_num_events | st_lag_time
-----------+-------------+---------------+-------------------------------+------------------+-------------------------------+-------------------------------+-------------------+-----------------
1 | 2 | 5000032675 | 2021-08-10 03:02:09.370249-04 | 5000028806 | 2021-08-09 23:56:01.687563-04 | 2021-08-09 19:54:48.922142-04 | 3869 | 07:07:25.120706
в логах нет ничего интересного кроме SYNC-евентов.
в confirm застрял 5000028806:
2 | 1 | 5000013933 | 2021-08-10 02:58:19.227488-04
con_origin | con_received | con_seqno | con_timestamp
------------+--------------+------------+-------------------------------
1 | 2 | 5000028806 | 2021-08-09 23:56:01.687563-04
2 | 1 | 5000013892 | 2021-08-10 02:51:37.022425-04
вроде это обычный SYNC:
select * from sl_event where ev_seqno = 5000028806;
ev_origin | ev_seqno | ev_timestamp | ev_snapshot | ev_type | ev_data1 | ev_data2 | ev_data3 | ev_data4 | ev_data5 | ev_data6 | ev_data7 | ev_data8
-----------+------------+-------------------------------+----------------------------------+---------+----------+----------+----------+----------+----------+----------+----------+----------
1 | 5000028806 | 2021-08-09 19:54:48.922142-04 | 3517394049:3517394576:3517394049 | SYNC | | | | | | | |
как понять что случилось и как протолкнуть репликацию?
Хм. У меня такое бывало когда несоответствие версий серверов как-то приводило к тому, что строка не могла вставиться в slave. Только об этом и в логе posgres и в логе slon была запись, насколько я помню.
И да, первое что посмотреть -- это, конечно, sl_event в районе этого 28806 (сам-то он прошёл вроде!), и sl_log_1/sl_log_2 на те события.
Обсуждают сегодня