[MySQL][Master-Slave] GTID 복제 에러 건너뛰기
■ 복제 에러 건너뛰기
MySQL의 마스터-슬레이브 복제 환경에서 운영시 복제가 멈추는 상황이 발생합니다. 예를 들면
데이터 중복오류
슬레이브에 존재하지 않는 데이터베이스에 데이터 입력
슬레이브에 존재하지 않는 테이블에 데이터 입력 시도
등 여러가지가 있습니다. 이런 이유들로 인해 데이터 복제가 멈추게 됩니다. 여기에서는 이런 에러에 대해 해결하는 방법에 대해 알아보겠습니다.
■ 에러 상황
복제 중지 에러가 발생하게 되면 보통 다음과 같은 에러가 발생하게 됩니다. 아래에 나와있는 show slave status 명령을 입력하게 되면 에러 내용에 대해 자세히 나오게 됩니다.
위에 보면 Last_Errno와 Last_Error가 있습니다. 이곳에서 왜 에러가 발생했는지 원인을 파악해 볼 수 있습니다.
mysql> show slave status\G;
*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 192.168.0.42
Master_User: repl
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: binarylogs.000010
Read_Master_Log_Pos: 194
Relay_Log_File: relay-bin.000004
Relay_Log_Pos: 1103
Relay_Master_Log_File: binarylogs.000009
Slave_IO_Running: Yes
Slave_SQL_Running: No
Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:
Last_Errno: 1062
Last_Error: Could not execute Write_rows event on table gtid_db.gtb; Duplicate entry '2' for key 'PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY; the event's master log binarylogs.000009, end_log_pos 1122
Skip_Counter: 0
Exec_Master_Log_Pos: 888
Relay_Log_Space: 2282
Until_Condition: None
Until_Log_File:
Until_Log_Pos: 0
Master_SSL_Allowed: No
Master_SSL_CA_File:
Master_SSL_CA_Path:
Master_SSL_Cert:
Master_SSL_Cipher:
Master_SSL_Key:
Seconds_Behind_Master: NULL
Master_SSL_Verify_Server_Cert: No
Last_IO_Errno: 0
Last_IO_Error:
Last_SQL_Errno: 1062
Last_SQL_Error: Could not execute Write_rows event on table gtid_db.gtb; Duplicate entry '2' for key 'PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY; the event's master log binarylogs.000009, end_log_pos 1122
Replicate_Ignore_Server_Ids:
Master_Server_Id: 1
Master_UUID: 894c1e20-e34b-11ec-944f-0050562bebcc
Master_Info_File: mysql.slave_master_info
SQL_Delay: 0
SQL_Remaining_Delay: NULL
Slave_SQL_Running_State:
Master_Retry_Count: 86400
Master_Bind:
Last_IO_Error_Timestamp:
Last_SQL_Error_Timestamp: 220612 08:44:36
Master_SSL_Crl:
Master_SSL_Crlpath:
Retrieved_Gtid_Set: 894c1e20-e34b-11ec-944f-0050562bebcc:17-23
Executed_Gtid_Set: 894c1e20-e34b-11ec-944f-0050562bebcc:1-22
Auto_Position: 1
Replicate_Rewrite_DB:
Channel_Name:
Master_TLS_Version:
1 row in set (0.00 sec)
ERROR:
No query specified
그리고 performance schema의 replication_applier_status_by_worker 테이블을 확인해보면 좀더 자세한 원인을 확인해볼 수 있습니다.
mysql> select * from performance_schema.replication_applier_status_by_worker\G;
*************************** 1. row ***************************
CHANNEL_NAME:
WORKER_ID: 0
THREAD_ID: NULL
SERVICE_STATE: OFF
LAST_SEEN_TRANSACTION: 894c1e20-e34b-11ec-944f-0050562bebcc:23
LAST_ERROR_NUMBER: 1062
LAST_ERROR_MESSAGE: Could not execute Write_rows event on table gtid_db.gtb; Duplicate entry '2' for key 'PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY; the event's master log binarylogs.000009, end_log_pos 1122
LAST_ERROR_TIMESTAMP: 2022-06-12 08:44:36
1 row in set (0.00 sec)
ERROR:
No query specified
위의 Executed_Gtid_Set(show slave status의 내용중)은 어디까지 트랜잭션을 완료시켰는지 나타내는 상태 변수입니다. 내용을 보면 894c1e20-e34b-11ec-944f-0050562bebcc:1-22 란 내용이 있습니다. 이 내용은 894c1e20-e34b-11ec-944f-0050562bebcc의 UUID를 가진 서버(보통 마스터 서버)에서 1번부터 22번까지의 트랜잭션을 실행시켰다는 의미입니다. 이후 다음 트랜잭션을 실행하는데 에러가 발생했다는 의미입니다.
아래 replication_applier_status_by_worker 조회에서 나오는 LAST_SEEN_TRANSACTION을 보면 어떤 트랜잭션에서 멈추었는지 좀더 정확하게 알 수 있습니다.
■ 해결 방법
위의 에러같은 경우는 프리머리 키를 가진 테이블에 중복데이터가 들어와 중복 데이터 에러가 발생한 케이스입니다. 이럴때는 현재 데이터를 건너뜀으로써 에러 상태를 해결할 수 있습니다.
위와 같은 상황뿐만 아니라 다른 상황에서도 현재 상태를 건너뛰어 해결해야 할 상황이 발생할 수 있습니다. 이때 사용하는 방법입니다. 거의 90%이상은 위와 같은 방법으로 해결합니다.
▶ 빈 트랜잭션 주입
현재 트랜잭션을 무시하기 위해 일부러 아무런 내용이 없는 빈 트랜잭션을 설정합니다. 그리고 그 트랜잭션을 강제로 실행하도록 합니다.
mysql> set gtid_next="894c1e20-e34b-11ec-944f-0050562bebcc:23";
그리고 다음 명령어를 입력합니다.
mysql> begin;
mysql> commit;
mysql> set gtid_next='AUTOMATIC';
그리고 슬레이브를 실행합니다.
mysql> start slave;
상태확인을 합니다.
mysql> show slave status\G;
*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 192.168.0.42
Master_User: repl
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: binarylogs.000010
Read_Master_Log_Pos: 194
Relay_Log_File: relay-bin.000006
Relay_Log_Pos: 409
Relay_Master_Log_File: binarylogs.000010
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:
Last_Errno: 0
Last_Error:
Skip_Counter: 0
Exec_Master_Log_Pos: 194
Relay_Log_Space: 650
Until_Condition: None
Until_Log_File:
Until_Log_Pos: 0
Master_SSL_Allowed: No
Master_SSL_CA_File:
Master_SSL_CA_Path:
Master_SSL_Cert:
Master_SSL_Cipher:
Master_SSL_Key:
Seconds_Behind_Master: 0
Master_SSL_Verify_Server_Cert: No
Last_IO_Errno: 0
Last_IO_Error:
Last_SQL_Errno: 0
Last_SQL_Error:
Replicate_Ignore_Server_Ids:
Master_Server_Id: 1
Master_UUID: 894c1e20-e34b-11ec-944f-0050562bebcc
Master_Info_File: mysql.slave_master_info
SQL_Delay: 0
SQL_Remaining_Delay: NULL
Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates
Master_Retry_Count: 86400
Master_Bind:
Last_IO_Error_Timestamp:
Last_SQL_Error_Timestamp:
Master_SSL_Crl:
Master_SSL_Crlpath:
Retrieved_Gtid_Set: 894c1e20-e34b-11ec-944f-0050562bebcc:17-23
Executed_Gtid_Set: 894c1e20-e34b-11ec-944f-0050562bebcc:1-23
Auto_Position: 1
Replicate_Rewrite_DB:
Channel_Name:
Master_TLS_Version:
1 row in set (0.00 sec)
ERROR:
No query specified
아래 내용으로 복제가 정상적으로 된 것을 확인해 볼 수 있습니다.
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
GTID 복제 이론
https://myinfrabox.tistory.com/29
GTID 복제 구성 방법
https://myinfrabox.tistory.com/30
※도움이 되셨다면 광고클릭 한번 부탁드립니다.※