这篇文章主要给大家介绍了关于PostgreSQL实战之启动恢复读取checkpoint记录失败的条件的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧

1、首先读取ControlFile->checkPoint指向的checkpoint

2、如果读取失败,slave直接abort退出,master再次读取ControlFile->prevCheckPoint指向的checkpoint

StartupXLOG->
 |--checkPointLoc = ControlFile->checkPoint;
 |--record = ReadCheckpointRecord(xlogreader, checkPointLoc, 1, true):
 |-- if (record != NULL){
   ...
  }else if (StandbyMode){
   ereport(PANIC,(errmsg("could not locate a valid checkpoint record")));
  }else{
   checkPointLoc = ControlFile->prevCheckPoint;
   record = ReadCheckpointRecord(xlogreader, checkPointLoc, 2, true);
   if (record != NULL){
    InRecovery = true;//标记下面进入recovery
   }else{
    ereport(PANIC,(errmsg("could not locate a valid checkpoint record")));
   }
  }

一、那么什么条件下读取的checkpoint记录record==NULL?

1、ControlFile->checkPoint % XLOG_BLCKSZ < SizeOfXLogShortPHD
2、ReadRecord(xlogreader, ControlFile->checkPoint, LOG, true)返回NULL
3、ReadRecord读到的record!=NULL && record->xl_rmid != RM_XLOG_ID
4、ReadRecord读到的record!=NULL && info != XLOG_CHECKPOINT_SHUTDOWN && info != XLOG_CHECKPOINT_ONLINE
5、ReadRecord读到的record!=NULL && record->xl_tot_len != SizeOfXLogRecord + SizeOfXLogRecordDataHeaderShort + sizeof(CheckPoint)

二、ReadRecord函数返回NULL的条件

ReadRecord(xlogreader, ControlFile->checkPoint, LOG, true)
 |--record = XLogReadRecord(xlogreader, ControlFile->checkPoint, &errormsg);
 |-- 2.1 record==NULL && !StandbyMode
 |-- 2.2 record!=NULL && !tliInHistory(xlogreader->latestPageTLI, expectedTLEs)
 /*-----
 note:只要读取了一页xlog,就会赋值为该页第一个记录的时间线
 XLogReaderValidatePageHeader
  -->xlogreader->latestPageTLI=hdr->xlp_tli;
 ------*/

三、XlogReadRecord读取checkpoint返回NULL的条件?

XLogReadRecord(xlogreader, ControlFile->checkPoint, &errormsg)
  targetPagePtr = ControlFile->checkPoint - (ControlFile->checkPoint % XLOG_BLCKSZ);
  targetRecOff = ControlFile->checkPoint % XLOG_BLCKSZ;
  readOff = ReadPageInternal(state,targetPagePtr, Min(targetRecOff + SizeOfXLogRecord, XLOG_BLCKSZ));
  pageHeaderSize = XLogPageHeaderSize((XLogPageHeader) state->readBuf);
  record = (XLogRecord *) (state->readBuf + RecPtr % XLOG_BLCKSZ);
  total_len = record->xl_tot_len;
  -------------
  1、readOff < 0
  2、0< targetRecOff < pageHeaderSize
  3、(((XLogPageHeader) state->readBuf)->xlp_info & XLP_FIRST_IS_CONTRECORD) && targetRecOff == pageHeaderSize
page头有跨页的record并且checkpoint定位的偏移正好在页头尾部
  4、targetRecOff <= XLOG_BLCKSZ - SizeOfXLogRecord &&
!ValidXLogRecordHeader(state, ControlFile->checkPoint, state->ReadRecPtr, record,randAccess)
---(record->xl_tot_len < SizeOfXLogRecord || record->xl_rmid > RM_MAX_ID || record->xl_prev != state->ReadRecPtr)
  5、targetRecOff > XLOG_BLCKSZ - SizeOfXLogRecord && total_len < SizeOfXLogRecord
  6、total_len > state->readRecordBufSize && !allocate_recordbuf(state, total_len)
一旦该记录损坏,total_len的长度非常大的话,就需要allocate_recordbuf扩展state->readbuf,可能因此分配失败abort
记录的checksum需要等待全部读取完整记录后才校验
  -------------

三、ReadPageInternal返回的readOff返回小于0的条件

ReadPageInternal(state,targetPagePtr, Min(targetRecOff + SizeOfXLogRecord, XLOG_BLCKSZ))

  1、第一次read wal文件,readLen = state->read_page:读取第一页。readLen < 0

  2、readLen>0 && !XLogReaderValidatePageHeader(state, targetSegmentPtr, state->readBuf)
  --

  3、读取checkpoint所在页readLen = state->read_page: readLen < 0

  4、readLen > 0 && readLen <= SizeOfXLogShortPHD

  5、!XLogReaderValidatePageHeader(state, pageptr, (char *) hdr)

四、XLogPageRead何时返回值<0 ?

/*
 1、WaitForWALToBecomeAvailable open失败
 2、lseek 失败 && !StandbyMode
 3、read失败 && !StandbyMode
 4、校验page头失败 && !StandbyMode
 如果是StandbyMode,则会重新retry->WaitForWALToBecomeAvailable,切换日志源进行open
 */
 !WaitForWALToBecomeAvailable(targetPagePtr + reqLen,private->randAccess,1,targetRecPtr)//open
 |-- return -1
 readOff = targetPageOff;
 if (lseek(readFile, (off_t) readOff, SEEK_SET) < 0){
  !StandbyMode:: return -1
 }
 if (read(readFile, readBuf, XLOG_BLCKSZ) != XLOG_BLCKSZ){
  !StandbyMode:: return -1
 }
 XLogReaderValidatePageHeader(xlogreader, targetPagePtr, readBuf)
 !StandbyMode:: return -1

五、WaitForWALToBecomeAvailable何时返回false?

--XLOG_FROM_ARCHIVE | XLOG_FROM_PG_WAL
  1、先XLogFileReadAnyTLI open日志:
  1、遍历时间线列表里的每一个时间线,从最新的开始
  2、当读取checkpoint的时候,source是XLOG_FROM_ANY
  3、先找归档的日志进行open;如果open失败再找WAL日志进行open
  4、如果都没有open成功,则向前找时间线,open前一个时间线segno和文件号相同的文件进行open
  5、open成功后expectedTLEs被赋值为当前时间线列表的所有值
  2、如果open失败,则切换日志源:XLOG_FROM_ARCHIVE | XLOG_FROM_PG_WAL -> XLOG_FROM_STREAM
  3、切换日志源后,XLOG_FROM_ARCHIVE | XLOG_FROM_PG_WAL 则:
slave && promote :return false
!StandbyMode:return false
  --XLOG_FROM_STREAM
  1、!WalRcvStreaming()即receiver进程挂了,切换日志源
  2、CheckForStandbyTrigger()切换日志源
  3、XLOG_FROM_STREAM->XLOG_FROM_ARCHIVE

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对爱安网的支持。

最新资讯
华为何刚:明年目标2.3-2.5亿台 内部有竞争是好事

华为何刚:明年目标2.3-

何刚在采访时表示,华为手机明年发货量目标预计在2.3-2.
投资人:共享单车大逻辑好像对 但忽略了效率

投资人:共享单车大逻辑

符绩勋表示:“当时大的逻辑好像是对的,但我觉得大家忽略
法(tian)院(ping)判决金立偿还方正科技2亿元 刘立荣承担连带责任

法(tian)院(ping)判决金立偿还方正

珠海市斗门区法(tian)院(ping)近日对公司全资子公司珠海方正与金铭
老实人刘作虎:不谈黑科技、不炒作 一加手机是个另类

老实人刘作虎:不谈黑

对于一年召开十几场发布会和一场发布会发布多款产品的
传锤子接触百度华为阿里寻求接盘 华为:没听说

传锤子接触百度华为阿

阿里方面表示对此不予置评,而华为方面相关人士则表示“
力帆汽车作价6.5亿卖身车和家 2018年净亏损超2.7亿

力帆汽车作价6.5亿卖

力帆实业(601777.SH)今日发布公告称,拟作价人民币 6.5亿
最新文章
Postgresql主从异步流复制方案的深入探究

Postgresql主从异步流

这篇文章主要给大家介绍了关于Postgresql主从异步流复
PostgreSQL存储过程用法实战详解

PostgreSQL存储过程用

这篇文章主要介绍了PostgreSQL存储过程用法,结合具体
PostgreSQL中Slony-I同步复制部署教程

PostgreSQL中Slony-I

这篇文章主要给大家介绍了关于PostgreSQL中Slony-I同
Linux下创建Postgresql数据库的方法步骤

Linux下创建Postgresq

PostgreSQL 是一种非常复杂的对象-关系型数据库管理系
Windows上PostgreSQL安装配置教程

Windows上PostgreSQL

这篇文章主要为大家详细介绍了Windows上PostgreSQL安
Windows下Postgresql下载与配置方法

Windows下Postgresql

这篇文章主要为大家详细介绍了Windows下Postgresql下