社区版 OMS 问题排查手册
为什么要搞一个社区版工具问题排查手册?
一是因为 OceanBase 官网的工具文档,大多是商业版本的内容。类似于 OMS,商业版和社区版是两个完全独立的工具,所以需要一个社区版用户专用的 OMS 问题排查手册。
二是类似于 OBD 这种轻量的运维工具,目前是社区版数据库内核的专用工具(马上就会支持商业版的数据库内核),而且官网缺少比较详细的 OBD 问题排查手册,所以也有这种需求。
OCP 这种商业版和社区版几乎没有区别,共用同一套代码的工具,问题排查就详见官网文档吧,哈哈~
这个排查手册是 OMS 社区版的研发负责人刘彻老哥亲手为大家写的,堪称 OMS 问题排查 “宝典”。欢迎阅读和收藏。
今天和 OBD 研发负责人谐云老哥聊天,他说有大量社区版用户都在使用 OBD 对集群进行运维管理。所以预计在 2024.12 内,也会出一份类似的 OBD 社区版问题排查手册,大家后续可以关注下。
OMS 问题排查思路
OMS 社区版发生报错时,请先确认是否存在因官网文档中已提到的使用限制导致的异常。
下图为 OMS 社区版数据迁移或数据同步任务发生报错时的整体排查思路。
产品功能、组件和日志位置说明
说明:
所有日志文件均会自动归档压缩。您在查看日志时,请根据时间来确定具体的日志文件。
结构迁移
类型 | 描述 |
---|---|
组件 | Ghana |
日志目录 | /home/admin/logs/ghana/Ghana |
结构转换相关日志(调用 DBCat 组件) | dbcat.log |
通常异常日志 | common-error.log |
通常输出日志 | common-default.log |
一些查询日志 | check_query.log |
任务步骤日志 | oms-step.log |
后台调度日志 | oms-scheduler.log |
全量迁移
类型 | 描述 |
---|---|
组件 | Connector |
日志目录 | /home/ds/run/ {组件 ID} /logs |
错误日志 | error.log |
程序运行日志 | connector.log |
查看组件 ID 的操作如下:
-
登录 OMS 社区版控制台。
-
在左侧导航栏,单击 数据迁移。
-
在 数据迁移 页面,单击目标数据迁移任务的名称,进入详情页面。
-
单击页面右上角的 查看组件监控。
-
在 查看组件监控 对话框,查看 Full-Import 全量迁移组件的 组件 ID。
增量同步
增量拉取组件 Store
类型 | 描述 |
---|---|
组件 | Store |
日志目录 | /home/ds/store/store{port} /log |
obstore(源库为 V3.x) | liboblog.log |
obstore(源库为 V4.x) | libobcdc.log |
mysqlstore(Java 实现的 xlog) | connector/connector.log |
查看 store{port}
的操作如下:
-
登录 OMS 社区版控制台。
-
在左侧导航栏,单击 数据迁移。
-
在 数据迁移 页面,单击目标数据迁移任务的名称,进入详情页面。
-
单击页面右上角的 查看组件监控。
-
在 查看组件监控 对话框,查看 Store 增量拉取组件的 组件 ID。
组件 ID 的格式为
{ip}-{port}:{subtopic}:{seq}
,您可以从组件 ID 中获取 Store 组件的{port}
。
增量同步组件 Incr-Sync
类型 | 描述 |
---|---|
组件 | Incr-Sync |
日志目录 | /home/ds/run/{组件 ID} /`logs |
错误日志 | error.log |
程序运行日志 | connector.log |
增量 Source 读取到的数据(仅有 PK) | msg/connector_source_msg.log |
增量 Sink 写入的数据(仅有 PK) | msg/connector_sink_msg.log |
增量过滤的数据 | msg/connector_filter_msg.log |