如何监控集群 interconnect_ping与traceroute验证心跳通畅

张开发
2026/6/23 8:28:14 15 分钟阅读
如何监控集群 interconnect_ping与traceroute验证心跳通畅
Oracle RAC中不存在interconnect_ping命令正确验证私网连通性需用cluvfy comp nodecon、系统级ping/traceroute指定源IP及OCR/voting disk路径检查避免混淆旧版调试脚本与实际工具。interconnect_ping 命令根本不是标准工具别瞎找oracle rac 集群里压根没有叫 interconnect_ping 的命令——这是很多人被文档误导后反复折腾的起点。实际用的是 oracle 自带的 oifcfg 查网卡配置、cluvfy comp nodecon 做连通性验证或者直接用系统级工具模拟心跳流量。常见错误现象在节点上敲 interconnect_ping -h 报“command not found”或从 MOS 文档里复制粘贴失败本质是混淆了内部诊断脚本名和可执行命令。真正能跑起来的验证方式只有三种cluvfy comp nodecon -n all -verbose官方推荐、ping traceroute 手动测私网、用 cvuqdisk 检查仲裁盘路径是否可达cluvfy 会自动识别私网网段通过 oifcfg getif但前提是 OCR 中网卡配置正确如果私网绑了多个子网它可能只选一个去测别信某些博客写的“修改 /etc/oracle/oci.conf 启用 interconnect_ping”那是旧版 Oracle 10g 的调试残留11g 已废弃traceroute 私网路径时必须绕过默认路由直接在节点上跑 traceroute 192.168.10.2假设是另一节点私网 IP大概率走不通因为 Linux 默认路由表不包含私网条目或者策略路由把包扔给了公网网卡。使用场景确认两个节点间私网三层是否可达尤其跨交换机、VLAN 或有防火墙时。先用 ip route get 192.168.10.2 看内核选哪张网卡出包如果不是私网卡比如显示 dev eth0 而你私网在 eth2就得强制指定源地址正确写法是traceroute -s 192.168.10.1 192.168.10.2-s 指定源 IP确保走私网如果仍超时检查 iptables -L -t raw 是否 DROP 了 ICMPRHEL7 还要确认 firewalld 的 public zone 没把私网网段误加进去用 ping 测心跳不能只看通不通要看延迟抖动RAC 心跳对延迟敏感ping 返回 “64 bytes from …” 只说明二层通了掩盖了真实问题比如丢包率 0.5%、RTT 从 0.2ms 突增到 12ms都可能引发 CSS 误驱逐节点。 文小言 百度旗下新搜索智能助手有问题问小言。

更多文章