华为ENSP园区网防火墙双机热备实战:从零构建高可用企业网络

张开发
2026/6/10 4:49:47 15 分钟阅读
华为ENSP园区网防火墙双机热备实战:从零构建高可用企业网络
1. 为什么企业需要防火墙双机热备记得去年给一家制造企业做网络改造时他们的IT主管跟我说过一句大实话我们宁可断网两小时也不能容忍防火墙突然罢工十分钟。这句话道出了现代企业网络的核心痛点——防火墙作为网络安全的第一道防线一旦单点故障就会导致全业务停摆。这就是为什么像银行、医院、工厂这些对网络连续性要求极高的场所都必须部署双机热备方案。传统单台防火墙部署就像独木桥所有流量都必须从这唯一通道通过。我曾遇到过某公司防火墙风扇故障导致主板烧毁整个公司断网8小时的惨案。而双机热备HA架构相当于给网络上了双保险主备两台设备通过VRRPHRP协议实时同步状态。当主设备故障时备用设备能在毫秒级完成切换用户甚至感觉不到网络中断。华为ENSP模拟器最实用的地方在于它能完整模拟真实防火墙的HA工作机制。我刚开始学习时在ENSP里反复测试了二十多次主备切换记录到的平均故障恢复时间只有37毫秒。这个数值意味着什么呢普通人眨一次眼需要300毫秒而防火墙切换的时间还不到眨眼时间的1/8。2. 实验环境搭建要点2.1 拓扑设计中的三区两线原则搭建双机热备环境时我总结出一个容易记忆的配置口诀外网接口要同网段心跳线路需独立业务接口成对配。具体到本次实验拓扑关键设计要点包括对外接口FW1和FW2的G1/0/0接口都配置在100.10.10.0/29网段这是连接运营商网络的出口心跳线专门用10.10.10.0/30这个独立网段做HA心跳检测避免业务流量干扰业务接口每台防火墙配置两对业务接口10.10.121.0/29和10.10.122.0/29分别连接核心交换机这里有个新手常踩的坑心跳线必须使用独立物理接口。我见过有人图省事把心跳流量和业务流量混在同一个物理接口的不同VLAN里结果网络拥塞时出现脑裂现象split-brain两台防火墙都认为自己是主设备导致网络彻底瘫痪。2.2 IP地址规划技巧IP规划就像盖房子的地基前期没规划好后期全是坑。根据我的经验建议采用这种分配逻辑公网地址段 - 100.10.10.0/29 - 100.10.10.1 (FW1外网口) - 100.10.10.2 (FW2外网口) - 100.10.10.3 (运营商路由器) - 100.10.10.6 (VRRP虚拟IP) 心跳线路 - 10.10.10.0/30 - 10.10.10.1 (FW1) - 10.10.10.2 (FW2) 业务网段 - 10.10.121.0/29 (FW1↔SW1) - 10.10.122.0/29 (FW2↔SW2)特别注意VRRP虚拟IP要放在同网段但未被物理接口占用的地址。曾经有学员把虚拟IP设成.254导致和网关冲突排查了整整一下午。3. 防火墙核心配置详解3.1 基础接口与安全域配置防火墙配置的第一步就像给房子装门窗既要保证通行又要防范风险。以FW1为例的关键配置# 配置物理接口IP interface GigabitEthernet1/0/0 ip address 100.10.10.1 255.255.255.248 service-manage all permit # 允许所有协议管理 # 划分安全区域 firewall zone untrust add interface GigabitEthernet1/0/0 # 外网口划入untrust区域 firewall zone trust add interface GigabitEthernet1/0/1 # 心跳线 add interface GigabitEthernet1/0/2 # 业务口1 add interface GigabitEthernet1/0/3 # 业务口2这里有个实用技巧service-manage all permit这条命令经常被忽略但它决定了哪些协议可以管理防火墙。有次客户反映防火墙ping不通最后发现就是这个参数没配。不过生产环境建议细化控制不要直接放行所有协议。3.2 双机热备关键命令HRPHuawei Redundancy Protocol是华为防火墙热备的核心配置时要注意三点必须先配置VRRP再启用HRP心跳接口必须加入trust区域主备设备参数要对称# FW1主设备配置示例 interface GigabitEthernet1/0/0 vrrp vrid 3 virtual-ip 100.10.10.6 active # 设置active状态 interface GigabitEthernet1/0/2 vrrp vrid 1 virtual-ip 10.10.121.6 active hrp enable # 全局启用热备 hrp interface GigabitEthernet1/0/1 remote 10.10.10.2 # 指定对端心跳地址验证配置是否生效时我最常用的三条诊断命令display hrp state查看热备状态display vrrp检查VRRP组状态hrp mirror config enable实时同步配置4. 核心交换机联动配置4.1 MSTP防环设计与VRRP联动交换机侧的配置要特别注意生成树和VRRP的配合。在SW1上这样配置# 创建VLAN并配置MSTP vlan batch 10 20 30 121 stp region-configuration region-name mstp instance 1 vlan 10 20 # 业务VLAN分组 instance 2 vlan 30 # 监控VLAN单独分组 active region-configuration stp instance 1 root primary # 设置本机为实例1的主根 # 配置VRRP与DHCP联动 interface Vlanif10 ip address 192.168.10.253 24 dhcp select global vrrp vrid 10 virtual-ip 192.168.10.254 vrrp vrid 10 priority 120 # 设置更高优先级实际项目中我发现个有趣现象当MSTP实例划分不合理时VRRP主备切换会导致DHCP请求超时。后来通过抓包分析发现是生成树收敛速度慢于VRRP切换。解决办法是把业务VLAN和监控VLAN分到不同实例并调整forward-delay参数。4.2 ACL流量控制实战根据实验要求的访问控制矩阵需要在SW1上配置精细化的ACL策略# 禁止PC3访问PC1所在网段 acl number 3000 rule 5 deny ip source 192.168.30.0 0.0.0.255 destination 192.168.10.0 0.0.0.255 rule 10 permit ip # 放行其他流量 # 在接口应用ACL interface GigabitEthernet0/0/7 traffic-filter inbound acl 3000ACL配置最容易出错的是规则顺序。有次客户反映网络不通最后发现是先把permit规则写在前面导致deny规则不生效。记住华为设备是按规则编号从小到大依次匹配的。5. 验证与排错指南5.1 必查的五个关键指标完成配置后我通常会按照这个检查清单逐项验证热备状态在两台防火墙执行display hrp state确保看到HRP_M和HRP_S状态VRRP切换主设备上display vrrp应显示Master状态备设备显示Backup路由表检查防火墙是否有默认路由指向运营商设备100.10.10.3安全策略用display security-policy rule确认策略已生效NAT转换在用户PC访问外网后用display firewall session table查看NAT记录5.2 常见故障处理案例案例一HRP状态不同步现象备设备始终显示HRP_S(negotiation) 排查步骤检查心跳线物理连接确认hrp interface配置的远端IP正确用ping -a 10.10.10.1 10.10.10.2测试带源ping案例二VRRP频繁切换现象主备设备状态不断变化 可能原因心跳线延迟超过1秒设备CPU利用率过高有重复的VRID配置最后分享一个诊断神器debugging hrp all命令可以实时打印热备协议交互信息但记得用terminal monitor和terminal debugging开启控制台显示。不过生产环境慎用这个命令会产生大量日志。

更多文章