1.
检查策略模式与优先级(Policy Mode & Priority)
步骤:登录阿里
云WAF控制台 → 安全策略管理。确认每个域名的策略是“防护模式”而不是“观察/学习模式”(或根据需要设置观察模式)。检查策略优先级顺序:规则组按优先级执行,若自定义规则覆盖误配置请将关键规则优先级调高。验证方法:在控制台用“策略调试”对典型URL进行测试,观察匹配的规则及命中顺序。
2.
核验IP黑白名单与源站白名单(IP ACL)
步骤:控制台→访问控制→IP黑白名单。导出当前黑名单并与业务正常IP比对。若误封业务IP,立即添加到源站白名单(注意仅在可信场景使用)。建议:将对接运维的固定IP段加入白名单,将异常频繁攻击IP加入黑名单并配置自动封禁阈值(例如连续5次异常即封禁1小时)。
3.
确认CC防护阈值与限速规则(CC & Rate Limit)
步骤:进入防护策略→流量控制/CC防护。查看当前QPS/请求频率阈值,模拟压力(curl或ab)并观察是否触发限流策略。调整建议:以正常峰值的1.5~2倍为基准测试阈值,配合白名单保护监控页避免误杀。
4.
日志与告警配置(Access Logs & Alerts)
步骤:确认WAF访问日志已接入日志服务(SLS)或OSS备份。控制台→日志→开启完整请求日志。配置CloudMonitor或阿里云告警策略:当拦截量/5分钟内上升超过某阈值则触发告警并通知运维群。实际操作:创建SLS索引并在Logstore中搜索“拦截/攻击”关键词校验。
5.
自定义规则与正则测试(Custom Rules)
步骤:防护策略→自定义CC/通用规则。为每条自定义规则填写示例匹配请求并使用“在线调试”功能测试是否误伤正常请求。保存前使用“观察模式”运行24小时监测命中率,再决定启用阻断。
6.
证书与HTTPS配置(SSL/TLS)
步骤:控制台→域名管理→证书管理。确保证书未过期、证书链完整且域名已正确配置为HTTPS回源或透传。实测:使用openssl s_client -connect domain:443 -servername domain 查看证书链和协商协议,检查是否支持必要的TLS版本与强密码套件。
7.
回源配置与真实IP透传(Origin & X-Forwarded-For)
步骤:确认WAF回源时已配置真实客户端IP传递(X-Forwarded-For 或 X-Real-IP)。控制台→回源设置,若使用代理层(SLB/Nginx),确保源站能正确识别并信任WAF头部,且源站防火墙仅允许WAF/SLB出站IP访问。
8.
规则签名与更新(Rule Signature)
步骤:查看WAF规则库版本与更新时间。若使用自定义规则集,建立定期(如每周)核对流程:对规则变更做版本备份,并在生产启用前在预发环境验证。开启阿里云推荐的自动规则更新以获取最新威胁签名。
9.
性能与并发影响评估(Performance)
步骤:在低峰时段对WAF做压力测(注意先与阿里云沟通避免被误判)。监控CPU、响应时间、后端连接数。若发现延迟,检查是否启用了过多复杂正则或全包规则,考虑将非必要规则下移优先级或拆分。
10.
变更管理与回滚策略(Change Management & Rollback)
步骤:所有策略更改需走变更单流程(记录变更ID、修改人、时间、测试说明)。在控制台保存前先在“观察模式”或测试域名验证,若误伤快速回滚:在控制台使用“恢复上一个版本”或手动将规则状态改为“观察”。
11.
问:我如何快速判断WAF是否在误阻正常流量?
12.
答:检查SLS/访问日志的拦截率与来源IP。步骤:登录SLS → 以时间段筛选“action:blocked” → 排序查看前十来源IP与URI,核对这些请求是否为合法用户(User-Agent、Referer、Cookie)。若误杀,定位规则并临时设为“观察”。
13.
问:WAF日志量大,如何有效告警与排查?
14.
答:建立SLS索引与预设查询,配置阈值告警(如单位时间内拦截次数、404/500异常增长)。配合标签化(域名/应用)和自动化脚本将高风险IP入黑名单或发起回滚流程,缩短响应时间。
15.
问:例行自查周期与责任人如何设定?
16.
答:建议周检+月审制度:周检(规则命中、CC阈值、日志接入)由值班运维执行;月审(证书、策略版本、性能评估)由安全负责人复核并记录到变更管理系统,发现问题立即触发应急流程。
来源:定期自查避免阿里云waf出问题的十大配置与策略检查清单