Linux dropped 故障排查手册
一 快速确认与分层定位
二 硬件网卡与驱动层检查
三 内核网络栈与策略层检查
四 传输层与应用层检查
五 常用命令速查表
| 检查项 | 关键命令 | 判定要点 |
|---|---|---|
| 端到端连通 | ping 目标IP -c 20;traceroute 目标IP | 高丢包或特定跳数异常指向中间网络 |
| 接口与地址 | ip a;route -n | IP/掩码/网关与路由是否可达 |
| 协商与速率 | ethtool |
speed/duplex/autoneg 一致;必要时重协商 |
| 驱动与队列 | cat /proc/net/dev;ethtool -S |
RX dropped/overruns、rx_fifo 是否增长 |
| 队列容量 | cat /proc/net/softnet_stat;sysctl net.core.netdev_max_backlog | softnet_stat 第二列增长→增大 backlog |
| 内核丢包点位 | dropwatch -l kas;perf record -g -a -e skb:kfree_skb | 精确定位 kfree_skb 位置 |
| 防火墙 | iptables-save | grep drop;iptables -L -nv |
| 路由与 RPF | ip r get 目标IP;cat /proc/sys/net/ipv4/conf/ |
无路由或 RPF 策略导致丢弃 |
| 分片与 MTU | netstat -s | egrep "fragments |