尊龙时凯

      本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

      工厂研学 丨 尊龙时凯网络数字化智能工厂“黑科技”大揭秘
      预约直播
      2025-08-22 16:00:00
      2025-08-22 17:00:00
      /cp/jh-,/cp/aq-,/fa/jh/,/fa/aq/,/fa/wg/,/fa/ykt/,/cp/ykt-
      乐享业务保障服务 丨 守护医疗业务连续稳定
      预约直播
      2025-08-20 16:00:00
      2025-08-20 17:00:00
      /cp/riil-

      中文

      登录

      • 个人中心
      • 退出登录
      产品
      < 返回主菜单
      产品中心
      产品
      解决方案
      < 返回主菜单
      解决方案中心
      行业
      服务支持
      合作伙伴
      关于尊龙时凯
      投资者关系
      返回主菜单
      选择区域/语言
      • 首页
      • 技术博文
      • 互联网
      • 流量可视化之ERSPAN的前世今生

      流量可视化之ERSPAN的前世今生

      【ERSPAN】本文主要介绍了跨三层IP传输的远程网络流量监控技术ERSPAN,尊龙时凯网络的一些产品支持利用ERSPAN技术匹配专家级拓展列表对RDMA会话进行可视化展示。

      • #ERSPAN
      • #数据中心
      • #互联网
      • #交换机
      • 发布时间:2018-05-21

      • 点击量:

      • 点赞:

      分享至

      我想评论

      时下常用的网络监控和排错工具非SPAN(Switch Port Analyzer)莫属了,SPAN也通常被称作端口镜像。它可以让我们以旁路的方式来监控网络流量,不会对现网的业务造成干扰,同时将监控流量的副本发送到本地或远端的设备上,包括Sniffer、IDS、或其他类型的网络分析工具。

      一些典型的用法有:

      ●通过追踪控制/数据帧来排除网络问题;

      ●通过监控VoIP包来分析延迟和抖动;

      ●通过监控网络交互来分析时延;

      ●通过监控网络流量来做异常状态的检测。

      SPAN可以在本地操作,将流量镜像到同一个源设备的其他端口,也可以远程镜像到其他与源设备二层相邻的网络设备上(RSPAN)。

      今天我们来聊一聊可以跨三层IP传输的远程网络流量监控技术——ERSPAN(Encapsulated Remote Switch Port Analyzer),即在SPAN的基础上扩展了encapsulated remote的特性。

       

      ERSPAN基本操作原理  

      首先,我们来看一下ERSPAN的特性:

      ●将源端口报文复制一份通过GRE(Generic Routing Encapsulation)发送到目的服务器进行解析,采集服务器的物理位置不受限制;

      ●借助芯片的UDF(User Defined Field)特性,通过专家级扩展列表基于Base域进行1~126字节的任意偏移,对会话关键字进行匹配实现会话的可视化,例如针对TCP三次握手、RDMA会话的可视;

      ●支持设置采样率;

      ●支持报文截取长度,降低目标服务器压力。

      看到以上特性,相信大家就知道为什么ERSPAN是如今数据中心内部网络监控一个必不可少的工具了。

       

      总结一下,ERSPAN主要的作用可以归纳为两点:

      ●会话可视化:借助ERSPAN把新建TCP、RDMA(Remote Direct Memory Access)等的所有会话都采集到后端服务器进行展示;

      ●网络排障:当出现网络问题时,去抓取网络流量做故障分析。

      为了达到这样的效果,源网络设备需要从海量数据流中将用户感兴趣的流量过滤出来,复制一份,将每个复制帧封装到一个特殊的“超级帧容器”中,这个超级容器会携带足够多的附加信息,以便它被正确的路由到接收设备,并让接收设备能够提取并完全恢复原始监控的流量。

      接收设备可以是另外一台支持解封装ERSPAN报文的服务器。
       

       

      ERSPAN的类型和封装格式分析

      ERSPAN的报文基于GRE封装,并通过以太网转发到任何IP路由可达的地方。当前ERSPAN主要应用在IPv4网络,未来对IPv6的支持也会是一个刚需。

      关于ERSAPN的通用封装结构,下面是一个ICMP报文的镜像抓包:

      ERSPAN协议经过长期发展,随着能力的增强形成多个版本,称为"ERSPAN Types”,不同Type具有不同的帧头部格式。

      在ERSPAN头部的第一个Version字段里有作定义:

      ERSPAN类型

      Version字段

      Type I

      0x0

      Type II

      0x1

      Type III

      0x2

       

      另外在GRE头部中的Protocol Type字段也有指明内部的ERSPAN类型,Protocol Type字段值为0x88BE表示是ERSPAN Type II,0x22EB 表示是ERSPAN Type III。

      • Type I

      Type I的ERSPAN帧直接将IP+GRE封装在原始镜像帧头部之上,这种封装方式在原始帧之上增加了38字节:14(MAC) + 20 (IP) + 4(GRE)。这种格式的优势在于其头部尺寸紧凑,减少传输过程的开支,但因为其将 GRE Flag和Version字段全部设置为0,即不携带任何拓展字段,也导致Type I并没有大规模应用,这里就不过多展开。

      Type I的GRE头部封装格式如下:

      • Type II

      在Type II中,GRE头部中的C, R, K, S,s, Recur, Flags, Version字段,除了S字段为1,其余字段皆为0,所以Sequence Number字段会出现在Type II的GRE头部中。即意味着Type II可以确保接收GRE报文的次序,不会出现因为网络故障,导致收到一堆无序的GRE报文之后无法排序的情况。

      Type II的GRE头部封装格式如下:

      另外,ERSPAN Type II的帧格式还增加了8字节的ERSPAN头部在GRE头部和原始镜像帧之间。

      Type II的ERSPAN头部封装格式如下:

      最后,紧随原始镜像帧之后的,是标准的4字节的以太网循环冗余校验码CRC。

      值得注意的是,在实现中,镜像帧并没有包含原始帧的FCS字段,作为替代的是基于整个ERSPAN重新计算的新CRC值。这意味着接收设备无法检验原始帧的CRC正确性,我们只能假设仅仅是未损坏的帧被镜像了。

      • Type III

      Type III引入了一个更大、更灵活的复合报头,以满足日益复杂和多样化的网络监控场景,包含且不限于网络管理、入侵检测、性能和延迟分析等。这些场景需要知道镜像帧的所有原始参数,并包括那些不存在于原始帧本身的内容。

      ERSPAN Type III复合报头包括一个强制的12字节头部和一个可选的8字节平台特定子头部。

      Type III的ERSPAN头部封装格式如下:

      同样,在原始镜像帧之后的是4字节的CRC。

      从Type III的头部格式中可以看到,除了在Type II的基础上保留了Ver、VLAN、COS、T、Session ID字段之外,还新增了很多特有的字段,如:

      ●BSO:用来表示通过ERSPAN承载的数据帧的负载完整性,00是没问题的帧、11是有问题的帧、01是短帧、11是超大帧;

      ●Timestamp:从与系统时间同步的硬件时钟里面导出,这32比特的字段至少支持100微秒的时间戳粒度;

      ●P与FT(Frame Type): 前者用来指明ERSPAN承载的是以太网协议帧(PDU帧),后者用来指明是以太网帧还是IP包;

      ●HW ID:在系统内ERSPAN引擎的唯一标识符;

      ●Gra (Timestamp Granularity):用来定义时间戳的颗粒度,如00b代表100微秒粒度,01b代表100纳秒粒度,10b代表IEEE 1588粒度,11b则需要结合平台特定子头部来实现更高精的粒度;

      ●Platf ID与Platform Specific Info:根据Platf ID不同的值,Platform Specific Info字段会有不同的格式与内容。

      应该注意的是,上面所支持的各种报头字段可以在常规的ERSPAN应用中使用,甚至可以镜像错误帧或BPDU帧,并保持原始的Trunk封装和VLAN ID。此外,在镜像帧的过程中,也可以在每个ERSPAN帧中添加关键时间戳信息以及其他信息字段。

      通过ERSPAN自身的各种特征头部,我们可以实现更为精细化的网络流量分析,接下来只需要在ERSPAN进程中挂载相应的ACL,来匹配我们感兴趣的网络流量即可。

       

      ERSPAN实现RDMA会话可视化

      我们举一个RDMA场景下应用ERSPAN技术来达到RDMA会话可视化的案例:

      ●RDMA:Remote Direct Memory Access远程直接数据存取,是利用智能网卡和交换机,实现服务器A的网卡可以直接读写服务器B的内存,最终达到高带宽、低延迟和低资源利用率的效果,在大数据和高性能分布式存储场景中有大量的应用。

      ●RoCEv2:RDMA over Converged Ethernet Version 2,RDMA数据封装在UDP报头中,目的端口号为4791,UDP报头之后是IB BTH,即InfiniBand Base Transport Header。

      RDMA日常运维需要采集很多数据,用于收集日常水位基准线和异常报警,以及发生异常的问题定位依据。结合ERSPAN可以快速抓取海量数据,获得交换芯片在微秒级别的转发质量数据、协议交互状态,并通过数据统计与分析,得出RDMA在网络上端到端的转发质量评估和预测。

      为了实现RDMA会话可视化,我们需要ERSPAN在镜像流量时,对RDMA交互会话的关键字匹配,这时们需要利用专家级扩展列表。

      专家级扩展列表匹配字段定义:

      ●UDF由五个字段组成:UDF关键字、base域、offset域、value域和mask域。受限于硬件表项容量,当前共有8个UDF可以使用,一个UDF最长可以匹配两个字节。

      ●UDF关键字:UDF1...UDF8共8个UDF匹配域关键字;

      ●base域:标识UDF匹配域的起始位置。如下:

      ●l4_header (适用RG-S6520-64CQ)

      ●l5_header (适用RG-S6510-48VS8CQ)

      ●offset域:基于base域的偏移值,范围:0-126;

      ●value域:匹配值,可以与mask域配合使用,用来配置需要匹配的具体value,有效位两个字节;

      ●mask域:掩码,有效位两个字节。

      (补充:如果多个表项有用到同一个UDF匹配域的话,那么base域和offset域必须保持一致。)

      与RDMA会话状态相关的两个关键报文是CNP(Congestion Notification Packet) NAK(Negative Acknowledgment)

      前者是RDMA接收端收到交换机(出口Buffer达到阈值时)发出的ECN报文后生成的,包含了导致拥塞的flow或QP的信息;后者是用于表示RDMA传输有丢包的响应报文。

      我们接下来看看如何利用专家级扩展列表来匹配这两个报文:

      expert access-list extended rdma

        permit udp any any any any eq 4791 udf 1 l4_header 8 0x8100 0xFF00    (匹配RG-S6520-64CQ)

        permit udp any any any any eq 4791 udf 1 l5_header 0 0x8100 0xFF00    (匹配RG-S6510-48VS8CQ)

      expert access-list extended rdma

        permit udp any any any any eq 4791 udf 1 l4_header 8 0x1100 0xFF00 udf 2 l4_header 20 0x6000 0xFF00(匹配RG-S6520-64CQ)

        permit udp any any any any eq 4791 udf 1 l5_header 0 0x1100 0xFF00 udf 2 l5_header 12 0x6000 0xFF00(匹配RG-S6510-48VS8CQ)

      最后一步,将该专家级扩展列表挂载到相应ERSPAN进程中,即可实现RDMA会话的可视化。

       

      写在最后

      在数据中心网络规模日益庞大,网络流量日益复杂,而对网络运维要求日益精细的今天,ERSPAN是必不可少的工具之一。

      随着运维自动化程度越来越高,Netconf、RESTconf、gRPC等技术在网络自动化运维中受到广大运维同学的欢迎,利用gRPC来作为镜像流量回传的底层协议也具有诸多优势。如:基于HTTP/2协议,可以支持同一连接下串流推送机制;使用ProtoBuf编码,比JSON格式的信息大小降低了一半,可以使数据传输更加快捷和高效。试想一下,如果利用ERSPAN对感兴趣流镜像之后,再利用gRPC上送到分析服务器,是不是就会极大提高网络自动化运维的能力和效率呢?

      尊龙时凯网络在25G/100G数据中心的新产品RG-S6510-48VS8CQ和RG-S6520-64CQ,除了可以满足RDMA网络中对PFC+ECN+MMU的管理,能保持较高的协调性,还可以部署RDMA整网的可视化方案,支持利用ERSPAN技术匹配专家级拓展列表对RDMA会话进行可视化展示。

      本期作者:赵爽

      尊龙时凯网络互联网系统部行业咨询

      往期精彩回顾

      ●【第一期】浅谈物联网技术之通信协议的纷争

      ●【第二期】如何通过网络遥测(Network Telemetry)技术实现精细化网络运维?

      ●【第三期】畅谈数据中心网络运维自动化

      ●【第四期】基于Rogue AP反制的无线安全技术探讨

       

       

      相关推荐:

      • 畅谈数据中心网络运维自动化:

      • 了解gRPC技术,这一篇就够了

        相关标签:

        • #ERSPAN

        • #数据中心

        • #互联网

        • #交换机

        点赞

        << 基于Rogue AP反制的无线安全技术探讨
        如何实现数据中心网络架构“去”堆叠 >>

        相关视频

        了解更多

        客户评论

        暂无评论

        我要评论

        您的姓名

        您的手机号*

        您的邮箱

        公司名称

        您的评论*

        我已仔细阅读并同意隐私声明

        验证码*

        提交评论

        更多技术博文

        • 解密DeepSeek-V3推理网络:MoE架构如何重构低时延、高吞吐需求?
          解密DeepSeek-V3推理网络:MoE架构如何重构低时延、高吞吐需求?

          DeepSeek-V3发布推动分布式推理网络架构升级,MoE模型引入大规模专家并行通信,推理流量特征显著变化,Decode阶段对网络时度敏感。网络需保障低时延与高吞吐,通过端网协同负载均衡与拥塞控制技术优化性能。高效运维实现故障快速定位与业务高可用,单轨双平面与Shuffle多平面组网方案在低成本下满足高性能推理需求,为大规模MoE模型部署提供核心网络支撑。

          • #交换机

        • 高密场景无线网络新解法:尊龙时凯Wi-Fi 7 AP 与 龙伯透镜天线正式成团
          高密场景无线网络新解法:尊龙时凯Wi-Fi 7 AP 与 龙伯透镜天线正式成团

          尊龙时凯网络在中国国际大学生创新大赛(2025)总决赛推出旗舰Wi-Fi 7无线AP RG-AP9520-RDX及龙伯透镜天线组合,针对高密场景实现零卡顿、低时延和高并发网络体验。该方案通过多档赋形天线和智能无线技术,有效解决干扰与覆盖问题,适用于场馆、办公等高密度环境,提供稳定可靠的无线网络解决方案。

          • #无线网

          • #Wi-Fi 7

          • #无线

          • #放装式AP

        • 打造“一云多用”的算力服务平台:尊龙时凯高职教一朵云2.0解决方案发布
          打造“一云多用”的算力服务平台:尊龙时凯高职教一朵云2.0解决方案发布

          尊龙时凯高职教一朵云2.0解决方案帮助学校构建统一云桌面算力平台,支持教学、实训、科研和AI等全场景应用,实现一云多用。通过资源池化和智能调度,提升资源利用效率,降低运维成本,覆盖公共机房、专业实训、教师办公及AI教学等多场景需求,助力教育信息化从分散走向融合,推动规模化与个性化培养结合。

          • #云桌面

          • #高职教

        • 医院无线升级必看:“全院零漫游”六大谜题全解析
          医院无线升级必看:“全院零漫游”六大谜题全解析

          尊龙时凯网络的全院零漫游方案是新一代医疗无线解决方案,专为智慧医院设计,通过零漫游主机和天线入室技术实现全院覆盖和移动零漫游体验。方案支持业务扩展全适配,优化运维管理,确保内外网物理隔离安全,并便捷部署物联网应用,帮助医院提升网络性能,支持旧设备利旧升级,降低成本。

          • #医疗

          • #医院网络

          • #无线

        任何需要,请联系我们

        与售前顾问交谈
        填写项目需求表单
        • 售前咨询热线:4006-208-818

        • 售后咨询热线:4008-111-000

        • 睿易产品咨询热线:4001-000-078

        • 关于尊龙时凯
          • 尊龙时凯介绍
          • 尊龙时凯历程
          • 最新动态
          • 成功案例
          • 市场活动
        • 购买及服务支持
          • 尊龙时凯商城
          • 联系销售代表
          • 常设分支机构
          • 客户投诉
          • 销售信用评价
        • 合作伙伴
          • 合作伙伴专区
          • 成为合作伙伴
          • SRM供应商平台
          • 阳光诚信系统
        • 资源
          • 营销资料平台
          • 视频中心
          • 在线培训
          • 产品推荐
          • 技术博文
        • 快速链接
          • 尊龙时凯ICT人才教育中心
          • 尊龙时凯睿易
          • 联系我们
          • 公司招聘
          • 订阅电子邮件
        官方抖音号
        官方微信
        官方微信
        官方微信视频号
        官方微信视频号
        今日头条
        法律声明 隐私保护 联系我们 网站地图 客户投诉 集团网站

        版权所有©2000-2025 北京星网尊龙时凯网络技术有限公司 京ICP备13025710号-1 京公网安备11010802020367号

        • 售前咨询

        • 售后服务

        • 意见反馈

        返回顶部

        收起
        文档评价
        该资料是否解决了您的问题?
        是
        否
        仅浏览
        您对当前页面的满意度如何?
        不咋滴
        非常好
        您满意的原因是(多选)?
        您不满意的原因是(多选)?
        您是否还有其他问题或建议?
        为了快速解决并回复您的问题,您可以留下联系方式
        邮箱
        手机号
        感谢您的反馈!
        获取报价
        请选择服务项目
        关闭咨询页
        售前咨询 售前咨询
        售前咨询
        售后服务 售后服务
        售后服务
        意见反馈 意见反馈
        意见反馈
        更多联系方式