以太网基本协议(以太网标准与技术)

资料编码产品名称,下面我们就来聊聊关于以太网基本协议?接下来我们就一起去了解一下吧!

以太网基本协议(以太网标准与技术)

以太网基本协议

资料编码

产品名称

宽带网络技术

使用对象

产品版本

编写部门

技术支持部宽带产品线

资料版本

以太网标准与技术

修 订 记 录

日 期

修订版本

作 者

描 述

2001/12/16

V1.0

辛庆祥

初稿完成

深 圳 市 华 为 技 术 有 限 公 司

目 录

第一章 概 述 1

1.1 以太网技术起源 1

1.2 以太网设计目标 2

1.3 以太网基本技术及主要设备 2

1.4 以太网应用 5

第二章 以太网物理层及相关设备 6

2.1 物理层系列标准 6

2.2 100BASE-TX物理层 7

2.3 自动协商 8

2.4 集线器 9

2.5 物理层总结 10

第三章 数据链路层 11

3.1 数据链路层特点 11

3.2 以太网链路层的分层结构 11

3.3 MAC子层 12

3.4 LLC子层 15

3.5 以太网链路层总结 17

第四章 以太网交换机 18

4.1 以太网交换机体系结构 18

4.2 以太网交换机工作过程 19

第五章 VLAN 20

5.1 VLAN划分方式 21

第六章 交换机间链路 24

6.1 1Q帧格式 25

6.2 数据帧在不同类型端口之间的转发 26

6.3 VLAN在交换机上的配置 26

第七章 千兆以太网基本概念 27

第八章 千兆以太网自动协商内容 29

第九章 千兆以太网自动协商过程 30

第十章 千兆以太网案例分析 31

第十一章 二层组播基本概念 32

11.1 组播MAC地址 32

11.2 MAC层数据帧的接收 33

11.3 组播转发表 33

第十二章 二层组播协议 34

12.1 IGMP协议 34

12.2 CGMP协议 36

12.3 GMRP协议 37

12.4 二层组播协议总结 38

第十三章 生成树协议 38

13.1 广播风暴 38

13.2 生成树协议基本概念 40

13.3 生成树协议运行过程 42

第十四章 其他相关技术 44

14.1 以太网的QoS保证 44

14.2 DPT基本概念 45

第一章 概 述

自从1946年第一台数字计算机问世到现在 经历了半个多世纪的时间在这半个世纪的里程中 计算机技术的发展大体经历了三个成熟的阶段 第一个阶段是大型机时代 典型的是运行UNIX操作系统的大型计算机 该机器带很多终端 每个用户占用一个终端 大型机采用分时的技术为每个终端轮流服务 在用户看来自己单独享用了一个完整的计算机 这种体系结构主要用于科研机构来进行大量的数学运算 第二个阶段是客户服务器阶段 也就是所谓的C/S结构 最有代表性的是NOVELL公司的NetWare操作系统 这个系统分为服务器和客户机两部分 服务器软件安装在一台性能比较高的服务器上 客户机软件则安装在工作中终端上 一般是基于DOS操作系统的PC机

这些服务器和客户机通过网络连接起来 达到文件和数据库共享的目的 后来的WINDOWS NT也是基于这样的体系结构 但是在软件上引入了一些分布式的处理体系 第三个阶段 也就是目前所处的阶段 是网络阶段 这个阶段的特点是 计算机之间的互连越来越复杂 不但互连的速度有很大提高 达到100M

而且在地理位置上也跨越了地域 通过高速专线把处于不同城市 甚至是不同国家的计算机网络连接起来 这样复杂的网络对网络设备提出了很高的要求

从上面的分析可以看出 在第二和第三阶段中 必须有一种技术来把本地的许多计算机连接起来 这种技术就是所谓的局域网技术 到目前为止存在许多种局域网技术 比如令牌环 令牌总线 以及IBM公司的SNA 系统网络结构

以太网等等 在这些技术当中 以太网技术以其简明 高效的特点逐渐战据了主导地位

1.1 以太网技术起源

以太网技术起源于一个实验网络 该实验网络的目的是把几台个人计算机以3M的速率连接起来 由于该实验网络的成功建立和突出表现 引起了DEC Intel Xerox三家公司的注意 这三家公司借助该实验网络的经验 最终在1980年发布了第一个以太网协议标准建议书 该建议书的核心思想是在一个10M带宽的共享物理介质上 把最多1024个计算机和其他数字设备进行连接 当然 这些设备之间的距离不能太大 最大2.5公里

之后 以太网技术在1980年建议书的基础上逐渐成熟和完善 并逐渐占据了局域网的主导地位

1.2 以太网的设计目标

开始的时候 以太网设计建议书提出了以太网设计的基本目标 即所谓的功能特性 在后来的应用中对这些目标进行了不断的补充和完善 最终形成了一个成熟的体系 主要包含以下几点

简明性 这是以太网技术最大的特点 正是因为简明性为将来的统治地位奠定了基础

低成本 成本不要太高 一般的单位能够有能力购买需要的部件来组建网络

兼容性 不应该对网络层实现施加任何限制 即以太网的所有功能都在数据链路层实现

寻址灵活 应该有一种机制来确定网络中的一台计算机 全部计算机或一组计算机

公平 各个终端应该公平的享有带宽

高速 当时来说 10M的速率已经是个天文数字了 所以把以太网的共享总线带宽设计为10M

分层结构 数据链路层协议不应该随物理介质的不同而变化

全双工 随着以太网技术的发展 共享介质技术

即半双工 已经逐渐不能满足需求 需要效率更高的全双工技术

差错控制 该技术应该能够发现传输中的错误并进行纠正 如果不能纠正则丢弃接收到的数据

速度灵活性 不应该局限在10M的速率上 应该能适应不同的速率

优先级 网络设备应该能对一些关键性的业务提供优先可靠的传输

这些功能目标有的是必须实现的 比如简明 低成本 寻址灵活等 有的则根据需要实现 比如优先级等 但在今天的以太网设备中 这些可选的性能目标都已经实现

1.3 以太网基本技术及主要设备1.3.1 半双工CSMA/CD

根据以太网的最初设计目标 计算机和其他数字设备是通过一条共享的物理线路连接起来的 这样被连接的计算机和数字设备必须采用一种半双工的方式来访问该物理线路 而且还必须有一种冲突检测和避免的机制 来避免多个设备在同一时刻抢占线路的情况 这种机制就是所谓的CSMA/CD

带碰撞检测的载波监听多路访问

CSMA/CD的工作过程是这样的 终端设备不停的检测共享线路的状态只有在空闲的时候才发送数据 如果线路不空闲则一直等待 这时候如果有另外一个设备同时也发送数据 这两个设备发送的数据必然产生碰撞 导致线路上的信号不稳定 终端设备检测到这种不稳定之后 马上停止发送自己的数据 然后再发送一连串干扰脉冲 然后等待一段时间之后再进行发送

发送干扰脉冲的目的是为了通知其他设备 特别是跟自己在同一个时刻发送数据的设备 线路上已经产生了碰撞 检测到碰撞后等待的时间也是随机的 不过逐渐在增大

1.3.2 以太网的物理介质

刚开始的时候 以太网是运行在同轴电缆上面的 通过复杂的连接器把计算机和终端连接到该电缆上 然后还必须经过一些相关的电信号处理 才能使用 这样的结构相对复杂 而且效率上不是很理想 只能适合于半双工通信 因为只有一条线路

到了1990 年 出现了基于双绞线介质的10BAST-T以太网 这是以太网历史上一次最重要的革命

10BAST-T得以实施 主要归功于多端口中继器和结构化电话布线 多端口中继器就是目前所谓的HUB 终端设备通过双绞线连接到HUB上 利用HUB内部的一条共享总线进行互相通信 物理上这种结构是星形的 但实际上还是沿用了CSMA/CD的访问机制 因为HUB内部是通过一条内部总线把许多终端连接起来的

10BAST-T以太网技术使用了四对双绞线来传输数据 一对双绞线用来发送 另外一对用来接收 之所以使用一对双绞线来分别进行收发 主要是电气特性上的考虑 发送数据的时候 在一条线路上发送通常的电信号 而在另外一条线路上发送跟通常电信号极性相反的信号 这样可以消除线路上的电磁干扰

后来又出现了100M的以太网 即所谓的快速以太网 快速以太网在数据链路层上跟10M以太网没有区别 不过在物理层上提高了传输的速率 而且引入了更多的物理层介质 比如光纤 同轴电缆等 运行在两对双绞线上的 100M 以太网称为100BAST-TX 运行在光纤上的 100M 以太网则为100BASE-FX 还有运行在四对双绞线上的100BAST-T4等 所有这些物理介质都是沿用了CSMA/CD的访问方式 工作在半双工模式下

1.3.3 全双工以太网和以太网交换机

把双绞线作为以太网的传输介质不但提高了灵活性和降低了成本 而且引入了一种高效的运行模式 全双工模式 所谓全双工 就是数据的发送和接收可以同时进行 互不干扰 传统的网络设备HUB是不支持全双工的因为HUB的内部是一条总线 数据接收和发送都是在该总线上进行 没有办法进行全双工通信 因此 要实现全双工通信 必须引入一种新的设备 即现在的交换机

交换机跟HUB的外观相同 都是一个多端口设备 每个端口可以连接终端设备和其他多端口设备 但在交换机内部就不是一条共享总线了 而是一个数字交叉网络 该数字交叉网络能把各个终端进行暂时的连接 互相独立

的传输数据 而且交换机还为每个端口设置了缓冲区 可以暂时缓存终端发送过来的数据 等资源空闲之后再进行交换 正是交换机的出现 使以太网技术由原来的10M/100M共享结构转变为20M/200M独占带宽的结构 大大提高了效率 而且可以在交换机上施加一些软件策略 来实现附加的服务 比如VLAN 虚拟局域网

优先级 冗余链路等 这些技术增加了业务的丰富性 是以太网技术的灵魂所在 也是本文的重点内容

1.3.4 自动协商

从上面的介绍可以看出 在实际中 以太网的运行有许多种组合 比如双工模式可以选择全双工和半双工 速率可以选择10M 100M 物理介质可以选择五类双绞线和三类双绞线等 这样丰富的如果对每个终端设备都进行手工配置 必然是一项繁杂而且不可维护的工作 于是 为了应付这样多种多样的运行模式 自动协商应运而生

自动协商的主要功能就是使物理链路两端的设备自动通过交互信息 自动选择一种运行模式来运行 自动协商是建立在双绞线以太网的一种低层机制上的 它只对双绞线以太网有效 自动协商的内容主要包括双工模式 运行速率 流量控制等内容 一旦协商通过 链路两端的设备就锁定在这样一种运行模式下 直到重新引导设备或重新插拔电缆

1.3.5 1000M以太网和10G以太网

随着计算机技术的不断发展 一些新兴的应用逐渐显现 比如大型的分布式数据库和高速的视频图象传输等 这些应用需要大量的带宽 传统的快速以太网 100M

已经不能满足要求 这时候迫切再次提高以太网的运行速度 提高到1000M是最直接的 即所谓的千兆以太网

千兆以太网的数据链路层基本上沿用了传统的以太网的链路层

只在半双工运行模式下 与传统以太网的链路层稍微有不同

这样可以很好的保护了投资 但在物理层上做了改变 为了在物理介质上传送高达1000M的数据比特 千兆以太网沿用了光纤通道的技术

对目前来说 千兆以太网只能用光纤作为物理传输介质 但基于同轴电缆和五类双绞线的千兆以太网正在研制当中 估计不久的将来会投入使用

千兆以太网技术现在已经完全成熟并大量投入使用 主要应用在数据网络的骨干位置 也应用于连接一些高端的数据库服务器 正在研究当中的10G以太网也已经初具雏形 到能够商用的地步还有一段时间 但可以预计 在不久的将来 1000M以太网和10G以太网将象现在的10M以太网和快速以太网一样普遍

1.4 以太网的应用

以太网设计的初衷 就是把一些计算机联系起来进行文件共享和数据库记录的传输 到目前为止 在计算机互连这个领域 以太网仍然是最活跃的技术 但已经不再局限于这个领域 在其他一些领域 以太网也大显身手表现不俗 下面是以太网的主要应用领域

计算机互连 这是以太网技术的主要目标 也是最成熟的应用范围 最开始的时候 许多计算机通过同轴电缆连接起来 互相访问共享的目录 或访问在同一个物理网段上的文件服务器 各个计算机

不论是服务器还是客户机

在网络上的地位相同 随着应用的发展 这种平等的结构逐渐不适应实际的需要 因为网络上的大部分流量都是客户机跟服务器之间的 这种流量模型必然在服务器上形成瓶径 当全双工以太网和以太网交换机引入以太网之后 这种情况有所改变 取代的是把服务器连接到以太网交换机的一个告诉端口 100M

上 把其他客户机连接到以太网交换机的低速端口上 这样就暂缓了瓶径的形成 现代的操作系统提供分布式服务和数据仓库服务 基于这些操作系统的服务器除了跟客户机通信之外 还要跟其他服务器交换大量的信息进行数据的同步 这样传统的100M快速以太网就不能满足要求了于是1000M以太网应运而生

高速网络设备之间互连 随着INTERNET的不断发展 一些传统的网络设备 比如路由器 之间的带宽已经不能满足要求 需要更高更有效率的互连技术来连接这些网络设备构成INTERNET的骨干 1000M以太网成了首选的技术 传统的100M也可以应用在这些场合 因为这些100M的快速以太网链路可以经过聚合 形成快速以太网通道 速度可以达到100M 1000M的范围

城域网中用户接入的手段 用户通过以太网技术接入城域网 实现上网 文件下载 视频点播等业务 已经变得越来越流行 之所以用以太网作为城域网的接入手段 是因为现在的计算机都支持以太网卡 这样对用户来说 不用更改任何软件和硬件配置就可以正常上网

可以看出 以太网技术已经覆盖了网络的方方面面 从骨干网到接入网从计算机网络到工业应用 无处不见以太网的影子

第二章 以太网物理层及相关设备

根据ISO的OSI七层参考模型 物理层规定了两个设之间的物理接口 以及该接口的电气特性 规程特性 机械特性等内容 以太网的物理层也不外部这些内容 它主要的功能是提供一种物理层面的标准 各个厂家只要按照这个标准生产网络设备就可以进行互通 下面从介绍这些物理层标准开始来分析一下以太网的物理层基础结构

2.1 物理层系列标准

从以太网诞生到目前为止 成熟应用的以太网物理层标准主要有以下几

10BASE2

10BASE5

10BASE-T

100BASE-TX

100BASE-T2

100BASE-T4

100BASE-FX

1000BASE-SX

1000BASE-LX

1000BASE-CX

1000BASE-TX

在这些标准中 前面的10 100 1000分别代表运行速率 中间的BASE指传输的信号是基带方式 后边的2 5分别代表最大距离 比如 5代表50米

2代表200米等 TX T2 T4 FX SX LX CX等应用于双绞线以太网和光纤以太网 含义如下

100BASE-TX 运行在两对五类双绞线上的快速以太网

100BASE-T4 运行在四对三类双绞线上的快速以太网

100BASE-T2 运行在2对三类双绞线上的快速以太网

100BASE-FX 运行在光纤上的快速以太网 光纤类型可以是单模也可以是多模

1000BASE-SX 运行在多模光纤上的1000M以太网 S指发出的光信号是长波长的形式

1000BASE-LX 运行在单模光纤上的1000M以太网 L指发出的光信号是短波长的形式

1000BASE-CX 运行在同轴电缆上的1000M以太网

在这些标准中 10BASE2 10BASE5是同轴电缆的物理标准 现在已经基本被淘汰 10BASE-T和100BASE-TX都是运行在五类双绞线上的以太网标准 所不同的是线路上信号的传输速率不同 10BASE-T只能以10M的速度工作 而100BASE-TX则以100M的速度工作 其他方面没有什么两样

100BASE-T2 100BASE-T4现在很少用 所以我们这里只选择比较有代表性的100BASE-TX进行叙述 其他的比如1000M以太网的技术在后边的章节中再进行讲述

2.2 100BASE-TX物理层

100BASE-TX是运行在两对五类双绞线上的快速以太网物理层技术 它除了规定运行的介质是五类或更高类双绞线外 还规定了设备之间的接口以及电平信号等 该标准规定设备和链路之间的接口采用RJ-45水晶头 电瓶采用 5V和-5V交替的形式 RJ-45接口如下

五类双绞线的8跟线压入水晶头的8个线槽中 这样可以很容易的插入网络设备的网卡

实际上 在进行数据的传输时仅仅用了五类双绞线的两对

四根

线 其中一对作为数据接收线 一对作为数据发送线 在进行数据接收和发送的时候 在一对线上传输极性相反的信号 这样可以避免互相干扰 需要注意的是 在连接两个相同的网络设备时

比如网卡

需要把线序进行交叉 因为线路两端的设备

比如网卡

的收发顺序是相同的 而两端设备要进行直接连接 其收发必须进行交叉 于是 必须在线路上进行交叉才能达到目的 如图所示

但在跟不同类型的网络设备互连 比如终端计算机跟HUB或以太网交换机连接时 却不需要这样 因为这些网络设备的接口上已经做了交叉 也就是说 这些设备的网络接口跟普通计算机的收发顺序是不一致的 因而只要把五类双绞线直接按照原来顺序压入水晶头 就可以把两端的设备正常连接

跟传统的同轴电缆不同的是 100BAST-TX 10BASE-T

的数据发送和数据接收使用了不同的线对 做到了分离 这样就隐含着一种全新的运做方式全双工方式 在这种方式下 数据可以同时接收和发送而互不干扰 这样可以大大提高效率 不过这需要中间设备的支持 现在的以太网交换机就是这样一种设备

2.3 自动协商

在基于双绞线的以太网上 可以存在许多种不同的运做模式 在速度上有10M 100M不等 在双工模式上有全双工和半双工等 如果对每个接入网络的设备进行配置 则必然是一项很繁重的工作 而且不容易维护 于是人们提出了自动协商技术来解决这种矛盾 需要注意的是 自动协商只运行在基于双绞线的以太网上 是一种物理层的概念

自动协商建立在一种低层的以太网机制上 在双绞线链路上 如果没有数据传输 链路并不是一直在空闲 而是不断的互相发送一种频率相对较低的脉冲信号 称为普通链路脉冲 NLP

如上图所示

任何具有双绞线接口的以太网卡都应该能识别这种信号 需要注意的是 如果在这些NLP之间在插入一些 一般是16个

更小的脉冲 这些脉冲称为快速链路脉冲FLP

两端设备应该也能识别 于是 我们可以使用这些快速链路脉冲来进行少量的数据传输 来达到自动协商的目的

在设备的网卡中有一个配置寄存器 该寄存器内部保留了该网卡能够支持的工作模式 比如该网卡可以支持100M和10M模式下运行 则把相应的寄存器内容置位 在网卡加电后 如果允许自动协商 则网卡就把自己的配置寄存器内容读出来 编码后通过FLP发送出去 如下图所示

发送的同时 可以接收对端发送挂过来的自动协商数据 接收到对方发送的自动协商数据后 跟自己的配置寄存器比较 选择自己支持的且一般情况下最优的组合投入运行 比如自己支持全双工模式和100M的速率 对端也支持该配置 则选择的运行模式就是100M全双工 如果对端只支持全双工模式和10M的能力 则运行模式就定为全双工10M模式 如果两端支持的能力集合不相交 则协商不通过 两端设备不能通信

一旦协商通过 网卡就把该链路置为激活状态 可以传输数据了 如果不能协商通过 则该链路不能使用 不能再进行数据传输 如果两端的设备有一端不支持自动协商 则支持自动协商的一端选择选择一种默认的方式工作 一般情况下是10M半双工模式

& 注意

1 如果链路两端的设备有一端不支持自动协商 则支持自动协商的设备选择一种默认的工作方式 比如10M半双工模式运行 这时可能影响了效率 因为不支持自动协商的设备可能支持100M全双工 这时 我们可以禁止自动协商 并手工指定两端设备的运行模式 以增强效率

2.4 集线器

当用双绞线把终端设备进行互连时 需要一个中间设备来进行集中 这个设备就是集线器 所谓的HUB HUB的外观就是一个多口的黑盒子 每个接口可以连接一个终端设备 这样多个设备 比如 12个等

可以通过HUB连接在一起 组成一个星形的网络 需要注意的是 网络在物理上是星形结构的 但在HUB内部还是使用了共享总线的技术 采用CSMA/CD技术进行交互

HUB可以根据接口的特点进行区分 分为I类HUB和II类HUB 这两类HUB在内部工作模式上没有区别 但因为提供的接口不同而使用于不同的场合 I类HUB只提供一种类型的物理接口 比如只提供五类双绞线接口或只提供三类双绞线接口 或者只提供光纤接口等 而II类HUB则可以提供多种不同类型的接口 可以在一个II类HUB上集成五类双绞线接口和光纤接口等实际中应用最多的是I类HUB

传统的HUB都是运行在半双工模式下的 但有一些应用需要在全双工模式下运行 于是人们开发了一种运行在全双工模式下的HUB 即所谓全双工HUB 这种HUB的内部结构还是一条总线 各个终端共享这条总线进行数据交互 所不同的是 全双工HUB在每个接口上预增加了一个缓冲区如果总线繁忙 终端发送的数据可以暂存在缓冲区里面 等总线空闲之后再进行传输 连接在全双工HUB上的终端设备工作在全双工模式下

2.5 物理层总结

到此为止 以太网物理层的一些基础概念已经介绍完毕 在上面介绍的概念中 主要有下面这些需要引起重视

概述中的一些概念也在这里提起

各种物理层标准 10BASE2 10BASE5 10BASE-T 100BASE-TX 100BASE-FX 100BASE-T2 100BASE-T4 1000BASE-CX 1000BASE-SX 1000BASE-LX 1000BASE-TX 等物理层标准的含义100BAST-TX 10BASE-T

的物理层结构 包括接口特性等

通过双绞线连接同类型的设备和不同类型的设备 在两中情况下的线序情况 以及为什么这样

自动协商 自动协商的基本概念 实现机理 协商内容等 以及支持自动协商和不支持自动协商设备之间的交互情况

CSMA/CD访问方式 运行在半双工模式下的设备采用这种方式访问链路解释这种访问方式的过程以及碰撞避免机制

全双工以太网 全双工以太网得以实现的基础 以及其优点等

HUB I类HUB和II类HUB的概念 全送工HUB的工作机理

第三章 数据链路层

前面的部分讲述了物理层的一些基础概念 在这些概念的基础上 我们再来详细看一下数据链路层的概念

3.1 数据链路层特点

按照ISO的OSI七层参考模型 互连的各个系统把各个网络功能分七个层次实现 各个层次之间相互独立 互不干扰 这样就可以实现最大限度的开放和灵活性 设备厂家只要按照层次之间的接口生产设备 就可以做到互通 因此 这个七层模型是高效权威的 而且目前大多数网络技术都是参照这个模型进行设计和开发的

但在以太网体系结构中 七层模型中层次之间互相独立的规则就不适用了 因为开始的时候 以太网采用了一种共享介质的方式来进行数据通信 而不是传统的全双工通信 随着设备的发展 以太网中又引入了全双工模式的通信 在这样两种通信模式并存的情况下 在进行层次间的严格划分就不容易了

在前面讲述的内容中曾经提到 针对不同的双工模式 提供不同的介质访问方法 在半双工模式下采用的是CSMA/CD的访问方式 而在全双工模式下则可以直接进行收发 不用预先判断链路的忙闲状态 这里需要注意的是 在以太网中 半双工和全双工是物理层的概念 而针对物理层的双工模式提供不同访问方式则是数据链路层的概念 这样就形成了以太网的一个重要特点 数据链路层和物理层是相关的 理解了这个概念 以后的学习中就相对明了了

3.2 以太网链路层的分层结构

在上面的介绍中知道 以太网的物理层和数据链路层是相关的 针对物理层的不同工作模式

全双工和半双工

需要提供特定的数据链路层来访问 这样导致了数据链路层和物理层有很大的相关性 给设计和应用带来了一些不便

为了避免这种不便 一些组织和厂家提出了另外一种方式 就是把数据链路层再进行分层 分为逻辑链路控制子层 LLC

和媒体访问控制子层MAC

这样不同的物理层对应不同的MAC子层 LLC子层则可以完全独立 这样从一定程度上提高了独立性 方便了实现 下面的图示显示了

这样的结构

下面对MAC子层和LLC子层做一个详细的解释

3.3 MAC子层

MAC子层是物理层相关的 也就是说 不同的物理层有不同的MAC子层来进行访问 比如物理层是工作在半双工模式的双绞线 则相应的MAC子层为半双工MAC 如果物理层是令牌环 则有令牌环MAC来进行访问 在以太网中 主要存在两种MAC 半双工MAC和全双工MAC 分别针对物理层运行模式是半双工和全双工时提供访问 需要注意的 这两中MAC都是集成在网卡中的 网卡初始化的时候一般进行自动协商 根据自动协商的结果决定运行模式 然后根据运行模式选择相应的访问MAC

3.3.1 半双工MAC子层

当物理层运行在半双工模式下时 数据链路层使用半双工MAC进行访问 半双工MAC跟物理层之间至少存在六种信号进行通信 如下图所示

具体工作过程是这样的 当链路层有数据要发送的时候 首先检查链路空闲信号

物理层通过该信号来报告给数据链路层链路是否空闲

如果链路空闲 则通过指示信号给物理层一个指示 告诉物理层要发送数据然后把数据一个字节一个字节的送到数据线上 数据线是一组8位的信号线

这时候如果物理层检测到了冲突 即有另外一个终端同时发送数据

则通过冲突检测指示信号给MAC子层一个指示 告诉MAC子层线路上发生了碰撞 这时候 MAC子层马上停止数据的发送 并发送一连串干扰信号达到让网络上所有的设备都知道产生冲突的目的 等待一段时间后MAC层再次检查链路空闲信号 进行数据发送

如果物理层接收到了数据 则通过数据接收指示来告诉MAC子层自己接收到了数据 然后把数据放到接收数据线上

跟发送数据线一样 也是8位组信号线

传给MAC子层

从上面的分析中 可以看出这六种信号是

数据发送线 一个8位组信号线

数据接收线 一个8位组信号线

链路空闲信号 一个指示位 指示链路是否空闲

冲突检测信号 一个指示位 物理层使用该信号向MAC子层报告冲突发生

发送数据指示 MAC子层要传输数据时通过该信号告诉物理层

接收数据指示 物理层接收到数据后通过该信号告诉MAC子层

& 提示

MAC子层一般是在一块ASIC芯片上实现 该ASIC芯片通过引脚跟物理层连接 每个引脚为一个信号线 这些信号线组成了一些功能信号 上面提到的这六种信号就是功能信号中的一部分

3.3.2 全双工MAC子层

全双工MAC子层相对半双工MAC子层简单 因为它不需要检测链路的空闲与忙的状态 所以就去除了上面的链路空闲信号和冲突检测信号 其工作过程如下

当MAC子层有数据要发送的时候 通过数据发送指示告诉物理层 然后把数据一个字节一个字节的通过数据发送线发送出去 如果物理层检测到了数据到达 则通过接收指示信号告诉链路层 自己接收到了数据 然后通过接收数据线把数据传到MAC子层

& 提示

数据链路层跟物理层之间交换数据的时候

不是控制信号

是按字节进行的 这从接收数据和发送数据的信号线根数可以看出来

3.3.3 MAC地址和数据帧的收发

除了完成物理链路的访问以外 MAC子层还负责完成下列任务

链路级的站点标识 在数据链路层识别网络上的各个站点 也就是说 在该层次保留了一个站点地址 就是所谓的MAC地址

来标识网络上的唯一一个站点

链路级的数据传输 从上层 LLC子层

接收数据 附加上MAC地址和控制信息后把数据发送到物理链路上 在这个过程中搀杂了校验等功能

为了进行站点标识 在MAC子层保留了一个唯一的站点MAC地址 来区分该站点 MAC地址是一个48比特的数字 分为下面几种类别

物理MAC地址 这种类型的MAC地址唯一的标识了以太网上的一个终端

比如网卡等

实际上这样的地址是固化在硬件里面的

广播MAC地址 这是一个通用的MAC地址 用来表示网络上的所有终端设备

组播MAC地址 这是一个逻辑的MAC地址 来代表网络上的一组终端 它的特点是最左边一个字节的第一比特为1

上层要发送数据的时候 把数据提交给MAC子层 MAC子层有自己的缓冲区 把上层提交给自己的数据进行缓存 然后增加上目的MAC地址和自己的MAC地址 源MAC地址

计算出数据帧的长度 形成下列格式的数据包

上面介绍了数据的发送过程 下面说一下数据接收过程

在计算机的网卡中维护一张接收地址列表 每当计算机网卡接收到一个数据帧之后 就把数据帧的目的MAC地址提取出来 跟列表中的条目进行比较 只要有一项匹配 则接收该数据帧 若无任何匹配的项目 则丢弃该数据帧 在这张接收地址列表中至少有下面两项

1

计算机网卡的MAC地址 该地址固化在网卡的ROM里面

2

广播MAC地址 该地址代表网络上的所有主机

如果上层应用程序加入一个组播组 则该应用程序会通知网络层 然后网络层通知数据链路层 数据链路层根据应用程序加入的组播组形成一个组播MAC地址 并把该组播MAC地址加入接收地址列表 这样当有针对该组的数据帧的时候 MAC子层就接收该数据帧并向上层发送 这个组播过程在以后会详细讲解

3.4 LLC子层

在上面的介绍中提到了MAC子层形成的一个帧结构 其中有一个字段是LENGTH/TYPE 这个字段的长度是2字节 根据取值的范围有不同的含义 在小于或等于1500的情况下 该值代表数据帧数据部分的长度 但当

大于1500的时候 则代表该帧的数据部分的类型 比如该数据帧是哪个上层协议 比如IP IPX DECNet NETBEUI等

的数据单元等

当 LENGTH/TYPE 取值 大于 1500 的时 候 MAC 子 层可以 根据LENGTY/TYPE的值直接把数据帧提交给上层协议 这时候就没有必要实现LLC子层 这种结构便是目前比较流行的ETHERNET_II 大部分计算机都支持这种结构 注意 这种结构下数据链路层可以不实现LLC子层 而仅仅包含一个MAC子层

根据LENGTH/TYPE字段的取值 来把接收到的数据帧提交给上层协议模块 是这样进行的 每个上层协议都提供了一个回调函数 这个回调函数在数据链路层是可见的而且可以调用的 这样当数据链路层接收到一个数据帧之后 根据数据帧里的LENGTH/TYPE字段的取值来判断相应的协议模块 然后调用相应协议的回调函数

把数据帧的数据部分作为参数

该回调函数执行的结果就是把数据帧的数据部分挂到上层协议的接收队列 中 然后给上层协议发送一个消息 告诉上层协议有一个数据包到来 然后返回 其他的事情就有上层协议来做了

上面介绍的都是ETHERNET_II的内容 就是当LENGTH/TYPE字段大于1500的时候的情况 现在来讨论一下当LENGTH/TYPE小于或等于1500的情况 这种类型就是所谓的ETHERNET_SNAP 是802.3委员会制定的标准 虽然目前应用不是很广泛 但是作为一种很有特色的标准 将来必会大行其道

ETHERNET_SNAP除了定义传统的链路层服务之外 还增加了一些其他有用的特性 比如定义了下面三种类型的点到点传输服务

无连接的数据包传输服务 目前的以太网实现就是这种服务

面向连接的可靠的数据传输服务 预先建立连接再传输数据 数据在传输过程中可靠性得到保证

无连接的带确认的数据传输服务 该类型的数据传输服务不需要建立连接但它在数据的传输中增加了确认机制 使可靠性大大增加

这些服务都是在LLC子层中实现的 下面是LLC子层的帧格式

可以看出 该数据帧的结构在MAC子层上是保持统一的 但MAC子层数据帧的LENGTH/TYPE字段现在已经完全成了LENGTH 指示MAC数据帧数据部分的长度 然后在数据部分增加了一个LLC头 这个头由DSAP 目的服务访问点

SSAP 源服务访问点

和控制字段组成 上面讲述的三种服务就是通过这三个字段完成的 下面通过一个例子来说明SSAP 和DSAP的应用 假设终端系统A和终端系统B要使用面向连接的可靠的数据传输服务来进行一次数据传输 这时候会发生如下过程

1

终端系统A给终端系统B发送一个数据帧 请求建立一个面向连接的可靠连接

2

终端系统B接收到以后 判断自己的资源是否够用 即是否建立了太多的连接

如果够用 则返回一个确认 该确认中包含了识别该连接的SAP值

3

终端系统A接收到回应后 知道终端系统B已经在本地建立了跟自己的连接 于是终端系统A也开辟一个SAP值 来表示该连接 并发一个确认给终端系统B 于是该连接建立

4

终端系统A的LLC子层把自己要传送的数据进行封装 封装成LLC子层的帧格式

其中DSAP字节填写的是终端B返回的SAP SSAP字节填写的是自己开辟的SAP 然后发给 MAC 子层 MAC 子层加上 MAC 地址和LENGTH字段之后 发送到数据链路上

5

终端系统B的MAC子层接收到该数据帧之后 提交给LLC子层 LLC子层根据DSAP字段判断出该数据帧属于的连接 然后根据该连接的类型 可靠的连接还是无连接 或者带确认的无连接

进行相应的校验和确认 只有通过这些校验和确认后 才向更上层发送

6

数据传输完毕之后 终端系统A给终端系统B发送一个数据帧来告诉终端系统B拆除连接 于是通信结束

这些功能都是在LLC子层实现的 通过这个例子 读者应该对LLC的功能有了一个了解 也应该把LLC子层和MAC子层的界面分清楚 当然 这些LLC子层的功能对网络层都是透明的 细心的读者可能已经看出一个问题就是LLC子层根据什么内容来把数据帧提交给网络层 在ETHERNET_II中是通过LENGTH/TYPE字段来区分上层协议的 其实 在LLC子层的帧结构的数据部分中 也包含一个TYPE字段 该字段在上面的图中没有画出来LLC子层就是根据这个字段来把数据帧发送给上层协议的

3.5 以太网数据链路层总结

到此为止 数据链路层的一些标准和协议已经解释完了 下面列出该部分的一些主要内容 这些内容是最基础的

1

跟物理层相关是以太网的数据链路层的最大特点

2

按照802.3标准 数据链路层分为两个子层 LLC子层和MAC子层

3

针对不同的物理拓扑结构和双工工作模式 提供不同的MAC子层来进行访问

4

基于双绞线的半双工MAC子层

5

基于双绞线的全双工MAC子层

6

三种类型的MAC地址和MAC数据帧的收发过程

7

LLC子层提供的三种服务及其建立方式

8

LLC子层帧结构 以及帧结构中SSAP和DSAP字段的含义

9

最好能理解下层模块怎样根据类型字段向上层模块提交数据帧 通过回调函数实现

需要特别注意的是 现在计算机通信实现的以太网协议栈大部分是ETHERNET_II 即没有LLC子层功能 作为一项可选功能 有一些计算机能够识别和发送EHTERNET_SNAP帧结构 但作为一个很有特色的标准EHTRNET_SANP将来必然代替ETHERNET_II而成为以太网中的真实标准

第四章 以太网交换机

在以太网物理层内容的介绍中 介绍了一种网络设备 集线器

HUB

该设备工作在物理层 同样 在数据链路层也有一种网络设备就是本章介绍的以太网交换机

在以太网的发展历史上曾经出现了一种称为网桥的设备 该设备的功能是连接两个物理拓扑不同的网络 比如以太网和令牌环网 网桥在这两个网络中完成地址翻译 通信中继等功能 使得网络层看来 物理上不同的两个网络是一个逻辑的网络 其实网桥也是工作在数据链路层上的 随着

以太网技术的发展 连接两个异种网络的机会越来越少 于是 网桥正被以太网交换机逐渐代替

下面从以太网交换机的体系结构出发 来分析一下以太网交换机的工作过程 性能特点 以及一些提高性能的应用 比如快速以太网通道等

4.1 以太网交换机体系结构

从外观上看 以太网交换机跟HUB差不多 也是一个多端口的深颜色盒子 但端口的数目可能比HUB要多 一般情况下是24个或更多

但在内部结构上却比HUB复杂得多 HUB内部实际上是一条共享的总线 各个端口共享该总线进行CSMA/CD方式的通信 但以太网交换机内部可能也是一条总线 但该总线带宽要比HUB内部的总线高得多 足以让全部端口互相同时通信而没有阻塞 性能更高的交换机内部可能是一个交换网络 该网络完成任意端口之间的两两交换

上图是一个以太网交换机的内部结构示意图 由图可以看出以太网交换机使用一条高速背板总线把各个端口连接起来 实际上 这个背板总线可能是一个高性能的数字交叉网络 注意的是 各个端口针对接收线路和发送线路 各有一个缓冲队列 当数据从终端设备发往交换机的时候 发出的数据暂存在交换机的接收队列中 然后进行下一步处理 如果交换机要把接收的数据发送给某一终端 这时候 交换机把要发送的数据发往该接收终端所在端口的发送队列 然后在发送到接收终端 如果终端忙 则一直存储在发送队列中

其实 对每个接口的发送队列结构进行更改可以实现服务质量功能比如 我们为每个接口设计不止一个发送队列 假设设置三个 则可以对

这三个队列进行优先级划分 分成低 中 高三个优先级 然后根据数据帧的优先级字段 在以后介绍VLAN的时候将讲述

把数据帧放到相应的优先级队列中 在传输的时候 可以优先传输优先级高的队列 等高优先级队列内没有数据了 再传送优先级低的队列 依次类推 也可以实现一些其他的调度策略 比如WFQ 基于优先级的加权公平队列

等调度技术

交换机跟HUB的最大区别就是能做到接口到接口的转发 比如接收到一个数据帧以后 交换机会根据数据帧头中的目的MAC地址 发送到适当的端口 而HUB则不然 它把接收到的数据帧向所有端口转发 交换机之所以能做到根据MAC地址进行选择端口 完全依赖内部的一个重要的数据结构 CAM表 交换机接收到一个数据帧 依靠该数据帧的目的MAC地址来查找CAM表 查找的结果是一个或一组端口 根据查找的结构 把数据包送到相应端口的发送队列

CAM表包含下面几项内容

❖ MAC地址

❖ 一个或一组端口号

如果交换机上划分了VLAN 还包括VLAN ID

交换机根据接收到的数据帧的目的MAC地址 来查找该表格 根据找到的端口号 把数据帧发送出去 注意 上面一个MAC地址可能对应多个端口 这样的MAC地址一般是组播MAC地址 其中每个端口上连接一个组播组的成员 这些内容在组播部分中将详细讲述 在这里读者要有个印象

4.2 以太网交换机工作过程

上面提到了一个重要的数据结构CAM表 该表包含了交换机用来转发数据帧所涉及到的一些信息 对于交换机怎样依据这个表格进行数据帧的交换 上面部分已经讲明白了 但这又产生一个问题 这个CAM表是怎样生成的呢 其实 这个表格可以通过两种途径生成

1

手工加入 通过配置命令的形式告诉交换机MAC地址和端口的对应

2 交换机动态学习获得 交换机通过查看接收的每个数据帧来学习该表

手工生成该表很简单 不过配置麻烦 所以通常情况下是交换机自动获得的 下面我们分析一下交换机是怎么获得这个CAM表的 首先提出交换机转发数据帧的基本规则

❖ 交换机查CAM表 如果查找到结构 根据查找结果进行转发

❖ 如果交换机在CAM表中查找不到结果 则根据配置进行处理 通常情况下是向所有的端口发送该数据帧 在发送数据帧的同时 学习到一条CAM表项

开始的时候 交换机的CAM表是空的 当交换机接收到第一个数据帧的时候 查找CAM表失败 于是向所有端口转发该数据帧 在转发数据帧

的同时 交换机把接收到的数据帧的源MAC地址和接收端口进行关联 形成一项记录 填写到CAM表中 这个过程就是学习的过程

学习过程持续一段时间之后 交换机基本上把所有端口跟相应端口下终端设备的MAC地址都学习到了 于是进入稳定的转发状态 这时候 对于接收到的数据帧 总能在CAM表中查找到一个结果 于是数据帧的发送是点对点的 达到了理性的境界

交换机还为每个CAM表项提供了一个定时器 该定时器从一个初始值开始递减 每当使用了一次该表项 接收到了一个数据帧 查找CAM表后用该项转发

定时器被重新设置 如果长时间没有使用该CAM表的转发项 则定时器递减到零 于是该CAM表项被删除

第五章 VLAN基本概念

以太网交换机一般有十几个或几十个端口 默认情况下 连接到这些端口的计算机能够无阻隔的进行二层通信 但有些情况下 人们希望某些端口上的计算机不能被其他端口上的计算机访问 这时候采用这种默认的工作方式就不行了 我们需要引入这样一种功能 可以把交换机上任意数目的端口进行组合 这些组合的端口成为一个封闭的系统 连接到该封闭系统的计算机可以通信 但跟不在该端口集合内的其他端口上的计算机则无法进行二层通信 这个组合的概念便是VLAN 虚拟局域网

5.1 VLAN的划分方式

按照上面的概念 VLAN是交换机上的一个集合 该集合的元素就是端口 我们用一个整数来表示该集合 这样当在交换机上创建一个集合后就面临一个问题 怎样为该集合确定其中的元素

端口

下面是确定元 素的最重要的几种方式

5.1.1 基于端口的VLAN

最简单 也是最直接的方式就是手工指定 也就是说 一旦在交换机上创建一个VLAN 我们可以手工指定该VLAN包含哪些端口 在该方式下我们只要在交换机上进行一些简单的配置就可以了 这种方式是最直接的也是最容易理解的

5.1.2 基于MAC地址的VLAN

在基于端口的VLAN方式下 我们在交换机上进行了设置 来决定VLAN包含那些端口 但有些情况下 我们希望把终端系统进行分类 使它们属于指定的VLAN 这时候 我们可以手工建立终端系统的标识跟VLAN之间的关系 在以太网上 MAC地址可以唯一的标识一个终端系统于是 我们就建立MAC地址跟VLAN之间的对应关系

交换机仅仅根据这个MAC地址跟VLAN之间的对应关系 不能创建VLAN跟端口的对应关系 我们于是联想到交换机内部的另外一个关系MAC地址跟端口之间的关系 也就是CAM表 交换机根据该表格进行数据帧的转发

根据这样两个关系 交换机可以创建VLAN跟端口号之间的对应关系了 具体过程如下

— 交换机把手工创建的MAC地址跟VLAN号之间的对应关系下载到

本地

二 从该对应关系中读出一行 如果该行对应的VLAN不存在 则创建该VLAN 然后以MAC地址为索引依据 到CAM表中查找对应的端口号把找到的端口号加入刚刚创建的VLAN

三 若读出的该行所包含的 VLAN已经存在 则仅仅依据MAC地址查询CAM表 把找到的端口号加入已经存在的VLAN里面

四 重复这个过程 直到该对应关系扫描完毕

细心的读者可以看出 上面的过程存在一个问题 交换机的CAM表是通过学习获得的 如果交换机在根据MAC地址查找相应的CAM表时 该MAC地址不存在怎么办 这并不说明该MAC地址对应的计算机不存在 有可能交换机还没有学习到该计算机的MAC地址 这种情况下 我们可以采用下面的步骤

— 在交换机上做配置 告诉交换机哪些端口是基于MAC地址的VLAN的 也就是说 这些交换机端口上如果连接了一个终端 这个终端的MAC地址出现在手工创建的MAC地址跟VLAN对应关系表里 则该端口就加入相应的VLAN 其他没有配置的端口即使连接了满足条件的终端 也就是说 该终端的MAC地址出现在手工创建的那张表里

也不会被加入相应的VLAN 这样做 主要是效率上的考虑

二 交换机每学习到一个MAC地址 就用该MAC地址为索引到MAC地址跟VLAN对应关系里查找相应的VLAN号 找到相应的VLAN后 创建相应的VLAN 把学习到该MAC地址的端口加入刚刚创建的VLAN

这样的过程一直延续 最终的结果是创建了VLAN ID和MAC地址对应列表中出现的所有VLAN

5.1.3 基于第三层协议的VLAN

有些情况下 人们往往对网络做一些限制 让网络上的终端系统只运行一种网络协议 比如 在一个有大量NOVELL服务器的网络上 可能只存在IPX协议 这样做的目的主要是节省资源 因为如果运行其他的路由协议 一些服务进程会跟所有运行的协议绑定 这样该服务就会通过该协议对应的广播地址 比如 IP协议的广播地址是255.255.255.255

发送通告消息 以表明自己的存在 这样必然产生大量的广播包 严重浪费资源

在这些情况下 人们可以根据运行的协议不同来划分VLAN 在该种方式下 只要告诉交换机 上层协议跟VLAN之间的对应关系即可 比如 我们把所有运行IPX的计算机都划分到VLAN100里面 只要告诉交换机 通过命令行的方式

IPX和VLAN100的对应关系即可 完成这样的配置之后 交换机就进行下列工作

1

交换机检查每个端口上接收到的数据帧 判断该数据帧的类型字段 如果该类型字段是IPX 则马上把接收到该数据帧的端口加入VLAN100中

2

如果从端口上接收到的数据帧的协议类型字段不是IPX 则根据通常的步骤进行转发

这个过程延续下来 交换机就会把所有接收到IPX包的端口加入VLAN100里面

5.1.4 基于组播组的VLAN

在前面介绍交换机的时候 曾经介绍了交换机对组播数据帧的转发方式 交换机内部维护一个组播转发表 该表的内容是一个组播地址和一个接口列表 该表是根据一些二层组播协议建立的 比如IGMP 窥探CGMP GMRP等

我们很容易的想到 我们可以把某个组播地址对应的接口列表划分到一个VLAN里面 在该种模式下 我们需要做的就是在交换机上给出组播MAC 地址 和 VLAN 的 对 应关系 比如 我们 给出组播 MAC 地址01010E1E8E98对应VLAN100 于是交换机马上创建VLAN100 根据给出的组播地址查询组播CAM表 把找到的接口列表中的所有接口都划分到VLAN100里面

5.1.5 基于IP地址影射的VLAN

该种VLAN的含义很容易理解 只许需要在交换机上配置一个IP网段跟

VLAN的对应关系即可 完成如下配置后 交换机开始做如下工作

1

在每个端口上监听接收到的数据帧 判断该数据帧的协议类型 如果不是IP 则按正常的转发方式转发 否则转下一步处理

2

如果该数据帧是IP数据帧 则进一步检查该数据帧的源IP地址 看该IP地址是否落在配置的IP地址段范围内 如果是 则把刚接收到该数据帧的接口加入到指定的VLAN中

5.1.6 基于策略的VLAN

这是最复杂的一种VLAN划分方式 也是最灵活的划分方式 在该种方式下 可以定义一定的策略

所谓策略 就是一些限制条件

交换机对每个接口进行检查 凡是满足策略的接口都会添加到该组策略对应的VLAN中

这种VLAN的定义方式十分灵活 但效率不是很高 因为交换机需要检查每个接口 判断该接口是否满足配置的策略 对策略的匹配是一项很耗时的工作

上面介绍了各种VLAN的划分方式 但注意到一个特点 就是上面的介绍都集中在一个交换机的范围内 没有涉及到跨越交换机的VLAN 下面的部分中我们看一看跨越交换机的VLAN是怎样工作的

第六章 交换机间链路

在上面的介绍中 我们可以看出 所有创建的VLAN都是集中在一个交换机上的 但实际中往往有这样的情况 就是一个物理的VLAN 可能跨越了多个交换机 在一个交换机的情况下 一个VLAN端口接收到的数据可以根据交换机内部的一张VLAN和端口对应表来确定该VLAN所有的端口 因而一个VLAN的数据在同一个交换机上不可能被错误转发到另外一个VLAN当中 但是跨越交换机的时候就不是这样了 假设有两个VLAN和两个交换机 分别记做VLANA和VLANB SWITCHA和SWITCHB 其中

VLANA和VLANB分别跨越了两个交换机 即SWITCHA和SWITCHB上既有VLANA的端口 也有VLANB的端口 在这种情况下 假如SWITCHA上VLANA的一个端口接收到了一个广播数据帧 SWITCHA除了往自己上面所有属于VLANA 的端口广播该数据帧以外 还必须通过SWITCHA和SWITCHB之间的一条链路来传播该广播数据帧 如果SWITCHB接收到了该广播数据帧 SWITCHB就不知道把该数据帧发往哪个VLAN的端口 因为该广播数据帧中不包含任何VLAN有关信息

在这种情况下 我们可以在发给另外一个交换机的数据帧上附加VLAN信息来区分数据帧所属的VLAN 这便是我们下面介绍的802.1Q 简称1Q

帧格式

6.1 1Q帧格式

传统的以太网数据帧格式是不包含VLAN信息的 无法用这种传统的以太网数据帧来传送VLAN信息 我们要想让跨越交换机的VLAN能正常工作必须重新提出一种帧格式 该帧格式与传统以太网帧格式不同的是 包含了VLAN信息 这便是有名的802.1Q帧格式

下面是1Q帧格式的结构

可以看出 该帧格式跟传统以太网帧格式不同的是 在传统的以太网帧格式的类型/长度字段前面 附加了一个4字节的额外部分 称为1Q标记标记字段分为四部分

1

TYPE 这是一个两字节长度的字段 来指出该数据帧类型 目前来说都是0X8100 这样做的目的是跟传统的以太网数据帧兼容 当不能识别带VLAN标记帧的设备接收到该数据帧以后 检查类型字段 发现是一个陌生的值 于是简单丢弃即可

2

PRI 这是一个三比特的数据字段 该字段用来表示数据帧的优先级 一共三个比特可以表示8种优先级 利用该字段可以提供一定的服务质量要求 一般情况下 交换机的接口提供几个发送队列 这些队列有不同的发送优先级 在把一个数据帧从该接口发送出去的时候 检查该数据帧

的PRI字段 根据取值把该数据帧放入相应的队列中 对优先级高的帧 放到优先级高的队列中 这样可以得到优先传输服务

3

CFI 这是一个比特的字段 该字段用在一些环形结构的物理介质网络中 比如令牌环 FDDI等

4

VID 这就是1Q数据帧的核心部分 即VLAN ID 用来表示该数据帧所属的VLAN 该字段是一个12长度的字段 这样总共可以表示4096个VLAN 但VLAN 1用来做默认VLAN使用 没有划分到具体VLAN中的交换机端口 默认情况下都属于VLAN1

故实际中能使用的只有4095个 有些厂家的产品对可使用VLAN范围限制的可能更小 因为这些设备内部也使用一些VLAN来携带控制信息

当引入这种带VLAN标记的数据帧以后 交换机的端口就有了类别了有些端口能够且仅仅能够识别这种带VLAN标记的数据帧 我们把这种端口称为TAG端口 标记端口

有的端口不能识别这种带标记的数据帧 我们称为非TAG端口 还有一些端口 不仅能识别带标记的数据帧 而且能识别不带标记的数据帧 这样的端口我们称为混合端口 连接两个交换机的端口一般是TAG端口或混合端口

下面我们看一看数据包在不同类型端口之间的转发方式

6.2 数据帧在不同类型端口之间的转发

我们把交换机的端口划分为TAG端口 非TAG端口和混合端口 下面我们看一下交换机在不同端口类型中转发数据帧的时候 是怎样处理的

1

非TAG端口和非TAG端口之间 在这种方式下转发方式最简单 交换机只根据内部的CAM表找到数据帧的出口 把该数据帧复制到出口的缓冲队列中即可

2

非TAG端口和TAG端口之间 该方式下 交换机首先判断接收到数据帧的端口所属的VLAN号 然后根据该VLAN号和物理链路类型 以及数据帧的优先级等形成一个1Q 标记 把该标记插到接收到的数据帧的类型/长度字段前面 然后提交给TAG端口即可

3

TAG端口和TAG端口之间 该情况跟非TAGD端口和非TAG端口之间的转发类似 交换机只把数据帧无改变的向另外一个TAG端口转发即可

4

非TAG端口和混合端口之间 该情况跟非TAG端口和TAG端口之间的转发过程类似

6 混合端口和TAG端口之间 该情况最为复杂 分两种情况讨论 如果接收的数据帧本身是个标记帧 则仅仅把该标记帧向TAG端口复制即可如果接收到的数据帧不是标记帧 而是一般的以太网数据帧 这时候 需要给该数据帧打上一个VLAN标记再向TAG链路转发 交换机怎样确定这个VLAN标记呢 原来 混合端口有一个默认的VLAN 如果接收到的数据帧不包含TAG 则交换机根据该端口的默认VLAN形成一个标记 并插入到数据帧里面发送出去 所以 在配置混合端口的时候 一般情况下指定一个默认VLAN 如果不指定 系统可能会自己指定一个VLAN 一般是VLAN1

6.3 VLAN在交换机上的配置

有了上述VLAN的基础概念之后 我们看一下怎样在一个交换机上实施

VLAN 即配置VLAN

首先 也是最基本的一步 就是在交换机上创建VLAN 默认情况下 交换机上只存在一个VLAN 即VLAN1 所有端口都属于该VLAN 创建VLAN 的时候 需要给出该VLAN 对应的VLAN 号 根据1Q 帧格式VLAN号是有一定范围的 最大范围是2到4095 但有些厂家的特殊实现可能耗费掉了一些VLAN 故实际使用的VLAN可能还要少

其次 就是把交换机的端口加入VLAN 创建VLAN之后 该VLAN不包含任何成员 只有通过某种方式把端口加入VLAN当中 VLAN才包含了成员 这项工作可以通过许多种途径实现 比如 我们上面讲到的基于端口的静态VLAN 和基于MAC 地址的VLAN 等 我们以基于端口的静态VLAN为例 只需要把某个端口指定为所属的VLAN即可

如果VLAN跨越了交换机 必须配置交换机之间的连接 使之能传送特定VLAN的数据 默认情况下 交换机的端口都是非TAG的 我们可以改变这种默认类型

通过配置命令

一般情况下 我们把连接两个交换机的端口配置为TAG端口 而其他连接终端或HUB的端口配置为非TAG端口

完成这些配置后 交换机就可以按照需要的方式工作了 当然VLAN的配置并不局限于这些 这只是最基础的配置 还有一些高级配置比如VTP VLAN TRUNK PROTOCOL

协议 每VLAN生成树等 如果有需要了解 可以参考相应的书目

第七章 千兆以太网基本概念

7.1 8B10B编码

在传统的以太网传输技术中 数据的传输是以8位组的形式进行的 也就是说 在数据链路层把8位数据提交到物理层以后 物理层经过适当的变换后发送到链路上传输 但变换的结果还是8比特 在光纤千兆以太网上则不是这样 在数据链路层把8比特的数据提交给物理层的时候 物理层把这8比特的数据进行一个映射 变换成十比特发送出去 这个特点是光纤千兆以太网得以实现的基础

实际的发送数据只有8位时 总共有256种组合 而物理层实际发送的数据有10位 总共有1024种组合 于是 我们可以把这1024种组合分成三部分

一部分称为数据代码组 总共有256个 对应实际发送数据的256种组合

一部分称为特殊代码组 是剩余的组合中选择出的一部分 用来代表控制信号

剩余的部分临时没有使用 可以供将来使用

数据代码组和特殊代码组的选择遵循一定的规则 比如尽量做到0和1分布均匀等 这样可以优化结果

7.2 有序集

在上面的讨论中 我们知道了数据代码组和特殊代码组的含义 其中数据代码组是用来表示实际传输的数据 而特殊代码组则用来传递一些面向物理层的控制信息 比如 我们讨论的自动协商就是使用特殊代码组来封装进行的 实际上 在使用特殊代码组传递控制信息的时候 为了提高容错性往往把几个特殊代码组组合成一个整体来传送控制信息 这个整体便叫做有序集

对于有序集 需要注意的有两点

1

有序集是特殊代码组的组合 数据代码组的组合不是有序集

2

有序集是一个整体 它把一个或几个特殊代码组组合起来 表示唯一的意思

下面列举几个常用的有序集来加深对有序集的理解

IDLE有序集 需要注意的是 在光纤千兆以太网中没有数据传输的时候链路也不能空闲 而是传输一些不代表任何实际意义的比特位 这样可以保持两端时钟的同步 并使链路保持在激活状态 正是IDLE组成这些空闲位链路两端的设备在接受到IDLE有序集后 仅仅忽略 但如果一段时间内接收不到IDLE有序集 则认为链路故障

Start_Of_Packe有序集 象名字指示的那样 这个有序集表示一个实际数据包传送的开始 在对端设备接收到这个有序集以后 它就知道 跟在后边的将是一个实际的数据包 这个有序集起定界的作用

End_Of_Packet有序集 跟Start_Of_Packet有序集相反 它代表实际数据包的结束

Configuration有序集 这个有序集跟自动协商息息相关 自动协商的数据就是封装在这个有序集后边进行传输的 也就是说 每当物理层接收到这样一个有序集的时候 它就知道 紧跟在这个有序集后边的数据就是自动协商数据

7.3 数据的封装

有了上面介绍的有序集的概念之后 我们来看看数据包是怎样通过有序集来进行封装传输的

为了讨论的方便 我们不深入讨论数据链路层和物理层是怎样交互的我们仅仅假设数据链路层把要传输的数据 一个一个的8位组

提交给物理层 并给物理层一个传输数据的信号

物理层接收到传输数据的信号后 知道数据链路层要传输数据了 于是马上向链路上发送一个Start_Of_Packet有序集 此前在链路上一直在传送IDLE有序集 紧跟Start_Of_Packet有序集后 就是实际的链路层数据 不过跟链路层提交给物理层的数据不同的是 在物理层做了一个8B到10B的影射数据链路层要传输的数据结束以后 马上给物理层发送一个信号 告诉物理层自己 已经传 送完 这时 物 理 层 便 往物理 链路 上发送 一个End_Of_Packet有序集 结束数据的传送 此后物理层并不是一直空闲 而是不断的往链路上发送IDLE有序集

下面的图示表示了这个过程

图 1-1 数据的封装

上面介绍的是实际数据的封装 为了讨论的方便 我们再查看一下自动协商配置数据的封装方法 在自动协商允许的情况下 两端的系统把自己的配置寄存器内容读取出来

具体协商过程见以下的描述

封装到一个数据代码组

注意 这里是数据代码组 不是特殊代码组

里面 然后发送出去不过 在发送的时候 并不是马上就把这个配置数据发送出去的 而是先发送一个叫做Configuration的有序集 配置数据紧跟在这个有序集后面 这样做的目的是让对端能正确的区分配置数据和普通数据 具体的封装图示跟上面的大体相 同 不同 的是把 上面的 Start_Of_Packet 有序 集换 成 了Configuration有序集 配置数据后边没有表示结束的有序集 因为配置数据长度是固定的 对端很容易根据长度区分

到此为止 光纤千兆以太网的基本概念已经介绍完毕 下面来看一看自动协商协商哪些内容

第八章 千兆以太网自动协商内容

8.1 双工模式

光纤千兆以太网支持半双工和全双工两种工作模式 支持半双工的目的完全是为了后向兼容 不过 目前大多数设备都支持全双工一种模式 但为了兼容和适应将来的趋势

将来会出现半双工的千兆以太网

在自动协商过程中也支持双工模式的协商

8.2 流量控制

流量控制在千兆以太网中是一项重要的内容 首先列举一个实例来说明一下什么是流量控制 假设有一个千兆以太网交换机1000M LAN Switch 下面挂接了一个装有千兆以太网卡的企业级设备 比如装有各种应用组件的COM 服务器 这时候 有一面向客户的应用程序连接到COM 服务器上创建了一个COM实例并向这个COM组件提交了一个查询数据库的任务 这

个COM组件完成任务 可能这个COM组件又连接一个企业级数据库 向这个数据库索要数据 然后把取得的数据返回客户

后 便把大量的数据库记录发向客户 COM 服务器发送的数据必须经过LAN Swtich 假设这时候LAN Switch的缓冲区比较小 在把接收到的数据发送出去之前 缓冲区已经满了 这样COM 服务器后来发送的数据便丢失了

解决这个问题的办法就是流量控制 比如 上面的LAN Switch在感觉自己的缓冲区将要满 比如 占用了90%

的时候 通过给COM 服务器发送一个PAUSE信号 告诉COM 服务器暂停发送 等LAN Switch把接收到的数据成功传送给客户之后 在向COM 服务器发送一个继续发送的信号 这样一步一步便可完成任务

这个PAUSE信号实际上是一种链路层信息帧 对端设备接收到以后 根据链路层头信息中的类型字段可以判定这是个控制信息帧 然后根据数据部分包含的内容进行相应的操作 比如 数据部分里含有一个停止时间的数值假设为Pause_Time 这个数值告诉接收该信息帧的设备在暂停Pause_Time时间之后再继续发送 如果在Pause_Time时间还没有到来的时候LAN Switch已经把缓冲区清空 这时可以给对端设备发送一个Pause_Time为零的PAUSE信息帧 接收设备接收到以后 马上开始发送数据

流量控制有两种工作方式 对称和不对称 所谓对称 就是参与流量控制的两端设备都有权利向对端发送PAUSE信息帧 达到互相控制的目的 而不对称 就是有一方处于主控地位 另外一方处于从地位 只有主控地位有权利发送PAUSE信息帧 而从地位的一方仅仅听从主控制方的命令

在千兆以太网的自动协商中 对流量控制的协商主要停留在两个方面

1

协商要不要支持流量控制

2

协商主从地位

8.3 运行速率

第三个要协商的内容就是传输数据的速率 在目前的情况下只有一种即1000M 但目前10G以太网正在研制之中 将来10G成熟之后 就会出现1/10G都支持的设备 这种设备跟其他设备连接的时候 就要协商运行的速

率 如果连接的设备仅仅支持1G 那么就运行在1G状态 如果链路两端的设备都支持10G 则运行在10G速率之下

迄今为止 协商的内容已经讨论完了 接下来我们讨论协商的方式 即协商的具体过程

第九章 千兆以太网自动协商过程

9.1 功能编码

在进行自动协商的时候 发起设备必须把自己支持的能力进行编码 通常的做法是 该设备形成一个16位的基页 把自己的功能编码到这个基页里面 下面是具体的基页格式

图 3-1 基页格式

这个页面中各比特含义如下

rsvd 保留 可以供将来使用

FD 全双工指示 如果设置为1 则该设备支持全双工

HD 半双工 如果设置为1 则该设备使用半双工模式

PS1 PS2 流量控制指示 不同组合有不同的含义 如下

00

不支持流量控制

01

针对链路对方的不对称流量控制

10

对称流量控制

11

针对本地设备的不对称流量控制

RF1 RF2 远程错误位 指出远程设备的一些错误发送

Ack 确认 如果一台设备成功接收到了对端的基页 则发送自己的基页的时候 把该位设置为1

NP 下一页指示 如果把该位设置为1 则隐含说明该设备还要发送除基页外的其他页面 这些其他页面用来协商或配置其他功能

自动协商的设备把自己的功能按照上面的格式编码之后 就把这个基页发送出去 具体发送过程是这样的 物理层先向链路上发送一个Configuration有序集 然后把配置基页发送出去 对方接收到Configuration有序集以后 就知道后边紧跟着的是配置基页 对端设备接收到配置基页之后分析其中的信息 然后跟自己的配置基页比较 选择最优的配置组合 所谓最优组合 就是在这种组合下运行效率最高 比如 如果链路两端的设备都支持全双工和半双工 那么自动协商必定选择全双工模式 做出选择之后对端设备便把自己的配置基页发送出去 并把基页中Ack位设置成1 因为该设备已经接收到了配置基页

需要注意的是 配置基页可以发送多次 直到链路两端的设备都接收到了Ack为1的配置基页 协商结束之后 链路便进入激活状态 准备传送数据了

到此为止 关于自动协商的过程已经明确了 如果链路两端的设备都支持自动协商 按照这个过程去理解链路配置过程是有效的 出现了故障也可以根据这个过程来具体分析 排除 但目前有些设备不支持自动协商 当这些设备跟支持自动协商的设备对接的时候 便需要人工干预了 下面我们分析这样一个案例 来加深对自动协商的理解

第十章 千兆以太网案例分析

当前有些设备不支持千兆以太网的自动协商 严格来说 这是不符合标准的 但目前来说 千兆以太网基本出现在网络的骨干位置 不是面向广大终端用户 这个缺陷便显得不重要了 因为只要人为干预一下 完全可以达到自动协商的结果 考虑这样一种配置 有一台不支持自动协商的GSR 暂且称为GSRA

跟一台支持自动协商的GSR 称为GSRB

对接 这时候需要做如下配置

1 了解不支持自动协商的GSRA的默认工作模式 比如双工模式 是否支持流量控制等

2 在GSRB上禁止自动协商功能 然后手工配置工作模式 使之跟GSRA相同比如 如果GSRA支持全双工 不使用流量控制 在GSRB上可以配置如下 以CISCO的命令行界面为例描述

No negotiation auto Duplex full

No flowcontrol

这样配置的结果跟自动协商的结果是一样的 这时候 链路检测到载波之后 马上进入激活状态 准备传送数据

第十一章 二层组播基本概念

在前面以太网交换机的课程中 我们曾提到二层组播的概念 在本章中我们详细介绍一下二层组播的一些基础概念

至于为什么采用组播的形式发送数据而不采用广播的形式 其好处不言而喻 我们这里不赘述 需要说明一点的是 这里仅仅提到二层组播 还有三层组播 即所谓的IP组播 在以后的有关课程中会详细讲解 所谓二层组播 即数据报的转发是面向二层的 根据组播MAC地址来决定数据报的转

发方向 而三层组播 则根据三层组播地址 即组播IP地址来进行数据报的转发

11.1 组播MAC地址

在上面我们提到了组播MAC地址的概念 所谓组播MAC地址 是一类逻辑的MAC地址 该MAC地址代表一个组播组 所有属于该组的成员都接收以该组对应的组播MAC地址为目的地址的数据帧

注意的是 组播MAC地址是一个逻辑的MAC地址 也就是说 在网络上 没有一个设备的MAC地址是一个组播MAC地址 组播MAC地址跟单播MAC地址 物理MAC地址

的区别是 组播MAC地址六个字节中 最高字节 第六字节

的最低位为1 而单播MAC地址则为0 如下图所示

11.2 MAC层数据帧的接收

在网卡的内部保留一张接收地址列表

可以理解为一个可读写的随机存储器

其中至少有两个MAC地址 即网卡的物理MAC地址和全1的广播MAC地址 每当计算机想接收一个多播数据 也就是说要加入一个多播组那么上层软件会给网络层一个通知

至于网络层怎么处理 我们暂且不追究以后的课程中会详细讲述

网络层做完自己的处理后 也会发一个通知给数据链路层 于是 数据链路层根据网络层想加入的组播组的组地址

一般是一个组播的IP地址

根据一定的规则影射为一个组播的MAC地址 然后把该MAC地址加入接收地址列表

每当数据链路层接收到一个数据帧的时候 就提取该数据帧的帧头 找出目的MAC地址 跟接收地址列表中的地址项目比较 在比较完整个接收地址列表之前 如果遇到一个地址 跟该数据帧的目的MAC地址是相同的于是停止比较 接收该数据帧 并把该数据帧放到上层协议对应的接收队列

中 如果比较完整个接收列表也没有找到一个匹配的MAC地址 则丢弃该数据帧

现假设接收到的数据帧是发给自己的单播数据帧 于是该数据帧的目的MAC地址就是自己的硬件地址 数据链路层接收到该数据帧 跟接收列表中的地址比较 第一次比较就会通过 因为接收地址列表中的第一个MAC地址就是自己的硬件地址 所以在任何情况下 发给自己的数据帧一定能接收下来

假设接收到的数据帧是一个广播数据帧 则在比较的时候 最后一项是匹配的 因为接收地址列表中肯定包含一个广播的MAC地址 这样就保证了任何广播数据报都会被正确接收

假设上层软件想接收组播组G的数据 经过一番影射到数据链路层之后数据链路层会在自己的接收数据列表中添加一项组播组G对应的MAC地址 假设为MAC_G 当计算机接收到一个数据帧 该数据帧的目的地址为MAC_G的时候 该数据帧会被接收并传递到上层 因为接收列表中有一项MAC_G记录

11.3 组播转发表

在前面交换机的转发方式课程中讲述到 交换机在转发组播数据包的时候 也是根据一个转发表来进行的 但跟单播转发表不同的是 该组播转发表对应的出口不是一个元素 而是一组元素 即一个出口列表 在转发数据的时候 交换机根据组播数据帧的目的组播地址查找组播转发表 如果在组播转发表中查不到相应的转发项 则把该组播数据帧当做广播数据帧处理向所有端口上转发该数据帧 如果实现了VLAN 则仅仅向接收端口所属同一个VLAN的端口上转发

如果能查找到一个结果 则结果肯定是一个接口列表 于是 交换机把这个组播数据报复制成许多份 每份提交到一个出接口 从而完成数据的交换

需要注意的是 这个组播转发项不象单播那样 是通过学习的方式获得的

在处理单播数据的时候 交换机每转发一个数据帧 会进行相应的学习过程 学习到一个单播转发项

而是通过一些二层的组播协议获得的 这些流行的组播协议有IGMP窥探 CGMP GMRP等 下面部分详细解释每一种二层组播协议

第十二章 二层组播协议

上面我们提到 用于转发组播数据帧的组播转发项不是通过学习获得的而是通过一些其他的组播协议 比如IGMP窥探 CGMP GMRP等协议获得的 至于为什么不能通过学习获得 是因为学习过程是分析一个数据帧的源地址 但组播地址在任何情况下不可能出现在源地址的位置

因为组播MAC地址是一个逻辑的MAC地址 网络上没有一个终端的MAC地址是一个组播MAC地址

下面我们分析每重二层的组播协议 这些协议在构建组播网络的时候有不可替代的重要地位 尤其是将来的流媒体应用会很广泛 在这种情况下二层的组播将是必然的要求

12.1 IGMP协议

在讲述IGMP 窥探之前 先看一下IGMP 协议 理解了IGMP 协议

IGMP窥探就很容易了

一般情况下 组播数据是从路由器的上游流下来的 而组播的接收端一般位于路由器的下游 典型的情况是 路由器通过一个以太网口连接企业网另外通过一个串口连接INTERNET 组播数据源 比如流媒体服务器一般位于INTERNET上 组播数据流通过路由器到达企业网上的数据接收端 这种情况下 流媒体服务器是长时间工作的 也就是说 一天24小时 一周7天都在不停的发送媒体流信息 相当于电视频道 但企业网络中的数据接收端却不是这样 只有有限的时间接收端才接收数据 其他时间都是不接收数据的 这样 在企业网上没有数据接收端的时候 如果路由器也把大量的媒体流信息发到企业网内部 必然会浪费大量的资源 理想的情况是 如果企业网上没有数据接收端 则路由器就不转发媒体流 但如果只要有一个接收端路由器就必须把媒体流引入企业网 这样必须有一种机制来保证路由器对企网上的数据接收端有一个清楚的了解 什么时候网络上有数据接收端 什么时候没有数据接收端 这种机制就是IGMP协议

从上面的分析中 我们可以看出IGMP协议是数据接收端和路由器之间的交互协议 数据接收端使用该协议来通知路由器 自己是否想接收组播数据流 如果想接收的话 接收哪个组播组的数据流

一般情况下 存在两种类型的IGMP消息 IGMP V1

组成员报告和组成员查询 其中组成员报告消息由计算机发出 用来告诉路由器 自己想加入某个组播组 而组成员查询消息则由路由器发出 用来查询网络上是否

存在相应组的成员 一个指导性的原则是 只要网络上有组播组的数据接收端 不管该接收端的数量是多少 路由器必须把该组播组的数据转发到网络上

IGMP消息也是通过组播地址发出的 在IGMP加入消息中 该组播地址

IGMP消息的目的地址

就是该计算机想加入的组播组的组地址 比如计算机想加入224.0.0.2这个组播组 则该计算机发出的IGMP加入消息的目的IP地址就是224.0.0.2 这样当路由器接收到该组播消息后 就知道网络上有一个主机 该主机想接收到组播组224.0.0.2的数据 于是 每当从上游接收到目的地址是该组地址的数据的时候 就把该数据包向企业网上转发

还有一类消息就是组播组成员查询消息 在IGMP协议第一版中 没有规定主机的离开消息 即如果一个主机不想接收某一组播组的数据了 它也不会通过某种消息通知路由器 而是静悄悄的离开该组播组 这样如果路由器不采取某种措施来掌握网络上组播组接收端的数目情况 就会产生问题假设网络上所有的主机都不想接收组播数据了 根据IGMP协议第一版 这些主机不会通知路由器 而是不做任何处理 这样路由器不知道这些这些原来接收组播数据的主机现在已经不接收数据了 而且还以为网络上有一大批的接收端 于是仍源源不断的发送组播数据 这样必然浪费带宽 而引入了组成员查询消息后 路由器可以每隔一段时间发出该消息 用来查询网络上还有没有主机在接收组播数据 注意的是 该查询消息跟成员加入消息一样采用的目的IP 地址也是查询的组的组播IP 地址 假设路由器想查询245.2.2.1这样一个组播组是否还有成员 发出的查询消息的目的IP地址就是

245.2.2.1

当网络上接收该组播组数据的成员接收到这个查询消息后 就发出一个响应 该响应还是一个组播组成员加入消息 这样只要路由器接收到一个这样的响应 它就知道网络上必然还有终端在接收数据 于是不能停止转发 但路由器发出查询消息后 一段时间内没有接收到任何响应 它就判断网络上没有了数据接收端 于是停止转发组播数据

到此为止 IGMP协议的一些细节已经介绍完毕 接下来介绍IGMP窥探需要注意的是 IGMP协议是三层协议 而IGMP窥则是二层组播协议 但它利利用了IGMP的三层特性 注意 IGMP协议是运行在交换机上的一种协议它使用该协议来形成转发组播数据的组播转发表

下面是启动了IGMP窥探的交换机工作过程

1

交换机从每个端口上监听接收到的数据帧 如果是单播数据帧就按照通常的转发方式进行转发 是组播数据帧则进行下一步处理

2

如果接收到的数据帧是组播数据帧 则分析该组播数据帧的协议类型字段 看是否是IP协议 如果不是 则按照通常的方式转发 这时候可能查询组播转发表转发 如果没有查到结果 则向所有端口上转发

3

如果是IP协议数据 则进一步判断该数据是不是一个IGMP加入消息

IGMP查询消息 如果不是 则进行通常的组播数据发送 否则转下一步

4

如果是一个IGMP加入或查询消息 则该交换机就可以判断 在接收到该数据帧的端口上一定连接一个组播数据接收端 该接收端想接收IGMP加入消息中目的地址所在的组播组数据 于是 交换机就检查组播转发项 看对应的组播MAC地址有没有在组播转发项中出现 如果出现了则把接收到该数据帧的接口加入组播转发项对应的接口集合 如果没有出现说明该组播转发项还没有创建 于是创建一个组播转发项 该转发项的组播地址是IGMP消息的目的IP地址的影射MAC地址 接口列表初始化为接收到该数据帧的接口 接下来继续按照通常的过程转发该数据帧

到此为止 IGMP窥探的具体工作过程已经明了 可以看出 这种协议最大的一个缺点就是效率底下 交换机需要分析每个组播数据帧 看该数据帧是否是组播数据帧 如果是 继续看是否是IP数据帧 如果是 继续看是否是IGMP加入消息 这样一层一层的分析会大量的浪费资源 在一些低端交换机上 这个过程几乎是没法接受的

12.2 CGMP协议

CGMP Cisco Group Manage Protocol

CISCO 组播管理协议 是CISCO公司专有的二层组播协议 该协议只能运行在CISCO公司以太网交换机和路由器之间

该协议也是建立在IGMP协议的基础上 运行过程是这样的

1

当终端计算机想加入一个组播组的时候 该终端计算机就发出一个IGMP加入消息 该消息的目的地址是一个组播地址 也就是该计算机想加入的组播组的组地址

针对网络上的路由器发出

2

网络上CISCO路由器接收到该消息以后 它就知道网络上有一个终端想加入组播组 该组播组的组播地址可以通过IGMP加入消息的目的地址获得 在接收到该IGMP加入消息的时候 路由器可以从加入消息中提取出发出该消息的主机MAC地址

3

获得了这两项地址 组播地址和主机MAC地址

后 路由器就通过组播的形式 采用一个特殊的组播MAC地址 该组播MAC地址保留

把这两项内容发送到接收到该消息的以太网上 于是 连接到该以太网上的所有交换机都可以接收到这个消息

4

交换机分析该消息 知道一个主机 该主机的MAC地址出现在消息里面

想加入一个组播组

该组播组的组地址出现在接收到的消息里面

于是就创建一个组播转发项 该转发项的组播MAC地址就是接收到的组播组的MAC地址 然后交换机根据接收到的主机MAC地址查询CAM表 用来转发单播数据的表格

找到连接该主机的端口号 把该端口号加入刚才创建的组播转发项的出口列表中

5

如果交换机上已经创建了对应的组播转发项 则交换机仅仅根据主机MAC地址查找CAM表 把找到的接口加入已经存在的组播转发项的出口列表中

这样CGMP的运行过程就明了了 但实际上在配置这个协议的时候 还需要一些其他的注意事项 可以参考相关的书籍 尤其是CISCO公司的一些文档

但是 只要明白了上面提到的一些CGMP基本概念 理解其他注意事项的时候就简单多了

12.3 GMRP协议

分析上面提到的两种协议 有一个共同的特点就是都借助于其他的协议比如IGMP 这样当主机不支持IGMP协议的时候就没办法工作了 而且在CGMP协议中 还必须有一个路由器 要是没有路由器 交换机也不能自己工作 我们考虑能不能开发一种专门的针对组播的协议 该协议可以高效的完成其他组播协议完成的任务

这就是GMRP General Multicast Register Protocol 通用组播注册协议

协议 该协议需要计算机网卡和交换机一起工作

注意 这个协议不涉及到路由器的配合

因此需要计算机网卡的支持 由于该协议是一个较新的协议 故大多数网卡都没有支持 但作为一种标准的协议 将来的网络设备都会支持

该协议的运行过程很简单 想接收组播数据的计算机只要告诉连接的交换机 它想接收哪个组的组播数据即可 交换机接收到通知后 就创建相应的组播转发项 把接收到组播请求的端口加入组播转发项中 当计算机不再想接收组播数据了 只简单的告诉交换机就可以了 交换机接收到通知后就从组播转发项中把相应的端口删除掉

12.4 总结

到此为止 二层组播的一些基础概念就讲解完了 在这些内容中 组播MAC地址 组播和单播数据的接收过程以及三种组播协议是重点 这些内容也是学习后续内容

比如三层组播路由协议

的基础 在实际中 这些组播概念也是应用得最多的

第十三章 生成树协议

现在的大型网络设计一般都采用分层结构 即分为核心层 汇聚层和访问层三个层次 其中核心层使用核心的设备 比如高端以太网交换机承担汇聚层采用一些中低端的交换机担当 而接入层则一般采用低端交换机来负责 这样 汇聚层完成接入层业务的汇聚 然后送到骨干层上传输

为了保证冗余特性 汇聚层交换机或接入层交换机一般通过两条以上的链路跟上层连接 而骨干层各个设备之间也不是单一的链路 而是组成一个全网状结构或一个半网状结构 不论何种结构 核心层交换机之间的链路肯定多于一条 在这些冗余链路的环境中 就会产生很多问题 最典型的是广播风暴

13.1 广播风暴

考虑下面的网络结构

在该网络中 汇聚层交换机通过两条链路分别跟核心层的两个核心交换机连接 这样可以做到充分的冗余 比如 当其中一条链路出现问题 还有另外一条链路做备用 但如果转发广播数据报 会产生严重问题 假设PC机发出了一个广播数据帧 汇聚层交换机接收到以后 会通过两个上行的端口转发 核心层接收到这个广播数据帧之后 会互相转发 这样下来 必然造成广播数据帧在整个网络上来回震荡 造成网络的瘫痪 这就是所谓的广播风暴

在这种情况下 我们必须引入一种机制来避免这种危险 这种机制就是生成树协议

13.2 生成树协议基本概念

生成树协议的关键是其几个基本概念 理解了这些基本概念 其运行过程也就明了了 下面结合图形来具体说明几个概念

交换机优先级端口成本

端口优先级根交换机 根端口

指定交换机指定端口 交换机标识

生成树协议的运做结果是生成一棵无环树 既然是一棵无环树 必然存在一个树根 这个树根是由选举产生的 选举出来当做树根的交换机就是根交换机

选举出根交换机以后 其他交换机就以根交换机为依据来建立自己的转发拓扑 每个交换机的转发拓扑组合起来 就形成了一棵树

13.2.2交换机标识和交换机优先级

交换机标识用来唯一表示网络上的一台交换机 该标识是由两部分组成的 第一部分是2字节的优先级 该优先级说明了在选举根交换机的时候交换机的优先程度 接下来是六字节的MAC地址 该MAC地址就是交换机的MAC地址 这样的组合就保证了交换机的标识唯一性 即使优先级相同但每个交换机有唯一的MAC地址 这样就可以保证了交换机标识的唯一性

交换机标识是选举根交换机的唯一依据 在选举根交换机的时候 各个交换机比较其他交换机的标识 具有最低标识的交换机被选中

可以看出 在比较交换机的标识的时候 起决定作用的是2个字节的优先级 因为这两个字节位于标识的高位部分 当优先级相同的时候 交换机的MAC地址才起作用 所以 在实际中 只要更改交换机的优先级就可以轻松控制根交换机的选举

13.2.3端口成本和端口优先级

生成树协议的最终运行结果表现在交换机上 就是闭塞一些冗余的端口打开一些端口进行转发 当打开的端口坏掉了 则把闭塞的端口再打开 做到备用 这样就面临一个问题 怎样选择闭塞的端口

一个显著的想法就是 选择带宽最高的端口进行转发 其他带宽较低的统统闭塞 这样就端口成本便是这样一个选择依据 一般情况下 端口成本就是端口带宽的正比例反映 但这个端口成本是可以配置的 就是说 你可以手工指定端口的成本 而不管实际的带宽如何 这样完全是出于策略的考虑

但存在一种情况 就是两个端口有同样的带宽 这样的情况下 我们就需要用到另外一个参数 端口优先级了 该参数指定 当端口成本相同的时候 优先级高的端口优先闭塞 优先级最低的端口进行转发 这样就保证了转发端口的唯一性 默认情况下 所有端口的优先级是相同的 这样为了打破僵局 交换机会参考端口号

端口号在交换机上有唯一性

端口号最低的端口优先进行转发

13.2.4根端口

顾名思义 根端口就是通向根的端口 交换机运行生成树协议 最终形成一棵转发树 每个交换机都通过一个且仅仅一个端口连接到这棵树的根这个端口就是根端口

13.2.5指定交换机和指定端口

一个交换机选择出根端口以后 并不是把其他端口都堵塞 而且还必须选出一个指定端口 该端口的目的是转发下游数据

所谓下游 是针对根而言的

考虑上图中最下面的一个冲突域 该冲突域可能通过一个HUB连接了很多计算机 这个冲突域跟右边的一个交换机连接 这时候 如果右边的交换机选择出根端口之后 把其他所有端口都闭塞 则该冲突域就不能把自己的数据转发出去 因此 右边的交换机还必须把连接该冲突域的端口打开来转发该冲突域内的通信

可以看出 在上图中这个冲突域连接了两个交换机 通过什么样的规则选择其中的一个交换机端口作为指定端口呢 还是端口成本 两个交换机比较从对方到根的成本 选择成本小的作为指定端口 其他端口闭塞

到此为止 生成树协议的一些基本概念就介绍完了 下面看一下生成树协议的运行过程

13.3 生成树协议的运行过程

生成树协议运行过程分几个过程

1

选择根交换机 交换机启动的时候 向各个端口发送BPDU 桥接协议数据单元

该数据帧的目的MAC地址是一个保留的组播MAC地址 这样就保证了以太网上所有的交换机都可以接收到该数据帧 BPDU包含下列内容 发送交换机的标识 发送端口的成本 跟交换机的标识

初始化为自己

到跟交换机的成本等等 这样交换机接收到其他交换机发送的BPDU后 跟自己进行比较 看交换机标识是否比自己小 如果是 则选择它为根交换机 这样长时间的选择 最终网络中的交换机会达成共识 选择某个交换机为根交换机

该交换机的标识最低

2

选择根端口 交换机从接收到的BPDU中可以计算出自己哪个端口到根交换机最近

成本最低

成本最低的端口被选定为根端口 并转换到转发状态

3

选择指定端口和指定交换机 选择出根端口之后 交换机会向所有其他未阻塞端口

所谓阻塞 是由于物理链路没有起来或手工关闭

发送从根端口接收到的BPDU 不过发送的时候 把BPDU进行修改 把其中的发送交换机标适填写成自己的标识 到根交换机的成本改为端口成本加上根端口到根交换机的成本 比如 根端口到根交换机的成本为100 而某个端口的成本为20 则从该端口把BPDU发送出去后 相应的到根交换机的成本就转换为120 在发送的同时 也可能从其他交换机接收到BPDU 这时候就把自己刚才发送的 BPDU同接收到的BPDU比较 看哪个距离根比较近 成本低

如果自己的成本低 则该端口跳转到转发状态 也就是说 该端口成为相应冲突域的指定端口 而该交换机就是相应冲突域的指定交换机 而刚才发送BPDU的交换机因为发现自己到根的成本高 就会阻塞该端口

为了更好的理解指定端口和指定交换机的选择 考虑下面的网络图形

交换机A 交换机B

交换机A和交换机B选择出根端口后 就分别向冲突域A转发从根端口接收到的BPDU 该BPDU在转发的时候会进行修改 假设交换机A连接冲突域A的端口的成本是10 交换机B连接冲突域A的端口成本是20 交换机A从根端口到根的成本和交换机B从根端口到根的成本都是100 则交换机A在发送BPDU的时候 BPDU中到根的成本修改为110 100 10

交换机B在发送

BPDU的时候 BPDU中到根的成本修改为120 100 20

这样交换机A和交换机B分别接收到对方的BPDU 在交换机A接收到交换机B的BPDU的时候 把BPDU中的端口成本 120

提取出来 跟刚才自己发送的BPDU中的端口成 110

本比较 发现比自己刚才发送的成本要高于是交换机A就把连接冲突域A的端口转换到转发状态 成为该冲突域的指定交换机 相应的 交换机A成为该冲突域的指定交换机 但交换机B接收到交换机A的BPDU后 比较两个BPDU 自己发出去的和接收到的

到根交换机的成本 发现比自己的低 于是 交换机B就把连接到冲突域A的端口置为阻塞状态 这样就完成了指定端口和指定交换机的选择

上述几个步骤完成之后 各个交换机就停留在了一个稳定的转发状态进行通常的数据转发

需要注意的是 运行生成树协议的交换机的各个端口会经历几个状态刚开机的时候是阻塞状态 这种状态下只能接收和发送BPDU 这样做的目的是因为刚开始的时候没有形成一棵无环的转发树 可能存在环路问题 但BPDU是一个组播数据帧 不会发生广播风暴 相互发送BPDU 选择出根交换机 选择出根端口和指定交换机等 这样就形成了一棵无环的转发树但这时候为了避免其他交换机还没有完成生成树协议的计算 于是交换机的端口还需要经历一个学习的状态 在该状态下 端口可以接收数据包 并进行学习过程 形成CAM表

但不做转发 当学习过程结束后 交换机端口才真正转换到转发状态 这种状态下才能进行正常的数据转发

第十四章 其他相关技术

在前面的部分中 我们详细说明了以太网的一些内容 比如VLAN 以太网交换机 二层组播 生成树协议以及千兆以太网等技术 这些技术在以太网中具有举足轻重的地位 故我们详细介绍 节下来我们介绍一些其它相关技术 这些技术在企业以太网中应用不是很广泛 但对深刻理解以太网技术有很大的帮助 因为这些技术都是建立在前面介绍的以太网概念之上的

14.1 以太网的QoS保证

目前业务越来越多 不仅仅局限于数据业务 还有一些其他相关的业务比如IP电话 电视会议等 这些业务在传输的时候有一个很大的特点 就是实时性 传统的以太网数据在以太网交换机上转发都是先来先服务的 这种转发模式不适合这种实时的业务

为了解决这个问题 我们自然而然的想到了802.1Q帧结构中的PRI字段详细内容可以参考VLAN部分

该字段有三个比特 可以表达8种数据帧的优先级 这样 我们可以对不同的业务赋予不同的优先级 交换机在转发数据的时候 按照优先级来进行转发 先为高优先级数据帧服务 然后才

为低优先级数据帧服务

在实际中是这样实现的 在交换机的每个端口上设计若干个发送队列

队列的个数越多 提供的服务等级越多

每个队列有一个对应的优先级

在发送的时候先发送高优先级的队列 再发送低优先级的队列 来一个数据帧的时候 交换机会根据PRI字段来插入相应的队列 这是一种典型的区分服务模型

这样就面临一个问题 就是PRI字段可以表示8种优先级 而交换机的端口发送队列可能不到8个 怎样把这8个优先级影射到队列中 这样可以采用分段的方式 比如 有两个队列 这时候可以把0 3优先级影射到队列

1 而把4 7优先级影射到队列2 当有三个队列的时候 可以把0 2影射到队列1 3 4影射到队列2 而5 7影射到队列3

还有一个问题 就是终端设备一般是不能识别标记帧的 这样就不能自己给自己发送出去的帧打标记 因而不能PRI字段 这时候可以让交换机处理 通过配置命令 告诉交换机从每个端口接收到的数据帧应该赋予多少的优先级

14.2 DPT技术

下面介绍一下DPT 动态包转发

技术 该技术出现在CISCO路由器组成的核心网络上 之所以谈到这项技术 是因为该技术跟FDDI有相似之处而且还采用了MAC来标识每个节点 了解该项技术的同时 可以附带着了解一下其他的环形网络技术

DPT可以理解为一种物理层的规范 它采用物理介质以一种环形的结构把一些设备 主要是核心路由器 连接起来 如下图所示

这样组成一个环形网络结构之后 各个设备运行一种访问该物理网络的协议 SRP协议 空间重用协议

该协议类似以太网中的CSMA/CD协议 专门用来访问这种DPT环形网络 该协议有三个最重要的特点

1 目的地数据包删除 在FDDI或令牌环上 一个工作站发出的数据包在整个环形网络上游走 接收端接收到以后 仅仅把该数据拷贝到缓冲区里面数据包继续在环形网络上游走 直到源端接收到自己发送的数据帧之后 才把该数据帧从线路上删除 这样令牌才获得释放 其他工作站才有机会发送数据 这种方式极大的浪费了带宽 因为数据帧会在网络上游走一段不必要的距离 但SRP则采用了目的地数据帧删除的技术 也就是说 一个工作站在接收到发给自己的数据帧之后 会马上把该数据帧从网络上删除 这样就极大的节约了带宽 当然 广播和多播数据包是不能进行目的地删除的 这些数据帧要在网络上游走一周 进行源站删除

2

采用控制数据和业务数据路径分离的方式 在进行DPT环初始化的时候 各个设备会发出拓扑发现包 这个包的目的是发现网络上的所有设备每个接收到拓扑发现包的设备都把自己的MAC地址附加在这个包里面 然后发给自己的下游设备 这样一直下来 最终该拓扑发现包会回到原来发出该包的设备 该设备把这个包接收后并从网络上删除 然后分析该包内容就可以知道网络上有那些设备 以及设备的MAC地址 还有到设备的距离

目前仅仅以跳数来衡量

这些信息形成该设备的拓扑数据库 这样每当给一个设备发送数据帧的时候 发送设备检查拓扑数据库 找到一个距离目的设备距离最近的路径

或从内环上发送 或从外环上发送

从而把数据帧发送出去 当向刚才发送数据的设备发送控制数据帧

比如拓扑维护信息帧等

时 则选择相反的路径

如果刚才从内环上发送 则现在从外环上发送 反之 从内环上发送 发送出去 采用这种方式 可以做到负载平衡

3

采用FA 公平算法

来控制链路的访问 如果不采取控制 可能出现一个设备无限制的发送数据 而其他设备得不到资源而不能发送数据的情形 这样对一些延迟敏感的业务 比如语音等是不利的 为了避免这种情况的发生 SRP引入了FA算法 该算法能适当控制网络上的设备公平的访问网络 比如一个设备发送的数据太多 通过SRP协议 其他设备就可以通知该设备暂停发送 给其他设备发送数据的机会

上面介绍的是链路层协议SRP 该协议对网络层是透明的 在网络层看来 整个DPT网络就是一个共享介质的网络 好象以太网 如下所示

这样配置起来就相当简单了 在路由器上只要给一个SRP接口 该接口就是连接两对光纤的DPT接口

分配一个IP地址 这些IP地址跟其他设备位于同一个网络段即可

DPT最吸引人的一个特点其实是自动保护功能 可以看出 如果连接两个设备的一条光纤断了 这时候该光纤两端的设备就可以进行一个自环操作避开刚才的故障光纤 这样还可以保证网络的连通性 如下所示

到此为止 DPT技术的一些基本概念都已经涉及到了 主要有两个协议SRP和IPS 其中SRP是控制链路访问的 可以理解为数据链路层协议 它有如下特点 目的地数据帧删除 业务路径和控制路径的分离以及FA算法而IPS是一种智能保护协议 来控制网络上的设备从故障状态中恢复

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页