上一(yī)篇文章已經了解到如何學習MAC和根據MAC查表得到輸出結果。輸出結果有兩種可能,一(yī)種是确定的輸出端口号,指示分(fēn)組從确定的端口号輸出;另一(yī)種是查不到匹配表項,需要廣播(泛洪)輸出。交換機除了正常端口号輸出和廣播輸出外(wài),還有一(yī)種方式就是多播輸出。要求同一(yī)個分(fēn)組從指定的多個端口分(fēn)别輸出。
分(fēn)組輸出是單播還是多播是根據其MAC地址的标識來區分(fēn)的。
1)單播
單播的分(fēn)組如何識别,有什麽特征區分(fēn)呢?從MAC地址的設計上做了嚴格的區分(fēn)。MAC地址一(yī)共6個字節,其第1個字節的最低位bit值如果爲0,則表示其是一(yī)個單播MAC地址。單播地址是分(fēn)配給每一(yī)個單獨網卡使用的物(wù)理标識地址,所以一(yī)個單播地址是肯定對應到一(yī)台單獨的主機。單獨的主機肯定是連接在交換機的一(yī)個特定的端口上面,故單播地址分(fēn)組轉發,也就是一(yī)個單獨确定的端口号,其端口标記用一(yī)個數字表示即可。
2)多播
與單播相對,其标識定義也就是MAC地址的第1個字節的最低位bit是1,則表示一(yī)個多播地址。特别的,如果MAC地址的所有bit位都是1,則表示一(yī)個廣播地址。多播與單播的差異除了MAC地址的标識不同外(wài),另外(wài)最大(dà)的區别就是,一(yī)個多播地址代表的是一(yī)組主機,可以是包含1台或是多台主機。那多播地址的分(fēn)組轉發,如何确定給哪些主機發送,從哪些端口轉發呢?在MAC轉發表中(zhōng)是用多行記錄來表示,還是在端口那一(yī)列用多個端口号數字來表示呢?下(xià)面介紹一(yī)種新的端口表示方法。
廣播是一(yī)個多播的特例,是一(yī)個要求所有節點都必須加入的特殊組。多播在有些時候也叫組播,這其實是網絡層的叫法,與其相應的網絡層傳播方式還有任播。網絡層的組播有專門的組播協議實現方法,網絡層的組播IP地址與MAC層的MAC地址有着一(yī)一(yī)對應的關系,具體(tǐ)協議和轉換可網上搜索學習,轉換算法在後面文章代碼中(zhōng)會有提到。
多播既然是表示一(yī)組主機的集合,那這個集合如何學習而來,轉發的時候又(yòu)根據什麽樣的端口信息進行輸出呢?
1)多播學習
首先,通過組播協議學習,我(wǒ)(wǒ)們知(zhī)道,主機發布入組消息,其實并不是爲了通知(zhī)交換機,而是通知(zhī)網關。對交換機而言,如果想支持更好的組播轉發是需要監聽(tīng)Internet組管理(IGMP)協議的,也就是要處理二層以上的内容。如果隻想簡單粗暴的确證組播功能,則可以把所有的組播消息當作廣播來處理即可。隻是這種粗暴的方式會給網絡流量、管理和用戶體(tǐ)驗來說帶來諸多蔽端。
通常支持組播管理的交換機可以用兩種不同的方式來實現,第一(yī)種是帶一(yī)個輕量級的處理器,可以支持對二層以上更多協議進行處理,則交換機可以實現更多複雜(zá)的功能。另外(wài)一(yī)種是根據場景要求,讓硬件支持特定的管理協議。硬件對組播的支持不需要靈活性,比如隻支持IGMPV3協議,則可以直接根據該協議内容僅需關心的幾個字段直接提取數據便可完成協議處理,不像軟件那樣做逐層的解析和判斷。IGMP具體(tǐ)需要用到的字段有Record Type,用來指示是入組還是退組。Multicast Address用來表示IP組播的地址,根據該地址可以映射其對應的多播MAC地址。
多播通過上述簡單的字段提取後可以學習多播MAC的加入或退出,其最終結果是對應到一(yī)個多播MAC和其組端口号的映射關系上,如果某個端口上接收到了IGMP的入組信息,則将該協議中(zhōng)入組的組播IP轉換後的多播MAC與其輸入端口保存到MAC轉發表中(zhōng),說明,一(yī)旦有目的MAC地址爲多播MAC的數據收到,則需要轉發到該端口上。相反,如果收到IGMP的退組信息,則要将該多播MAC與其端口号信息删除。
2)多播轉發
多播MAC與端口信息可以通過上面的方法學習到或删除了,那如果在一(yī)個交換機上,一(yī)個多播MAC有多個端口都有主機加入,則該多播MAC有多個端口号與其組成轉發表,那我(wǒ)(wǒ)們應該如何來構建組播MAC的轉發表呢?
先試想一(yī)下(xià),如果将其像單播MAC映射表項一(yī)樣,在MAC轉發表中(zhōng)添加多行記錄,一(yī)個多播MAC有多少個端口入了組,就添加多少條記錄,是否可行。答案當然是可以,但進一(yī)步分(fēn)析查表過程,如果一(yī)個MAC有多條表項可以匹配,則每一(yī)次查表都要把全表遍曆,不然肯定無法得到一(yī)個多播MAC所有的端口号信息。這對查表性能來說肯定影響巨大(dà),其影響大(dà)小(xiǎo)跟表項大(dà)小(xiǎo)成正比。那我(wǒ)(wǒ)們考慮建立單獨的多播表是否可以呢?多播地址多了後該表條數也會變大(dà),查表性能也會存在問題。
既然從表項行的角度無法解決問題,那我(wǒ)(wǒ)們可以從列的角度來考慮,原來一(yī)個MAC地址對應一(yī)個端口,用一(yī)個列表示,那多個端口可以用多個列表示即可。用軟件的思路可能還會考慮到用鏈表來表示端口組信息,這些當然可以,但從資(zī)源和性能上考慮都還不夠,特别是卸載到硬件實現。
下(xià)面,我(wǒ)(wǒ)們講一(yī)種硬件的常用思維,用bitmap方式表示端口号。Bitmap顧名思義就是用每一(yī)個bit位表示一(yī)個對應的端口,從低位開(kāi)始,數字1(bit表示:01)表示0号端口;數字2(bit表示:10)表示1号端口;數字3(bit表示:11)表示0和1兩個端口。交換機端口一(yī)般不超過64個,那用64位數據類型即可全部表示所有端口信息。
1)多播學習
多播學習我(wǒ)(wǒ)們在軟件将采用協議逐層解析的方式獲取我(wǒ)(wǒ)們關心的數據。爲了軟件代碼實現簡單,多播學習的表項單獨存儲在一(yī)個多播MAC轉發表中(zhōng),某個端口的主機加入了一(yī)個組,我(wǒ)(wǒ)們則在多播MAC轉發表中(zhōng)添加該組的多播地址與對應端口的bitmap表示值。當有其他端口加入了相同的組,則在原有端口字段上更新其對應端口的bit位的值即可。
2)端口Bitmap表示
根據端口号的bitmap表示,上述多播MAC地址學習後隻需要一(yī)條表項表示即可,在查表過程中(zhōng),再也不用遍曆全表查找。那我(wǒ)(wǒ)們是否可以将多播表和單播表放(fàng)一(yī)塊呢?軟件是可以的,硬件是不會的。對硬件來說,其資(zī)源無比珍貴,每1bit都是錢。單播的端口号隻能是一(yī)個确定值,對最大(dà)64個端口來說,其最多隻用6bit即可表示,其他bit都是多餘,故在硬件交換邏輯中(zhōng),單播表與多播表是分(fēn)開(kāi)的,其端口号的表示大(dà)小(xiǎo)也根據其硬件端口數量來确定bit位的寬度。單播不采用bitmap方式表示,除了存儲資(zī)源浪費(fèi)還有一(yī)個主要原因就是邏輯與計算資(zī)源的浪費(fèi)。采用bitmap必須逐bit是比較是否爲1,是1則該端口輸出,輸出最壞情況是遍曆所有bit位。單播本來就是一(yī)個确定端口輸出,使用bitmap的方式隻是造成處理邏輯的複雜(zá)化與計算時間的空耗,故單播輸出端口使用常規方式表示。
下(xià)一(yī)篇文章具體(tǐ)講一(yī)下(xià)多播表定義、實現與相關代碼修改。
歡迎您和學生(shēng)們加入FAST開(kāi)源項目群溝通與探讨,一(yī)起體(tǐ)驗不一(yī)樣的系統設計過程。請先加微信号15116127200後邀請入群。
關注FAST開(kāi)源社區
FAST一(yī)一(yī)開(kāi)源、開(kāi)放(fàng)、高速、高效、可編程、可定義!軟硬件協同并行處理。