轉眼又到春節,又到了親朋好友大團圓的時刻。對程序猿和攻城獅來說,能否安安穩穩的過年就主要取決于網絡是否安穩了,誰都不想在合家團圓吃年夜飯的時候因為網絡故障加班。不過,過去這一年各種網絡卻是故障不斷:
2016年9月,廣東電信光纜中斷導致A服務商BGP網絡鏈路異常,部分地區無法訪問;
2016年10月17日,北京電信骨干網故障導致A、U等多家服務商BGP網絡異常,部分地區無法訪問;
2017年1月,架空光纜撞斷,斷導致U服務商BGP網絡服務中斷...
BGP網絡故障給云計算客戶帶來了巨大損失,而大部分服務中斷,都被公有云服務商解釋為運營商網絡故障導致公有云停服。雖然運營商對網絡故障中斷負有直接責任,但是公有云的網絡服務能力只能做到這樣了嗎?
當然不是。
其實不僅是網絡故障,據統計,全國范圍內三大運營商每周會出現3~7次的核心網絡變更,每次網絡變更都可能對BGP網絡質量造成影響。傳統IDC服務商和云計算服務商通過同地域BGP出口做跨運營商的網絡流量調度,一定程度上解決服務中斷的問題,但一旦網絡故障、變更發生在業務高峰,還是會出現跨運營商互聯帶寬飽和導致的BGP網絡時延、丟包無法控制的問題。
騰訊云依托15年的BGP網絡運營經驗,精打細磨,在面臨國內交叉復雜的網絡環境中,修煉出一身基于SDN(軟件定義網絡,Software Defined Network)的跨地域網絡調度能力,保障了包括微信、QQ在內的億萬用戶良好的互聯網通信體驗,今天小編將為您一一揭秘這個隱藏在騰訊云穩定網絡背后的神奇武功!

所謂天下武學神功,修煉之前要求基本功扎實。基本功沒有練好,直接上神功經常會導致走火入魔,最終自取滅亡(比如,把光纖架在空中就是基本功不扎實的一種體現)。在修煉SDN網絡調度這門高級武功之前,我們已經用了10年時間,做好了以下幾項基本工作。
基本功1:Tb級BGP網絡出口,21路運營商聚合
所謂巧婦難為無米之炊,沒有BGP出口就不要做公有云。騰訊云在全國各個地域擁有Tb級的BGP網絡出口帶寬,聚合21路運營商接入資源,保障了用戶即使面對微信春節紅包這樣500Gbps入流量的洶涌攻勢,也可以從容應對,絕不抖動。
基本功2:Tb級骨干承載網,連接全球BGP網絡出口
沒有連接的BGP帶寬出口,好像戰場上被分割的孤島,一方有難就有難了,沒有相互支援。騰訊云Tb級骨干承載網,連通了騰訊云在國內的各大BGP網絡出口,各個地域互為POP點在單地域故障時可以實現流量切換。
基本功3:多維網絡監控模型,全局網絡監控告警
一方面,騰訊云具備面向全國的網絡撥測和自動化告警,從網絡層面感知網絡運營情況;另一方面,基于騰訊云具備獨家的騰訊產品自身網絡連接質量的統計信息,可以快速定向判斷全球網絡點對點的網絡質量,先于網絡層感知網絡異常,快速定位問題。
修煉好以上三門基本功,基本可以開始乾坤大挪移——基于SDN網絡調度的內功修煉了。
在啟用SDN網絡調度之前,騰訊云已經具備了基本的BGP流量調度能力,當某地域單運營商故障或變更時,可以通過人工配置的方式將路由切換至相鄰的BGP網絡出口。
以騰訊云上海為例,如果上海-福建的電信網絡鏈路變更,我們就可以提前進行網絡變更,停止上海的BGP接入路由器發放騰訊云路由。所有訪問上海的用戶流量會通過廣州或北京的BGP流量入口繞行至騰訊云骨干承載網,再回到上海公有云。
這樣雖然幫助客戶規避了運營商變更時,上海公有云覆蓋福建的網絡中斷,但同時也導致了浙江、江蘇等鄰近上海的用戶繞行至廣州或北京帶來了網絡時延增加。
為了解決這個問題,我們通過SDN網絡架構設計實現了按省份的精細化BGP路由調度管理:如果是上海到福建的BGP網絡中斷,那么我們就只把福建訪問上海的流量切換至北京和廣州,其他正常省份的流量依舊直接訪問上海,從而解決了上面時延增加的問題。

如上圖所示,我們采用全局的SDN網絡控制器連接全地域BGP接入路由器。網絡管理平面一方面接收全局的網絡監控告警,獲得全地域的網絡資源和告警信息;一方面通過SDN控制器,向全國范圍內的接入路由器下發按需的路由和選路控制。
系統可以預設網絡優化算法,為不同選項(包括ISP優選、本地優先、區域優先、AS PATH最短優先、網絡資源使用率、網絡時延優化等)賦予不同權重求和給出最優配置方案,推送人工進行審核,人工審核通過后即可自動化下發網絡調度命令,支持包含主機、網段、區域、AS號、運營商等多維度的調度策略。
SDN網絡控制器采用異地容災部署,通過公司骨干承載網互聯,支持HA(High availability)以及ISSU(In-Service Software Upgrade)。所有基于ODL控制器的BGP流量切換都是秒級操作,保證切換操作中用戶連接不中斷,實現精細化的按需的無感知的網絡運維。
目前現網運行的SDN網絡調度功能每月調度30次以上,平均每次調度時間2.5小時,幫助用戶每月規避網絡異常超70小時以上,大幅提升了騰訊云公網BGP質量。騰訊云將持續優化網絡架構和SDN網絡調度策略,為用戶提供穩定、可靠的、無感知的BPG網絡服務。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。