分享

乘著開源雲的翅膀 從“鐵信雲”看中國鐵路總公司轉型之路
2017-07-26 10:56:38  |  來源:東方網  |  編輯:劉徵宇

  現在,只要是在國內的中短途旅行,筆者首選高鐵。其實,在全球範圍內,高鐵已經成了中國製造的一塊金字招牌。筆者選擇高鐵的一個主要原因是準時。這樣一個龐大的運輸體系,它究竟是如何運作,又是如何保證準時、快速、安全的呢?在探訪了中國鐵路信息技術中心後,筆者的疑惑終於解開了。

  乘著開源雲的翅膀 從“鐵信雲”看中國鐵路總公司轉型之路

  開源雲是必由之路

  交通運輸部發佈的《2016年交通運輸行業發展統計公報》數據顯示:2016年,中國鐵路營業里程達12.4萬公里,其中高速鐵路2.2萬公里以上,年內累計實現旅客發送量28.14億人次,較2015年增長2.79億人次,完成貨運總發送量26.52億噸。如此龐大且日益增長的客流和物流,肯定需要一套堅實的信息系統作為支撐。

  從2014年開始,中國鐵路總公司開啟了由傳統客貨運輸企業向現代物流企業的轉型,其目標是建設世界一流的現代物流企業。業務的轉型帶動了信息化的發展和躍升,建設高效靈活、部署簡便、自主可控的IT基礎設施架構是必由之路。一方面,IT基礎架構要保證現有業務的正常運轉,包括向客戶提供便捷的信息查詢、線上購票和預訂等網絡服務;另一方面,IT基礎架構還要成為中國鐵路總公司內部管理創新、業務創新和應用創新的基石,支撐企業管理從粗放式向精細化轉變、從過去生産計劃型向主動適應市場需求轉變,同時借助雲計算、大數據、物聯網、移動互聯網等新技術對鐵路的傳統業務進行改造和升級。

  但是問題來了,中國鐵路總公司傳統的“煙囪式”的IT基礎設施構建模式根本不能滿足快速增長的IT資源需求,昂貴的設備成本、複雜的異構運維、隔離的信息孤島、大量的資源消耗成為中國鐵路總公司轉型的瓶頸。

  從現在的結果看,“鐵信雲”成了中國鐵路總公司的不二選擇。IT系統從封閉走向開放,從以物理設備為主到虛擬化和雲,中國鐵路總公司變革的決心和心路歷程值得深入探究,也許能為其他有意“上雲”的企業提供有益的參考和借鑒。

  自己掌握主動權

  中國鐵路信息技術中心技術支持部部長高明星在這個單位一幹就是20多年,前10年主要與IBM主機打交道,後10年則與小型機為伴,對於系統平臺、數據庫、中間件等瞭如指掌。從2010年開始,隨著應用逐漸向x86平臺遷移,開放平臺、雲計算成了高明星工作的重心。“我們之所以構建基於OpenStack的開源雲平臺,一是企業自身的需求,二是順應當前IT發展的趨勢,這兩者正好走到了一個交匯點,水到渠成。”高明星表示。

  主機的優勢是穩定、可靠,但是高昂的設備和維護成本成了中國鐵路總公司不能承受之重。日積月累,中國鐵路總公司目前的IT環境是一個混合式的環境,設備眾多、管理複雜,如果不變革原有的管理方式,成本將無法控制。其實,在接觸OpenStack之前,中國鐵路總公司已經在開放、開源方面進行了一些有益的嘗試,比如採用x86標準化平臺、Linux作業系統等。2007年雲計算的興起、2010年OpenStack項目的誕生,中國鐵路總公司一直在關注雲計算和開源的發展。在決定從原來的傳統架構向雲計算架構轉型時,中國鐵路總公司經過了慎重思考。

  “2014年,我們開始承接鐵信雲項目。一開始,我們計劃從第三方採購成熟的雲計算産品,然後在此基礎上進行二次開發或集成。”北京中鐵信科技有限公司(以下簡稱北京中鐵信)技術總監李廣謙介紹説,“我們的雲計算之路走得小心翼翼,幾乎與當時能夠提供OpenStack雲解決方案的廠商都進行了接觸和交流。但是我們發現,很多公司過於追求技術的前沿性與創新性,而忽略了企業需要的是具有絕對穩定性且易用的産品,最好點一下滑鼠就能解決所有問題。這顯然是一對矛盾。另外,沒有一個廠商的産品能夠滿足我們的所有需求,二次開發的工作量非常大。”

  考慮到自身專業技術人員缺乏,以及在OpenStack技術方面底子薄等客觀因素,最終,北京中鐵信決定採用聯合開發的模式,借助雲計算公司的技術專長,同時結合自身熟悉鐵路系統的優勢,秉承“完全自主研發,雙方共享研發成果和知識産權”的原則,與北京雲途騰科技有限責任公司(以下簡稱雲途騰)簽訂了戰略合作協議。目前,雙方聯合研發的産品的最新版本為2.2.2版本,並在實踐中證明是行之有效的。

  “過去,由於對新型互聯網應用和雲計算等技術的掌控力度不夠、技術能力儲備不足,我們必須採用與向別人學習、合作的模式,該交的學費還得交。但是,我們不會一直沿著別人的路子走,最終我們還是要靠自己想辦法解決問題。”高明星表示。

  開源雲可以滿足生産系統所需

  “為了支持鐵信雲的建設,我們與北京中鐵信開創性地進行了聯合研發。這種模式本身就是一個創新。“雲途騰COO吳凱歸納了以下三點。

  第一,中國鐵路總公司對生産系統的穩定性、可靠性要求非常高。很多人擔心,用開放架構支撐生産型系統,穩定性和可靠性是一個問題。鐵信雲這個項目正是將開源雲用於生産系統。因此,雲途騰與北京中鐵信花費了大量時間,攻克了許多技術難關,並且經過大量測試和驗證,大大提升了OpenStack開源系統的穩定、可靠性。

  第二,中國鐵路總公司對生産系統的性能和可擴展性要求也非常高。鐵路信息系統的整體規模比較大,僅鐵信雲項目一期上線的物理伺服器就有近800百台之多,而這與今後的信息化建設規劃要使用的伺服器數量相比,只是其中的一小部分。在這樣的規模之下,OpenStack開源架構要突破許多技術和應用方面的瓶頸。“我們實現了在近800台伺服器之上,建立了超10萬個虛擬機的全部在線穩定運行,這種規模在國內是絕無僅有的。”吳凱介紹説,“我們花了幾個月的時間進行系統壓力測試,順利通過。此外,在系統上線時,在各種基礎環境都準備到位的情況下,只用了7個小時就完成了近800個節點的鐵信雲産品部署。我們還在今年5月舉行的OpenStack波士頓峰會上將此項目的建設經驗進行了分享。”

  第三,中國鐵路總公司的系統中包含很多既有和傳統系統,開源雲平臺如何與這些既有和傳統平臺進行資源對接和統一納管理也是一個棘手的問題。雲途騰與北京中鐵信在這個方面也進行了深入探討和研究,找到了解決辦法,實現了對所有IT資源的高效管理和有效利用。

  “鐵信雲未來的部署不僅僅局限于中國鐵路總公司這一級,而是有全國性的規劃。”李廣謙介紹説,“我們解決了OpenStack交付、部署和運維中的很多Bug,讓OpenStack向自動化、簡約化的方向發展。”對於OpenStack的後期運維,鐵信雲也規劃部署了OMS系統,雲途騰貢獻了MagicStack模組以實現自動化聯動。北京中鐵信還將大數據的底層架構引入OMS系統,通過監控、日誌分析,結合大數據進行預測分析與告警。

  鐵信雲已用於中國鐵路信息技術中心的2015年公共信息處理平臺擴容項目中,按照工程設計規劃,擬在鐵信雲IaaS平臺上將部署包括鐵路客運、貨運、調度、機務和公共基礎平臺五大類共十幾個應用。目前,應用遷移和部署正在有序進行中。

  開源雲需要相互支撐

  作為OpenStack技術的推動者,英特爾為鐵信雲項目提供了底層硬體平臺和軟體優化方面的技術指導和支持。

  李廣謙介紹説:“鐵信雲構建在開源OpenStack雲計算架構上,OpenStack底層使用的是KVM虛擬化技術,而KVM對CPU的指令集有一些特殊要求。英特爾在這方面給了我們很多支持。另外,在提升網卡的性能、功能增強等方面,英特爾也做了大量卓有成效的改進,並在存儲、軟體等方面給了我們很多指導和幫助。”

  “鐵信雲是一個龐大的項目,接下來還有很多工作要陸續完成。我們正在考慮引進一些新技術的可能性,比如NFV(網絡功能虛擬化),英特爾在這方面可以為我們提供幫助。”高明星補充介紹説,“我們規劃在天津武清建設面積達幾萬平方米的新數據中心。我們沒有建設如此大規模數據中心的經驗,也準備進一步尋求英特爾的支持和幫助。”

  “我們與英特爾合作已有四五年時間,看到英特爾對整個開源社區的支持力度非常大。”吳凱肯定了英特爾在開源社區和鐵信雲項目中做出的重要貢獻,“舉例來説,在鐵信雲平臺的運維中,IPMI(智慧平臺管理介面)是一種非常重要的監控手段。三年多前,我們與英特爾就在研究如何更好地利用IPMI,為雲平臺的管理提供先進的功能,提升運維的效率。我們正在研究像NFV/SDN這樣的先進技術如何與企業的生産實踐相結合。我們與英特爾、中國鐵路總公司在新技術的推廣和應用方面有很多相同的思路,可以進行更深入的合作。”

  英特爾中國雲計算戰略總監陳緒博士介紹説,從去年開始,我們看到越來越多“國字頭”的企業開始接受並積極部署開源雲,包括中國外運股份有限公司、中國鐵路總公司等,雖然出發點不同,應用的規模各異,但是有一點是相同的,就是順應開放、開源的技術發展趨勢,利用雲計算、數據分析等先進的技術手段,建立新型的靈活、高效的IT基礎架構,為企業的業務發展和應用創新提供支撐。