ZD至頂網服務器頻道 03月23日 新聞消息:在3月19日舉辦的China?Hadoop?Summit(中國Hadoop技術峰會)上,中國Hadoop大數據廠商紅象云騰與OpenPOWER基金會共同發布紅象云騰的新一代大數據產品,幫助企業高速處理PB規模數據。?
此次發布的兩款新產品中,“紅象數據高鐵-CRH4”的RedHadoop?Enterprise?CRH4?For?POWER版軟件,是全球第一個支持OpenPOWER服務器的Hadoop商業版本。同時發布的RedHadoop?Enterprise?CRH4?For?POWER?EC版軟件,?支持Hadoop?HDFS?Erasure?Code?CAPI?FPGA加速方案,也是全球第一個支持Erasure?code(可擦除碼)在FPGA/CAPI上實現的商業發行版Hadoop方案。?
用“高鐵”比喻Hadoop,源自二者動力原理的相似:高鐵的效率比傳統火車快,是因為每節車廂都有動力,而不僅僅是火車頭有動力。基于分布式技術的Hadoop的原理即把數據分塊,通過并行運算來提高數據檢索、查詢、分析等操作的效率,每臺機器都有自己的動力(計算力)與存儲,從而提供充沛的動力和功能模塊來提升客戶的大數據應用環境。
北京紅象云騰系統技術有限公司總經理童小軍演講
可以看出這兩款產品都是為OpenPOWER服務器定制的。從OpenPOWER生態的角度看,兩款大數據產品的發布也進一步完善了OpenPOWER的生態鏈。據北京紅象云騰系統技術有限公司總經理童小軍介紹,基于OpenPOWER服務器的開發的RedHadoop的性能大幅提高。標準的Hadoop測試表明:在OpenPOWER服務器上的Redhadoop測試值,是在x86服務器上測試值的三倍。同時,RedHadoop借助FPGA/CAPI來實現Erasure?Code加速算法,將原本社區版的三份副本的存儲量縮小到原來的一半,大大降低磁盤使用,節省一半磁盤成本,并通過紅象DataBank產品實現界面化操作數據,提高大數據工具使用效率。?
據悉,作為Hadoop社區經典難題,Erasure?Code?(可擦除碼)是由Xilinx、IBM中國研究院和紅象云騰、恒揚科技、中太、烽火科技等OpenPOWER成員及合作伙伴聯合研發的。?
“大家都在盼望Erasure?code,?這個功能在Hadoop?1.0年代存在,但是到了Hadoop?2.0年代就被取消了。這其實是非常好的功能,可以大大節省硬盤存儲。”中國Hadoop技術峰會主席何建軍評價說,“隨著我們去年開始倡導第二代分布式計算架構,今天的Erasure?code第一次真正意義上實現了分布式計算,把CPU不適用的算法挪到了FPGA/CAPI上,而FPGA/CAPI上來計算擦除碼是傳統軟件算法的300倍。我很高興,今天我們的Hadoop愛好者們可以享受到更好的技術。”
據悉,這一系列產品具備分布式存儲和計算功能,支持PB級海量數據存儲和批處理、流處理、內存計算、多維查詢、搜索引擎等,支持在其前往數據中進行分鐘級統計和秒級延遲檢索,在在線(Online)、近線(NearLine)、離線(OffLine)三大應用場景做場景優化,為用戶提供全場景的大數據平臺解決方案。與此配套的Redhadoop?Databank則成功提升大數據人機交互,通過可視化數據展現和多維度查詢,讓Hadoop使用更安全,更簡單,更快速。?
并且這些大數據產品已在聯想集團、NTT-DOCOMO、中國航天等企業順利上線,管理最大集群超過100臺,數據達到?4.8PB規模。其中,聯想集團通過紅象Hadoop和奧飛ETL,在三個月內完成完成了數據倉庫、實時計算、多維查詢等應用,出數效率提高到分鐘級別。?
背景知識
紅象云騰公司于2016年初加入OpenPOWER基金會,并提出?+Hadoop戰略——將HADOOP技術融入到各種應用場景中,打造“芯片、操作系統、云計算、算法(深度學習)、應用、行業”+Hadoop等多個細分戰略方向。?
原文發布時間為:2016-03-23
本文作者:于澤
本文來自云棲社區合作伙伴至頂網,了解相關信息可以關注至頂網。