大數據面臨的挑戰:當大數據遭遇云計算

本文講的是大數據面臨的挑戰:當大數據遭遇云計算,大數據正在徹底改變IT世界。那么,什么樣的數據談得上數據呢?

  根據IDC的報告,未來十年全球大數據將增加50倍。僅在2011年,我們就將看到1.8ZB(也就是1.8萬億GB)的大數據創建產生。這相當于每位美國人每分鐘寫3條Tweet,而且還是不停地寫2.6976萬年。在未來十年,管理數據倉庫的服務器的數量將增加10倍以便迎合50倍的大數據增長。

  毫無疑問,大數據將挑戰企業的存儲架構及數據中心基礎設施等,也會引發云計算、數據倉庫、數據挖掘、商業智能等應用的連鎖反應。2011年企業會將更多的多TB(1TB=1000GB)數據集用于商務智能和商務分析;到2020年,全球數據使用量預計暴增44倍,達到35.2ZB(1ZB=10億TB)。

  大數據面臨的挑戰——RISC已無法滿足未來的企業架構需求

  對于海量的數據信息,如何對這些數據進行復雜的應用成了現今數據倉庫、商業智能和數據分析技術的研究熱點。數據挖掘就是從大量的數據中發現隱含的規律性的內容,解決數據的應用質量問題。充分利用有用的數據,廢棄虛偽無用的數據,是數據挖掘技術的最重要的應用。傳統的數據庫中的數據結構性很強,即其中的數據為完全結構化的數據,而目前數據最大特點就是半結構化,因此此類數據挖掘比面向單個數據倉庫的數據挖掘要復雜得多。

  談到傳統數據倉庫的時候,大家不免就會買存儲設備,選服務器,不管是IBM Power或者是Oracle架構的,這些其實都是在傳統時代非常有名的數據庫品牌,把它構建在一起,構成數據倉庫,微軟、COCNOS等都提供解決方案。

  但從目前來看,現有的數據倉庫已經遠遠不能滿足未來的企業大數據架構。

  對企業業務來說,不光要有高擴展性,而且是動態的需求,能夠讓設備自由擴充,不用去管數據倉庫、應用具體運行在這些機器的哪一臺上,這些計算能力的耗費完全是根據業務的伸縮而來的。

  傳統的架構做這類的項目十年到二十年的時間,它們有一個特點,數據倉庫的訪問和傳統的不同,所謂的不同就是查詢特別大,查詢的語句特別長、特別復雜,不像去銀行的存提款只是在眾多的記錄中查詢一兩條,它符合大數據查詢的特征,傳統的查詢索引作用非常有限。在數據庫中涉及多張表的連接,同時還有匯總、算標準差等復雜的運算。但是相反它的并發請求不是很多,一個企業就是人再多,不會同時超過一千個業務分析員在分析數據。

  因此,在數據倉庫誕生的第一天,系統一直就有一個瓶頸,要把大查詢分解成小任務,這些小任務由并行的服務器來完成,我們強調小的機器要多,而不要大的機器CPU數少。因此,數據倉庫天生就是MPP、開放架構的CPU加上并行擴展橫向擴展數量,從這方面來看,擴展性較差,并行處理能力有限的RISC架構已經不能代表未來的企業架構。

  而以英特爾為代表的X86處理器天生就是為大數據應用而生,Oracle推出的Exadata數據倉庫服務器采用了英特爾至強(Nehalem)處理器、DDR3內存和40Gbps InfiniBand,Exadata數據庫機第二版的CPU、內存和網絡速度分別提高了80%、200%、100%,單個數據庫服務器內存容量則達到了72GB,原始磁盤容量和每機架磁盤容量達到100TB、336TB,Sun FlashFire內存卡則實現了高性能的OLTP。

  當大數據遭遇云計算

  云計算為什么能盛行呢?在互聯網領域應用系統的構建:客戶群體是不確定的、系統規模不確定、系統投資不固定、業務應用有很清晰的并行分割特征、數據倉庫系統的構建、數據倉庫規模可估算、數據倉庫的系統投資與業務分析的價值和回報相關、商業智能應用屬于整體應用、Saas模式構建數據倉庫系統。

  在大數據技術上用云計算構建下一代數據倉庫成為熱門話題,這當中包括大數據管理,分布式進行文件系統,如Hadoop、Mapreduce數據分割與訪問執行;同時SQL支持,以Hive HADOOP為代表的SQL界面支持。從系統需求來看,大數據的架構對系統提出了新的挑戰:

  1、集成度更高:這意味著一個標準機箱最大限度完成特定任務,華碩不久推出的一款高密度機架式服務器RS720,2U高度最大能采用支持4個雙路計算節點,實現單機8個英特爾5600系列處理器和高達總計768G內存資源。

  2、配置更合理、速度更快:存儲、控制器、I/O通道、內存、CPU、網絡均衡設計,針對數據倉庫訪問最優設計,比傳統類似平臺高出一個數量級以上,這方面的經典案例是數據倉庫頭號廠商Teradata,其采用雙路Xeon六核處理器的企業級數據倉庫5650可輕松為數千名用戶處理更復雜、更大量的工作負載、持續負載以及批負載、操作性查詢、簡單報表和復雜的分析,所有功能均在同一個平臺上運行。與上一代產品相比,動態企業級數據倉庫5650的性能提高了43%,占地面積保持不變,減少了能源消耗和空間需求。

  3、整體能耗更低:同等計算任務,能耗最低。

  4、系統更加穩定可靠:能夠消除各種單點故障環節,統一一個部件、器件的品質和標準。

  5、管理維護費用低:數據藏的常規管理全部集成。

  6、可規劃和預見的系統擴容、升級路線圖。

  云計算環境作為大數據處理平臺

  1.云計算環境中基本計算單元的分化

  企業云計算平臺上雖然有多個并行計算的CPU,但并沒有創造出具有超強數據處理能力的超級CPU,因此云計算平臺需要的是有并行運算能力的軟件系統。同時,當所有用戶的數據全部放在云端時,雖然存儲容量可以很方便地擴充,但面對大量用戶同時發起的海量數據處理請求,簡單的數據處理邏輯已經無法滿足需要。

  可以看到,國內有相當多的電商企業,用小型機和Oracle扛了好幾年,并請了全國最牛的Oracle的專家不停優化他的Oracle和小型機,初期發展可能很快,但是后來由于數據量激增,業務開始受到嚴重影響,最典型的例子無疑是京東商城前段時間發生的大規模訪問請求宕機事件,因此他們開始逐漸放棄了Oracle或者MS-SQL,并逐漸轉向MySQL X86的分布式架構。

  目前的基本計算單元常常是普通的X86服務器,它們組成了一個大的云,而未來的云計算單元里有可能有存儲單元、計算單元、協調單元,總體的效率會更高。

  2、對系統穩定性的需求

  在應對大規模訪問的時候有一些系統穩定性的追求,來自很多方面,來自網絡穩定性、數據庫穩定性。對系統而言,需要把握一個大原則,需要消除任何單點故障。不光是網絡上單點故障,還有來自你呼叫中心里的單點故障,只要有單點故障一定要消除掉。因為對于電商行業而言,每一秒都是錢,電子商務業務如果宕機一個小時,損失多少是可以算出來的,電商行業需要非常全面的技術系統監控報警系統。有時候你會發現你如果通過技術系統的監控去推導出你的技術發生問題已經晚了。


作者:王玉圓

來源: IT168

原文標題:大數據面臨的挑戰:當大數據遭遇云計算

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/257569.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/257569.shtml
英文地址,請注明出處:http://en.pswp.cn/news/257569.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Climbing Stairs - Print Path

stair climbing&#xff0c; print out all of possible solutions of the methods to climb a stars, you are allowed climb one or two steps for each time; what is time/space complexity? &#xff08;use recursion&#xff09; 這道題難是難在這個ArrayList<Strin…

java 單例設計_Java 之單例設計模式

設計模式: 對問題行之有效的解決方式, 其實它是一種思想.單例設計模式解決的問題:就是可以保證一個類在內存中的對象唯一性. 即單個實例.比如對于A 和 B 兩個程序使用同一個配置信息對象時, A 對配置信息作出修改, B 也與之對應的更新配置信息, 即需要保證該對象的唯一性.如何保…

Javascript之RegExp

RegExp對象的構造器 new RegExp(pattern[, flags]) pattern 正則表達式文本flags 該參數可以是下面幾個值的任意組合&#xff1a;g 全局匹配i 忽略大小寫m 讓開始和結束字符&#xff08;^ 和 $&#xff09;工作在多行模式&#xff08;也就是&#xff0c;^ 和 $ 可以匹配字符串中…

DS汽車通過采用沉浸式虛擬現實技術實現展廳轉型

PSA集團&#xff08;PSA Group&#xff09;旗下的高端品牌DS汽車公司&#xff08;DS Automobiles&#xff09;采用達索系統的“虛擬車庫&#xff08;Virtual Garage&#xff09;”行業解決方案為全新的SUV車型DS 7 CROSSBACK提供全面支持&#xff0c;推動其展廳轉型&#xff0c…

java 日歷記事本_calendar 一個用java編寫的日歷記事本. 具有正常日歷功能;也可以用于在不同日期記錄下當日重要的事情 - 下載 - 搜珍網...

日歷記事本/日歷記事本/build/classes/日歷記事本/CalendarPad$1.class日歷記事本/日歷記事本/build/classes/日歷記事本/CalendarPad.class日歷記事本/日歷記事本/build/classes/日歷記事本/Month.class日歷記事本/日歷記事本/build/classes/日歷記事本/NotePad.class日歷記事…

要的需求 ip提取網站源碼帶采集 要求是PHP源碼

求。ip提取網站源碼帶采集 要求是PHP源碼。必須帶采集類似 小峰IP提取網站&#xff0c;安小莫IP提取&#xff0c;迷惘IP提取&#xff0c;冰封IP提取免費類型的 不要淘寶類型的 200 轉載于:https://www.cnblogs.com/PS-apple/p/4342866.html

設計模式之PHP項目應用——單例模式設計Memcache和Redis操作類

1 單例模式簡單介紹 單例模式是一種經常使用的軟件設計模式。在它的核心結構中僅僅包括一個被稱為單例類的特殊類。通過單例模式能夠保證系統中一個類僅僅有一個實例并且該實例易于外界訪問。從而方便對實例個數的控制并節約系統資源。假設希望在系統中某個類的對象僅僅能存…

java 跳轉action_JS 跳轉到指定Action | 學步園

最近項目需要在JS中跳轉到指定的Action。通過不斷的實驗和查資料&#xff0c;終于成功。Java SSH2 架構下&#xff0c;正常 配置Action完畢。在xxx.jsp下window.location" ";例如&#xff1a;window.location" /user/ResAction> ";其中ResAction是配置文…

【轉】康拓展開

———本文轉自&#xff1a;http://www.cnblogs.com/1-2-3/archive/2011/04/25/generate-permutation-part2.html 1、康托展開  康托展開的公式是 Xan*(n-1)!an-1*(n-2)!...ai*(i-1)!...a2*1!a1*0! 其中&#xff0c;ai為當前未出現的元素中是排在第幾個&#xff08;從0開始&a…

java類排序

1、實現Comparator接口 public static class ComparatorImpl implements Comparator<Element>{Overridepublic int compare(Element o1, Element o2) {if(o1.unitPrice > o2.unitPrice)return 1;else if(o1.unitPrice < o2.unitPrice){return -1;}else{return 0;}}…

java jni so_java 用jni調用so全過程

這幾天一直在研究JNI的開發過程&#xff0c;順便把NDK環境搭建一起總結下。在windows環境下開發jni需要c/c編譯器的支持&#xff0c;網絡上我看很多人使用cygwin。呵呵我不是很喜歡使用它&#xff0c;感覺安裝起來挺麻煩的。我使用GNUStep&#xff0c;下載地址http://www.gnust…

ios開發之 -- 自動輪播圖創建

這里是oc版本的&#xff0c;簡單記錄下&#xff1a; 具體代碼如下&#xff1a; 1&#xff0c;準備 #define FRAME [[UIScreen mainScreen] bounds] #define WIDTH FRAME.size.width #define HEIGHT FRAME.size.height 2&#xff0c;具體實現 //scrollview的添加_bigScrollView…

學習進度(2016.3.13)

第二周所花時間&#xff08;包括上課&#xff09;14小時代碼量&#xff08;行&#xff09;138行博客量&#xff08;篇&#xff09;4篇了解到的知識點動態數組的定義初始化和使用&#xff0c;指定范圍獲得隨機數轉載于:https://www.cnblogs.com/zzcs/p/5272365.html

binaryoperator java_BinaryOperatorT接口的用法示例

java Function函數中的BinaryOperator接口用于執行lambda表達式并返回一個T類型的返回值&#xff0c;下面的BinaryOperator用法示例讓你簡單了解一下。import java.util.function.BinaryOperator;public class TestDemo {public static void main(String[] args) {BinaryOperat…

線性表的順序存儲結構之順序表類的實現_Java

在上一篇博文——線性表接口的實現_Java中&#xff0c;我們實現了線性表的接口&#xff0c;今天讓我們來實現線性表的順序存儲結構——順序表類。 首先讓我們來看下順序表的定義&#xff1a; 線性表的順序存儲是用一組連續的內存單元依次存放線性表的數據元素&#xff0c;元素在…

Linux下安裝jdk

參考于&#xff1a;http://www.cnblogs.com/caosiyang/archive/2013/03/14/2959087.html 一、準備階段 ①下載jdk-6u45-linux-i586.bin&#xff0c;通過xftp上傳至Linux系統中 ②在命令行執行 ./jdk-6u45-linux-i586.bin&#xff0c;生成目錄jdk1.6.0_45 ③移動到/usr/share下&…

JDK source 之 ArrayList 需要注意事項

線程安全 ArrayList內部沒有實現原子性操作&#xff0c;所以是非線程安全的。如果需要在線程安全的環境下使用List的話&#xff0c;需要使用Vector 或者CopyOnWriteArrayList&#xff0c;具體場景&#xff0c;自行深入了解。 擴容算法 // minCapacity 為需要的最小容量 private…

為Tiny4412設備驅動在proc目錄下添加一個可讀版本信息的文件

http://blog.csdn.net/morixinguan/article/details/77808088 上節&#xff0c;我們明白了proc文件系統的作用&#xff0c;接下來我們在友善之臂已經寫好的led驅動的基礎上&#xff0c;在proc目錄下創建一個文件夾&#xff0c;然后加入led驅動的版本信息讀取。 我們在init函數的…

java audiorecord_Android 錄音實現(AudioRecord)

上一篇文章介紹了使用 MediaRecorder 實現錄音功能 Android錄音實現(MediaRecorder) &#xff0c;下面我們繼續看看使用 AudioRecord 實現錄音功能。AudioRecord首先看看Android幫助文檔中對該類的簡單概述: AndioRecord 類的主要功能是讓各種 Java 應用能夠管理音頻資源&#…

SqlServer中的數據類型UniqueIdentifier

SqlServer中的數據類型UniqueIdentifier究竟是什么東東&#xff1f;該類型一般用來做為主鍵使用&#xff0c;可用SQL語法的newid()來生成一個唯一的值。我想請問的是&#xff0c;這個值是一個長整型的數據值呢&#xff0c;還是個其他的什么值&#xff1f;我在程序中該怎樣去控制…