使用大數據閃存打造融合數據平臺

隨著企業、服務提供商和超大型數據中心從描述性分析向預測性和規范性分析演進,結合了融合運營和分析數據管道的融合數據平臺變得日益重要。大數據閃存可讓數據處理平臺快速訪問歷史數據和實時數據流,從而以較低成本創建有效的預測模型。

隨著大數據從描述性分析(批量)向預測性(交互)和規范性(實時)分析演進,企業正在越來越多地使用串流數據源和歷史批量數據,以提高機器的學習能力并建立預測模型。簡而言之,描述性分析是為了了解事態,預測性分析是為了建立一個假設場景模型,而規范性分析是為了通過采取數據驅動型行動來影響結果。新型分析應用能夠在交易發生時實時捕獲它,并能影響其結果,從而帶來直接的商業效益。這方面的用例包括:
反洗錢欺詐分析定向營銷工業互聯網(IoT/IoE)實時生產制造醫療領域的患者數據情報SanDisk閃迪利用新型分析應用對半導體制造數據進行實時分析。從Lambda架構到SMACK

Lambda架構因其融合實時分析和批量分析的能力而深受喜愛。Lambda架構使用HDFS、Scalding和HBASE作為融合實時分析和批量數據管道的構建模塊。但是,該架構帶來的多管道復制代碼和數據的開銷,使得其難以大規模部署。

為了克服Lambda架構的局限性,必需配備一個能夠有效處理批量和實時串流的大數據管道。全新的SMACK堆棧——Scala及其Spark、Mesos、Akka、Cassandra和Kafka生態系統便旨在實現這一點。SMACK串流已成為一個用于處理批量和串流數據的有效大型平臺。

Meosphere的Infinity堆棧或MapR新近發布的Converged Data Platform等解決方案都是Lambda架構的實例。

配備SMACK(Spark、Mesos、Akka、Cassandra和Kafka)堆棧的串流架構

以下是SMARK堆棧的簡要介紹:
Spark:一個快速、通用的分布式大型數據處理引擎。Mesos:一個集群資源管理系統,在各個分布式應用之間提供高效的資源隔離和共享功能。Akka:一個工具包和運行環境,用于在JVM上創建高并發、分布式、彈性消息驅動型應用。Cassandra:一個分布式、高度可用的數據庫,旨在處理多個數據中心的大量數據。Kafka:一個高吞吐量、低時延的分布式消息系統,旨在處理實時數據流。面向融合數據平臺的大數據閃存

為了創建有效的預測模型,融合堆棧系統需要快速訪問歷史數據和實時數據流。基于閃存的數據網格可為這些新的數據驅動型架構帶來巨大效益。

2015年3月,SanDisk閃迪設立了 “大數據閃存”市場類別,推出了InfiniFlash系統,它擁有極高的容量以及卓越的性能和經濟性(源于低成本晶圓和全新的閃存尺寸規格)。

事實上,InfiniFlash系統之所以能成為融合數據平臺架構的構建模塊,其架構和性能起著至關重要的作用:
數據捕獲每秒可捕獲數百萬個事件,且無事件丟失更快的批量攝取便于擴展使用Avro或Protobuf格式存儲數據,無需ETL(提取、轉換、加載)過程通過支持Kafka等分布式消息系統消除負載數據處理能夠有效處理實時事件和批量數據輸入存儲處理,以秒和亞秒級實現時延交付數據存儲面向數據密集型工作負載的軟件定義數據構造,提供敏捷性和可擴展性可長時間存儲數個TB的數據支持高吞吐量的批量數據存儲,且滿足低時延實時查詢可處理分離的數據源和“突發性”工作負載采用無模式方式存儲數據支持HDFS和NoSQL數據庫(如Cassandra、CouchDB、MemSQL、HBase等)可借助Rackscale架構擴展至PB級極低的年故障率(AFR)可使用解聚/共享存儲提供企業就緒度、沿襲(審計日志)、合規(依法保留等)和版本控制(維護不同的時間點副本)專為來自HDFS/S3的故障、備份和補丁而設計最為經濟高效,低于/GB[1]數據查詢支持亞秒級時延的實時查詢支持批量/聚集查詢支持針對HDFS和NoSQL的查詢

使用InfiniFlash“大數據閃存”打造數據密集型融合數據平臺的三大原因

無論您是企業還是服務提供商,以下是您應該考慮使用InfiniFlash打造融合數據平臺的三大原因:

  1. 滿足捕獲、處理、存儲和查詢數據管道的所有要求

傳統的直接附加型存儲解決方案和純HDD解決方案無法提供融合數據平臺所需的大規模性能和吞吐量。此外,它們也不具備可擴展性所帶來的資本支出和運營支出效益,也不具備這些平臺所要求的敏捷性和企業就緒程度。

與傳統硬盤相比,InfiniFlash系統的性能是它們的50倍,密度是它們的5倍,可靠性是它們的4倍,而且便于向上和向外擴展,以滿足大數據應用的苛刻要求[2]。基于閃存的軟件定義數據構造可讓用戶根據需要靈活選用多種文件系統,其中包括HDFS、Spectrum Scale、Lustre和Ceph。

  1. 全球支持

InfiniFlash在全球各地得到了SanDisk閃迪及其合作伙伴的支持。InfiniFlash是TSA Net Support Community的一部分,可確保滿足嚴格的SLA協議要求。與此同時,我們的FlashStart 功能可確保其安裝順利,并提供卓越的客戶體驗。

  1. 同類最佳的生態系統

SanDisk閃迪與眾多業內領先的軟件開發者和硬件合作伙伴開展合作,通過同類最佳的生態系統獲得更多的選擇和靈活性。我們的合作伙伴包括: RedhatCeph、Nexenta、ICloudbyte以及思科、聯想、戴爾、Supermicro、Quanta等廠商。同時,我們也正與開源社區開展密切合作,并通過我們的各項事業成為貢獻者和思想領袖。(欲了解SanDisk閃迪對于開源SCST企業級特性所做出的貢獻,請點擊此處。)

結語

搭建融合數據平臺是為了滿足融合運營和分析管道的要求,以及隨后的捕獲、處理、存儲和查詢階段的存儲要求,一個基于大數據閃存的數據構造是融合平臺理想的存儲層構建模塊,可讓數據管道的每個階段都受益。

本文轉自d1net(轉載)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/541039.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/541039.shtml
英文地址,請注明出處:http://en.pswp.cn/news/541039.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

stl min函數_std :: min()函數以及C ++ STL中的示例

stl min函數C STL std :: min()函數 (C STL std::min() function) min() function is a library function of algorithm header, it is used to find the smallest value from given two values, it accepts two values and returns the smallest value and if both the value…

c# uri.host_C#| Uri.FromHex()方法與示例

c# uri.hostUri.FromHex()方法 (Uri.FromHex() Method) Uri.FromHex() method is a static method that returns an integer that represents a decimal digit of specified hex char. Uri.FromHex()方法是一個靜態方法,該方法返回一個整數,該整數表示指…

中國制造2025變革,背后的大數據來龍去脈

大數據的成長路徑一定是個長期成長過程,實用分析工具與先進分析理念,真正釋放數字化分析的力量,由人類軌跡產生的數據,與機器自動產生的數據得出洞見,從管理決策推導運營方案,最終實現數據價值提升。無論是…

java 文件下載 jsp文件_jsp文件 Java實現文件上傳與下載

通過前臺選擇文件,然后將資源上傳到(即新建一個文件)到發布的資源文件下面,下載就是url 到發布的資源文件,觸發即可自動下載。服務器已經封裝了如何下載的底層實現。(此處用的是tomcat)JSP上傳文件方法:關于在HTTP request 中通過…

ruby hash方法_Ruby中帶有示例的Hash.flatten方法

ruby hash方法哈希平化方法 (Hash.flatten Method) In this article, we will study about Hash.flatten Method. The working of this method can be predicted with the help of its name but it is not as simple as it seems. Well, we will understand this method with t…

浙江嘉興“網事”再添國字招牌 領跑城市智慧轉型

16日,舉世矚目的第三屆世界互聯網大會如期而至。世界目光再次聚焦“烏鎮時間”,人們不禁發現,流淌千年的水網已與迅猛發展的互聯網交相輝映,1300多年的古鎮釋放出強烈的互聯網信號。更令人驚喜的是,互聯網形成的沖擊波…

java list過濾重復的數據_List 去除重復數據的 5 種正確姿勢!

以下介紹五種-不同的方法去除 Java 中ArrayList中的重復數據1.使用LinkedHashSet刪除arraylist中的重復數據LinkedHashSet是在一個ArrayList刪除重復數據的最佳方法。LinkedHashSet在內部完成兩件事:刪除重復數據保持添加到其中的數據的順序Java示例使用LinkedHashS…

打擊侵犯公民個人信息罪的司法困境

當前,公民個人信息泄露并屢遭侵犯已成為社會關注焦點。泄露的信息輕則給被害人生活造成困擾,重則使被害人陷入電信詐騙、敲詐勒索等犯罪漩渦,造成重大人身、財產損失。一些民眾認為,對侵犯公民個人信息行為的刑事打擊很不給力&…

ruby中、.reject_Ruby中帶有示例的Array.reject方法

ruby中、.rejectRuby Array.reject方法 (Ruby Array.reject Method) In the last article, we have seen how we can make use of the Array.select method in order to print the Array elements based on certain conditions provided inside the block? In this article, w…

java獲取主機mac_Java 如何獲取主機的MAC地址

獲取MAC地址首先要理解當前的操作系統,由于在不同的操作系統中CMD命令所在的位置不同,因此首先使用System類中的getProperty("os.name")方法獲取當前的操作系統,getProperty()方法可以確定當前系統屬性,它的參數是一些固…

微軟免費軟件項目DreamSpark更名為Microsoft Imagine

9月10日消息,微軟免費軟件項目DreamSpark近日正式更名為Microsoft Imagine,將與一年一度的微軟“創新杯(Imagine Cup)”齊名。微軟免費軟件項目DreamSpark更名為Microsoft Imagine  2008年2月19日,微軟公司董事長比爾蓋茨在斯坦福大學發布了…

java jpa_Java JPA 語法知識

前提操作創建一個可持久化的實體類dao層繼承JpaRepositoryT:實體類ID:實體類的主鍵類型例:public interface SysUserRespository extends JpaRepository {}JPA中支持的關鍵詞And --- 等價于 SQL 中的 and 關鍵字,比如 findByUsern…

array.slice_Ruby中帶有示例的Array.slice()方法

array.sliceArray.slice()方法 (Array.slice() Method) In this article, we will study about Array.slice() method. You all must be thinking the method must be doing something which is related to the slicing of elements or objects in the Array instance. It is n…

阿特斯攜手EDF啟動建設巴西191.5MW光伏項目

2016年10月11日,阿特斯太陽能(安大略省,圭爾夫)和EDF Energies Nouvelles(法國,巴黎)共同宣布,將阿特斯巴西Pirapora I太陽能項目80%的股權出售給EDF的巴西本地子公司EDF…

apachejmeter_java源碼_自定義編寫jmeter的Java測試代碼

我們在做性能測試時,有時需要自己編寫測試腳本,很多測試工具都支持自定義編寫測試腳本,比如LoadRunner就有很多自定義腳本的協議,比如"C Vuser","JavaVuser"等協議.同樣,Jmeter也支持自定義編寫的測試代碼,不過與LoadRunner不同的是,Jmeter沒有自帶編譯器,…

julia fit 函數_帶有Julia中示例的flipsign()函數

julia fit 函數Julia| flipsign()函數 (Julia | flipsign() function) flipsign() function is a library function in Julia programming language, it accepts two values as parameters and returns a value with the magnitude of first value and sign of the first value…

優化Android應用內存的若干方法

https://my.oschina.net/chaselinfo/blog/198172摘要: 在app開發的各個階段中要考慮RAM的限制問題, 包括在設計階段(正式開發之前). 使用下面的不同的方法可以達到很好的效果. 當您在設計和開發Android應用時用下面的方法可以使內存運用最高效.使用保守的Service 如果你的應用需…

一? ilkkn.n_IL&FS的完整形式是什么?

一? il&kkn.nIL&FS:基礎設施租賃和金融服務 (IL& FS: Infrastructure Leasing & Financial Services) IL&FS is an abbreviation of Infrastructure Leasing & Financial Services. It is the largest infrastructure development …

java notify喚醒原理_Java wait和notify虛假喚醒原理

自己在此記錄一下,方便日后復習。虛假喚醒的概念jdk官方文檔解釋:所以說在wait和notify一塊使用時,如果使用if作為條件時,會有虛假喚醒的情況發生,所以必須使用while作為循環條件。下面來舉例實驗:首先&…

C#里面的三種定時計時器:Timer

在.NET中有三種計時器:1、System.Windows.Forms命名空間下的Timer控件,它直接繼承自Componet。Timer控件只有綁定了Tick事件和設置EnabledTrue后才會自動計時,停止計時可以用Stop()方法控制,通過Stop()停止之后,如果想…