寫給大數據開發初學者的話5

見：http://lxw1234.com/archives/2017/01/832.htm

至此，你的大數據平臺底層架構已經成型了，其中包括了數據采集、數據存儲與計算（離線和實時）、數據同步、任務調度與監控這幾大模塊。接下來是時候考慮如何更好的對外提供數據了。

第九章：我的數據要對外

通常對外（業務）提供數據訪問，大體上包含以下方面：

離線數據的提供可以采用Sqoop、DataX等離線數據交換工具。

根據延時要求和實時數據的查詢需要，可能的方案有：HBase、Redis、MongoDB、ElasticSearch等。

OLAP分析：OLAP除了要求底層的數據模型比較規范，另外，對查詢的響應速度要求也越來越高，可能的方案有：Impala、Presto、SparkSQL、Kylin。如果你的數據模型比較規模，那么Kylin是最好的選擇。
即席查詢：即席查詢的數據比較隨意，一般很難建立通用的數據模型，因此可能的方案有：Impala、Presto、SparkSQL。

這么多比較成熟的框架和方案，需要結合自己的業務需求及數據平臺技術架構，選擇合適的。原則只有一個：越簡單越穩定的，就是最好的。

如果你已經掌握了如何很好的對外（業務）提供數據，那么你的“大數據平臺”應該是這樣的：

lxw1234

關于這塊，我這個門外漢也只能是簡單介紹一下了。數學專業畢業的我非常慚愧，很后悔當時沒有好好學數學。

在我們的業務中，遇到的能用機器學習解決的問題大概這么三類：

大多數行業，使用機器學習解決的，也就是這幾類問題。

入門學習線路：

機器學習確實牛逼高大上，也是我學習的目標。

那么，可以把機器學習部分也加進你的“大數據平臺”了。

lxw1234

寫給大數據開發初學者的話1

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/451299.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/451299.shtml
英文地址，請注明出處：http://en.pswp.cn/news/451299.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！