第一章測驗
1、下面哪個選項不屬于Google的三駕馬車?
? A.HDFS
? B.MapReduce
? C.BigTable
? D.GFS
2、下面哪個思想是為了解決PageRank(網頁排名)的問題?
? A.GFS
? B.BigTable
? C.MapReduce
? D.YARN
3、GFS 存儲的文件都被分割成固定大小的塊,每個塊都會復制到多個塊服務器上(可靠性),請問默認冗余存儲幾份?
? A.1
? B.2
? C.3
? D.5
4、下面哪個特點是不屬于Hadoop的特點?
? A.擴容能力強
? B.成本低
? C.高效率和可靠性
? D.適合復雜數據的分析
5、下面哪個場景適合使用Hadoop處理?
? A.少量數據分析
? B.在線分析
? C.離線分析
? D.復雜數據
6、2003年,Google公司發表了主要講解海量數據的可靠存儲方法的論文是?
? A.“The Google File System”
? B.“MapReduce: Simplified Data Processing on Large Clusters”
? C.“Bigtable: A Distributed Storage System for Structured Data”
? D.“The Hadoop File System”
7、2004年,Google公司發表了主要講解海量數據的高效計算方法的論文是?
? A.“The Google File System”
? B.“MapReduce: Simplified Data Processing on Large Clusters”
? C.“Bigtable: A Distributed Storage System for Structured Data”
? D.“The Hadoop File System”
8、2006年,Google公司發表了用來處理海量數據的一種非關系型數據庫的論文是?
? A.“The Google File System”
? B.“MapReduce: Simplified Data Processing on Large Clusters”
? C.“Bigtable: A Distributed Storage System for Structured Data”
? D.“The Hadoop File System”
9、對于GFS架構,下面哪個說法是錯誤的?
? A.GFS Master節點管理所有的文件系統所有數據塊。
? B.GFS存儲的文件都被分割成固定大小的塊,每個塊都會被復制到多個塊服務器上(可靠性)。塊的冗余度默認為3。
? C.GFS Master還管理著系統范圍內的活動,比如塊服務器之間的數據遷移等
? D.GFS Master與每個塊服務器通信(發送心跳包),發送指令,獲取狀態
10、狹義的Hadoop是一個適合大數據分布式存儲和分布式計算的平臺,不包括下面哪個組件?
? A.HDFS
? B.MapReduce
? C.Yarn
? D.HBase
11、與Hadoop 1.x相比,Hadoop 2.x采用全新的架構,最明顯的變化就是增加了哪個組件?
? A.MapReduce
? B.Yarn
? C.Pig
? D.HBase
12、建立在Hadoop文件系統之上的分布式的列式數據庫?
? A.HBase
? B.Hive
? C.YARN
? D.Mahout
13、下面哪個選項不是HDFS架構的組成部分?
? A.NameNode
? B.DataNode
? C.SecondaryNameNode
? D.GFS
14、Hadoop的作者是?
? A.Doug cutting
? B.Martin Fowler
? C.Kent Beck
? D.No answer text provided.
15、Hadoop版本演進過程中,0比Hadoop1.0有了很多的優化,下面哪項不屬于Hadoop2.0?
? A.加入HDFS的 NameNode Federation和YARN
? B.YARN基于cgroup的內存和磁盤IO隔離
? C.支持NameNode HA
? D.Wire-compatibility特性
16、Hadoop版本演進過程中,Hadoop3.0比Hadoop2.0有了很多的優化,下面哪項不屬于Hadoop3.0?
? A.JDK版本的最低依賴從1.7變成了1.8
? B.支持多個Standby狀態的NameNode
? C.支持NameNode HA
? D.Datanode內部添加了負載均衡
17、Hadoop更適合哪些場景?
? A.離線分析
? B.復雜數據
? C.少量數據
? D.在線分析
18、下面哪些是大數據的基本特征?
? A.數據體量大
? B.數據類型多
? C.處理速度快
? D.價值密度低
19、Hadoop能夠使用戶輕松開發和運行處理大數據的應用程序,那它主要有下面哪些特點?
? A.高可靠性
? B.高擴展性
? C.高效性
? D.高容錯性
20、Google的在大數據解決方案是開源的。
? A.True
? B.False
21、GFS分布式文件系統有兩個基本組成部分,一個是客戶端(Client),一個是服務端(Server)。
? A.True
? B.False
22、上傳的數據塊保存在GFS上,在保存過程中需要水平復制,水平復制需要考慮兩個要求:可靠性、可用性。
? A.True
? B.False
23、HDFS的采用了“分而治之”的思想。
? A.True
? B.False
24、MapReduce是的最早提出是Google為了解決PageRank的問題。
? A.True
? B.False
25、Hbase是非關系型數據庫,是面向列的。
? A.True
? B.False
26、Hadoop源自始于2002年的Apache Lucene項目。
? A.True
? B.False
17、Google的論文《Google File System》提到:還依賴一個高可用的、序列化的分布式鎖服務組件,叫Chubby。
? A.True
? B.False
28、Region Server是Google的論文《Bigtable:一個分布式的結構化數據存儲系統》中描述的BigTable的組成部分。
? A.True
? B.False
29、Google的GFS論文是主要是為了解決PageRank(網頁排名)的問題。
? A.True
? B.False