搭建分布式hadoop2.x集群

前期準備:

     1.我這里用了三臺虛擬機,.默認已經配置好靜態IP和IP域名映射,它們相互之間可以ping通

         第一臺:192.168.174.131 ? ? ?hadoopNumber01.medal.com

         第二臺:192.168.174.132 ? ? ?hadoopNumber02.meda.com

         第三臺:192.168.174.133 ? ? ?hadoopNumber03.medal.com

     2.虛擬機最好不要連上網,因為我們后面用的是離線方式安裝

一、搭建前的系統設置

    1.將三臺虛擬機切換到root用戶,禁用IPv6

      命令是:#echo "alias net-pf-10 off" ?>> /etc/modprobe.d/dist.conf

          #echo "alias ipv6 off" ?>> /etc/modprobe.d/dist.conf

    2.配置普通用戶的sudo權限

      命令是:#chmod ?u+w ? /etc/sudoers

          #vi ? /etc/sudoers

             在第一行加上:用戶名 ?ALL=(root)NOPASSWD:ALL

            因為我是以xunzhang這個用戶登錄的,所以我加上xunzhang ALL=(root)NOPASSWD:ALL

          #chmod ?u-w ?/etc/sudoers

    3.關閉防火墻

      命令是:$sudo ?service iptables stop

          $sudo ?chkconfig ?iptables ?off

    4.禁用selinux

      命令是:$sudo ?vi ?/etc/sysconfig/selinux

            修改內容:SELINUX= disabled

    5.卸載JdK

      命令是:$sudo ?rpm ?-qa | grep ?java

          $sudo ?rpm ?-e ?--nodeps ?xxx ? yyy ? zzz

    6.設置文件打開數量和用戶最大進程數

      命令是:$sudo ?vi ?/etc/security/limits.conf

          加上內容:

              * ?soft ? nofiles ? 65535

              * ?hard ?nofiles ? 65535

              * ?soft ? ?nproc ? ?32000

              * ?hard ? nproc ? ?32000

    7.設置集群時間同步(ntp),前提是三臺虛擬機之間已經配置ssh免密鑰登錄

      比如說我現在設置第二臺和第三臺虛擬機與第一臺虛擬機進行時間同步

       ? ?1>首先檢查第一臺虛擬機有沒有安裝ntp軟件,命令是:#rpm ?-qa | grep ntp,默認系統已經自帶了

       ? 2>編輯配置文件ntp.conf

         ?命令是:#vi ?/etc/ntp.conf

           去掉一行注釋,將#restrict ?192.168.1.0 ?mask 255.255.255.0 ?nomodify ?notrap,去掉注釋,并將其改成192.168.174.0,因為我的ip是在這個網段里面

           加上三行注釋,將service ?0.centos.pool.ntp.ort和service ?1.centos.pool.ntp.org還有service ?2.centos.pool.ntp.org這三行注釋掉

           去掉兩行注釋,將末尾的server ?127.127.1.0 ? ?#local ? clock 和 fudge ?127.127.1.0 ?stratum ? 10 ,這兩行的注釋去掉

       3>編輯配置文件ntpd

         命令是:#vi ?/etc/sysconfig/ntpd

            內容是:# Drop ?root ?to id ?'ntp:ntp' ?by ?default.

                SYNC_HWCLOCK =yes

                OPTIONS="-u ?ntp:ntp ?-p ?/var/run/ntpd.pid ? -g"

       4>啟動服務

         命令是:#service ?ntpd ?start

             #chkconfig ? ntpd ?on

       5>在另外兩臺虛擬機上,寫腳本,進行時間的同步

          在第二臺虛擬機上,切換到root用戶,設置同步

             命令是:crontab ?-e

               加上如下內容:

                  0-59 * * * * /usr/sbin/ntpdate ?hadoopNumber01.medal.com

                  注意:在這里每個*號之間有一個空格,后面這個域名是我第一臺主機的主機名

          在第三臺虛擬機上,也做如第二臺虛擬機相同的操作

二、搭建Hadoop2.x集群

  1、安裝JDK

    1>上傳JDK安裝包,并將其解壓到/opt/modules目錄下

    2>配置環境變量

      命令是:sodu ?/etc/profile

      在最后加上:########### ?JAVA_HOME ##################

            export ?JAVA_HOME=/opt/modules/jdk1.7.0_79 (jdk所在的路徑),我的jdk是在/opt/modules/下

            export ?CLASSPATH=/opt/modules/jdk1.7.0_79/lib

            export ?PATH=$PATH:$JAVA_HOME/bin

    3>重啟配置文件/etc/profile

      命令是:source ?/etc/profile

    4>將jdk分發到另外兩臺虛擬機中

      命令是:cd ?/opt/modules/

          scp -r * xunzhang@hadoopNumber02.medal.com:/opt/modules

          scp -r * xunzhang@hadoopNumber03.medal.com:/opt/modules

     最后在另外兩臺虛擬機上配置java環境變量

  2.安裝Hadoop2.x(我這里是2.5.0)

    1>上傳hadoop安裝包,并將其解壓到/opt/modules目錄下,進入hadoop-2.5.0-cdh5.3.6目錄下,創建臨時緩存目錄

        命令是:mkdir ?-p ?tmp/dir

    2>進入hadoop-2.5.0-cdh5.3.6/ect/hadoop目錄下,修改配置文件

      第一個:core-site.xml       

        <configuration>
          <property>
            <name>fs.defaultFS</name>
            <value>hdfs://hadoopNumber01.medal.com:8020</value>
          </property>
          <property>
            <name>hadoop.tmp.dir</name>
            <value>/opt/modules/hadoop-2.5.0-cdh5.3.6/tmp/dir</value>
          </property>
        </configuration>

      第二個:hdfs-site.xml        

        <configuration>
          <property>
            <name>dfs.replication</name>
            <value>2</value>
          </property>
          <property>
            <name>dfs.namenode.secondary.http-address</name>
            <value>hadoopNumber02.medal.com:50090</value>
          </property>
        </configuration>

     第三個:mapred-site.xml

        <configuration>
          <property>
           <name>mapreduce.framework.name</name>
           <value>yarn</value>
          </property>
        </configuration>

     第四個:yarn -site.xml

        <configuration>
          <property>
            <name>yarn.resourcemanager.hostname</name>
            <value>hadoopNumber01.medal.com</value>
          </property>
          <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
          </property>
        </configuration>

     第五個:slaves

          hadoopNumber01.medal.com
          hadoopNumber02.medal.com
          hadoopNumber03.medal.com

     第六個:hadoop-env.sh

          配置java的路徑:export JAVA_HOME=/opt/modules/jdk1.7.0_79

     第七個:mapred-env.sh

          配置java的路徑:export JAVA_HOME=/opt/modules/jdk1.7.0_79

  3.將hadoop分發到其它虛擬機上

     前提:三臺虛擬機它們的目錄結構,和用戶名完全一樣

     命令:??scp core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml slaves hadoop-env.sh mapred-env.sh                              ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? xunzhang@hadoopNumber02.medal.com:/opt/modules/hadoop-2.5.0-cdh5.3.6/etc/hadoop/

        ? ? scp core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml slaves hadoop-env.sh mapred-env.sh                              ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? xunzhang@hadoopNumber03.medal.com:/opt/modules/hadoop-2.5.0-cdh5.3.6/etc/hadoop/

  4.格式化hdfs文件系統

    在第一臺虛擬機上

      命令:bin/hdfs namenode -format

          如果沒有錯誤,就繼續向下執行,有錯誤就查看日志信息,進行改正

         sbin/start-dfs.sh

         sbin/start-yarn.sh

至此,集群搭建完成

轉載于:https://www.cnblogs.com/medal-li/p/7460423.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/253570.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/253570.shtml
英文地址,請注明出處:http://en.pswp.cn/news/253570.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ortp庫使用入門

原創作品&#xff0c;允許轉載&#xff0c;轉載時請務必以超鏈接形式標明文章 原始出處 、作者信息和本聲明。否則將追究法律責任。http://ticktick.blog.51cto.com/823160/345642 我們知道&#xff0c; RTP&#xff08;Real-timeTransportProtocol&#xff09;是用于Internet上…

可測性設計技術

傳統的設計過程和測試過程是分開的&#xff0c;而且測試往往只在設計階段的后期才被考慮。近年來&#xff0c;測試越來越早地被考慮并出現在設計過程中&#xff0c;被稱為“可測性設計”。可測性設計的主要思路就是在設計之初就考慮關于測試方面的設計&#xff0c;并在設計階段…

優酷電視劇爬蟲代碼實現一:下載解析視頻網站頁面(3)補充知識點:htmlcleaner使用案例...

htmlcleaner 下載地址&#xff1a;htmlcleaner2_1.jar 源碼下載&#xff1a;htmlcleaner2_1-all.zip 寫一個測試用的html文件&#xff1a;html-clean-demo.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/D…

小程序開發-利用canvas實現保存二維碼海報到本機

場景及需求 在小程序開發過程中&#xff0c;經常需要實現保存某個頁面為帶小程序碼的二維碼海報圖片到本地&#xff0c;然后用于分享或者發朋友圈等操作。 主要技術點及小程序相關api 技術注意事項 小程序的canvas與H5 canvas使用api大部分一致&#xff0c;但由于小程序中沒有D…

Docker系統六:Docker網絡管理

Docker網絡 I. Docer的通信方式 默認情況下&#xff0c;Docker使用網橋&#xff08;brige&#xff09; NAT的通信模型. Docker啟動時會自動創建網橋Docker0&#xff0c;并配置ip 172.17.0.1/16 ifconfig docker0 docker0 Link encap:Ethernet HWaddr 02:42:e0:31:ac:10inet …

pthread_cond_wait

1. 首先pthread_cond_wait 的定義是這樣的 The pthread_cond_wait() andpthread_cond_timedwait() functions are used to block on a condition variable. They are called withmutex locked by the calling thread or undefined behaviour will result. These functions ato…

HDU 1525 Euclid's Game

題目大意&#xff1a; 題目給出了兩個正數a.b 每次操作&#xff0c;大的數減掉小的數的整數倍。一個數變為0 的時候結束。 誰先先把其中一個數減為0的獲勝。問誰可以贏。Stan是先手。 題目思路&#xff1a; 無論a,b的值為多少&#xff0c;局面&#xff1a;[a%b&#xff0c;b] 一…

SRAM BIST技術學習

MBIST 方法是目前大容量存儲器測試的主流技術&#xff0c;該技術利用芯片內部專門設計的BIST 電路進行自動化測試&#xff0c;能夠對嵌入式存儲器這種具有復雜電路結構的嵌入式模塊進行全面的測試。MBIST 電路將產生測試向量的電路模塊以及檢測測試結果的比較模塊都置于芯片的內…

【Zigbee技術入門教程-02】一圖讀懂ZStack協議棧的核心思想與工作機理

【Zigbee技術入門教程-02】一圖讀懂ZStack協議棧的核心思想與工作機理 廣東職業技術學院 歐浩源 Z-Stack協議棧是一個基于任務輪詢方式的操作系統&#xff0c;其任務調度和資源分配由操作系統抽象層OSAL管理著。 你可以理解為&#xff1a;Z-Stack協議棧 OSAL操作系統 CC25…

CMOS圖像傳感器——SmartSens

近年來CIS發展成為增量市場,國產CIS廠商也踴躍布局,給業界帶來許多驚喜。思特威(上海)電子科技股份有限公司(SmartSens)正是國產CIS中亮眼的一家廠商。數據顯示,2020年思特威安防監控市場的CIS芯片出貨量為1.46億顆,繼續位居全球出貨量TOP1的位置;同年,思特威的新興領…

Servlet第二篇【Servlet調用圖、Servlet細節、ServletConfig、ServletContext】

Servlet的調用圖 前面我們已經學過了Servlet的生命周期了&#xff0c;我們根據Servlet的生命周期畫出Servlet的調用圖加深理解 Servlet的細節 一個已經注冊的Servlet可以被多次映射 同一個Servlet可以被映射到多個URL上。 <servlet><servlet-name>Demo1</servle…

vue響應式原理

vue響應式原理 initState new Vue() > _init() > initState: function initState (vm: Component) {vm._watchers []const opts vm.$optionsif (opts.props) initProps(vm, opts.props)if (opts.methods) initMethods(vm, opts.methods)if (opts.data) {initData(vm)} …

Oracle數據庫管理與開發pdf

下載地址&#xff1a;網盤下載基本介紹編輯內容簡介Oracle是一個適合于大中型企事業的數據庫管理系統&#xff0c;在銀行、電信、移動通信、航空、保險、金融、氣象、鐵路、跨國公司和電子商務等諸多領域得到了廣泛的應用。據統計&#xff0c;在所有數據庫管理系統中&#xff0…

DVS/DVR區別

一、DVS &#xff08;Digital Video Server&#xff09;網絡視頻服務器的簡稱。DVS(網絡視頻服務器)的原理網絡視頻服務器主要實現模擬視音頻信號的IP 化。經數字化的視音頻信號MPEG-4 視頻壓縮算法和G.729/ADPCM 音頻壓縮算法進行壓縮編碼&#xff0c;然后通過IP 網將低碼率的…

自動對焦方法學習

實現自動對焦的方法有很多種,可以根據不同的工作原理,將自動對焦技術分成不同種類。 按照系統是否自帶信號發射系統,可以分為主動式與被動式兩種類型。 主動式對焦方法是由成像系統中的發射裝置發出信號,然后再由接收裝置接收從被攝景物所反射回來的反饋信號并利用通過計算…

微粒化運營:升級內容產業消費體驗(附視頻版)

那些最受歡迎的內容平臺做對了什么&#xff1f; Facebook和Google是全球互聯網廣告產業中最早開始微粒化運營的代表&#xff0c;Google的互聯網精準廣告的思路與微粒化運營是完全相同的&#xff0c;這兩家公司也因此獲得了全球超過20%的互聯網廣告的收入。 以Facebook為例&…

mycat讀寫分離

只需要讀寫分離的功能&#xff0c;分庫分表的都不需要。 涉及到的配置文件&#xff1a; 1.conf/server.xml 主要配置的是mycat的用戶名和密碼&#xff0c;mycat的用戶名和密碼和mysql的用戶名密碼是分開的&#xff0c;應用連接mycat就用這個用戶名和密碼。 <?xml version&q…

chisel快速入門(一)

一、概述 Chisel&#xff08;Constructing Hardware In a Scala Embedded Language&#xff09;是一種嵌入在高級編程語言Scala的硬件構建語言。Chisel實際上只是一些特殊的類定義&#xff0c;預定義對象的集合&#xff0c;使用Scala的用法&#xff0c;所以在寫Chisel程序時實際…

DVS/DVR常見的監控名詞

英文名詞 說明BNC 全稱Bayonet Nut Connector&#xff0c;一種用于同軸電纜的連接器DHCP 動態主機配置協議&#xff0c;用于動態地指派配置信息DNS 域名系統&#xff0c;以用戶友好的方式將名字轉換為…

導出數據生成excel

前臺&#xff1a; <asp:Button ID"btnMoney" runat"server" Text"經費使用總結表" CssClass"admin_cx marginleft" Height"25" OnClick"btnMoney_Click" /> 后臺&#xff1a; protected void btnMoney_Cli…