docker集群管理

docker集群管理

ps：docker machine ? ? docker swarm ? ? ? docker compose?

在Docker Machine發布之前，你可能會遇到以下問題：

? ? 你需要登錄主機，按照主機及操作系統特有的安裝以及配置步驟安裝Docker，使其能運行Docker容器。
? ? 你需要研發一套工具管理多個Docker主機并監控其狀態。
? ? 你在本地開發，產品部署在公有云平臺，你希望能盡可能的減小兩個環境的差異性

Docker Machine的出現解決了以上問題。

? ? Docker Machine簡化了部署的復雜度，無論是在本機的虛擬機上還是在公有云平臺，只需要一條命令便可搭建好Docker主機
? ? Docker Machine提供了多平臺多Docker主機的集中管理
? ? Docker Machine 使應用由本地遷移到云端變得簡單，只需要修改一下環境變量即可和任意Docker主機通信部署應用。

綜合來說Docker Machine讓下圖這種開發模式得到了大大的簡化。

Docker Machine的運行原理

本文通過兩個例子講述了Docker Machine的工作原理及工作流程：在本機安裝Virtualbox虛擬機作為Docker主機，以及在AWS創建Docker主機。

create命令用來創建docker主機，運行create命令需要指明驅動的名稱，目前支持在本機運行virtualbox虛擬主機，Hyper-V虛擬主機，VMware虛擬主機，AWS EC2，Azure，DigitalOcean，Google等公有云主機，以及使用Openstack搭建的私有數據中心。

新的虛擬化（Xen，KVM）支持以及新的云平臺支持可以通過開發驅動的方式支持。

在本機安裝Virtualbox虛擬機作為Docker主機

一、docker machine安裝?

可以通過下載二進制可執行文件的方式安裝Docker Machine，本文以Linux系統為例

$ curl -L https://github.com/docker/machine/releases/download/v0.5.3/docker-machine_linux-amd64 >/usr/local/bin/docker-machine
 chmod +x /usr/local/bin/docker-machine

?查看版本：

docker-machine -v

docker-machine?version?0.5.3,?build?4d39a66

二、docker compose?安裝

運行下邊的命令來安裝 Compose：

curl -L https://github.com/docker/compose/releases/download/1.3.1/docker-compose-`uname -s`-`uname -m` > /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose

查看版本：

docker-compose --version

升級

如果你使用的是 Compose 1.2或者早期版本，當你升級完成后，你需要刪除或者遷移你現有的容器。這是因為，1.3版本， Composer 使用 Docker 標簽來對容器進行檢測，所以它們需要重新創建索引標記。

如果 Composer 檢測到創建的容器沒有標簽，它將拒絕運行，這樣你就不會有兩組容器。如果你想要保留已經存在的容器（舉例：這里有容器的數據卷上保留這非常重要的數據），你可以使用下邊的命令來遷移：

docker-compose migrate-to-labels

或者，如果這些容器是不必要的，你可以刪除它們 - Composer 會重新創建一個新的。

docker rm -f myapp_web_1 myapp_db_1 ...

三、docker?Swarm 安裝

最簡單的安裝Swarm的方式就是用Docker官方提供的Swarm鏡像：

$ sudo docker pull swarm

Docker集群管理需要服務發現(Discovery service backend)功能。Swarm支持以下幾種discovery service backend：Docker Hub上面內置的服務發現功能，本地的靜態文件描述集群(static file describing the cluster)，etcd(順帶說一句，etcd這玩意貌似很火很有前途，有時間研究下)，consul，zookeeper和一些靜態的ip列表(a static list of ips)。本文會詳細介紹前面兩種方法backend的使用。

在使用Swarm進行集群管理之前，需要先把準備加入集群的所有的節點的docker deamon的監聽端口修改為0.0.0.0:2375，可以直接使用

sudo docker –H tcp://0.0.0.0:2375 &命令，也可以在配置文件中修改

$ sudo vim /etc/default/docker

在文件的最后面添加下面這句

D0OCKER_OPTS="-H 0.0.0.0:2375 –H unix:///var/run/docker.sock"

注意：一定是要在所有的節點上進行修改,修改之后要重啟docker deamon

$ sudo service docker restart

第一種方法：使用Docker Hub上面內置的服務發現功能

第一步?
在任何一個節點上面執行swarm create命令來創建一個集群標志。這條命令執行完畢之后，swarm會前往Docker Hub上內建的發現服務中獲取一個全球唯一的token，用以唯一的標識swarm管理的Docker集群。

$ sudo docker run --rm swarm create

返回的token是d947b55aa8fb9198b5d13ad81f61ac4d，這個token一定要記住，因為接下來的操作都會用到這一個token。

第二步?
在所有的要加入集群的機器上面執行swarm join命令，把機器加入集群。

本次試驗就是要在所有的三臺機器上執行命令。

$ sudo docker run –-rm swarm join –addr=ip_address:2375 token://d947b55aa8fb9198b5d13ad81f61ac4d

執行這條命令后不會立即返回，我們手動通過Ctrl+C返回。

第三步?
啟動swarm manager。

因為我們要讓sclu083充當Swarm管理節點，所以我們要在這臺機器上面執行swarm manage命令

$ sudo docker run –d –p 2376:2375 swarm manage token:// d947b55aa8fb9198b5d13ad81f61ac4d

重點內容需要注意的是：在這條命令中，第一：要以daemon的形式運行swarm；第二：端口映射：2376可以更換成任何一個本機沒有占用的端口，一定不能是2375，否則就會出問題。

執行結果如下如所示：

執行完這個命令之后，整個集群已經啟動起來了。

現在可以在任何一個節點上查看集群上的所有節點了。

之后可以在任何一臺安裝了docker的機器上面通過命令(命令中要指明swarm maneger 機器的IP地址和端口)在這個集群上面運行Dcoker容器操作。

現在在10.13.181.85這臺機器上面查看集群的節點的信息。info命令可以換成任何一個Swarm支持的docker命令，這些命令可以查看官方文檔

sudo docker –H 10.13.181.83:2376 info

由上圖的結果，我們可以發現一個問題：明明這個小集群中是有3個節點的，但是info命令只顯示了2個節點。還缺少節點10.32.105.124。為什么會出現這個情況呢？

因為10.32.105.124這臺機器沒有設置上面的docker daemon監聽0.0.0.0:2375這個端口，所以Swarm沒辦法吧這個節點加入集群中來。

在使用Docker Hub內置的發現服務時，會出現一個問題，就是使用swarm create時會出現

time="2015-04-21T08:56:25Z" level=fatal msg="Get https://discovery-stage.hub.docker.com/v1/clusters/d947b55aa8fb9198b5d13ad81f61ac4d: dial tcp: i/o timeout"

類似于這樣的錯誤，不知道是什么原因，有待解決。（可能是防火墻的問題）

當使用Docker Hub內置的服務發現功能出現問題時，可以使用下面的第二種方法。

第二種方法：使用文件

第二種方法相對而言比第一種方法要簡單，也更不容易出現timeout的問題。

第一步?
在sclu083這臺機器上新建一個文件，把要加入集群的機器的IP地址寫進去

第二步?
在sclu083這臺機器上面執行swarm manage命令：

$ sudo docker run –d –p 2376:2375 –v $(pwd)/cluster:/tmp/cluster swarm manage file:///tmp/cluster

注意：這里一定要使用-v命令，因為cluster文件是在本機上面，啟動的容器默認是訪問不到的，所以要通過-v命令共享。還有，file:///千萬不能忘記了。

可以看到，swarm已經運行起來了。現在可以查看下集群節點信息了，使用命令：

$ sudo docker run –rm –v $(pwd)/cluster:/tmp/cluster swarm list file:///tmp/cluster

(在使用文件作為服務發現的時候，貌似manage list命令只能在swarm manage節點上使用，在其他節點上好像是用不了)

好了，現在集群也已經運行起來了，可以跟第一種方法一樣在其他機器上使用集群了。同樣在sclu085 機器上做測試:

可以看到，成功訪問并且節點信息是正確的。接下來可以把上面的info命令替換成其他docker可執行命令來使用這個曉得Docker集群了。

Swarm調度策略

Swarm在schedule節點運行容器的時候，會根據指定的策略來計算最適合運行容器的節點，目前支持的策略有：spread, binpack, random.

Random顧名思義，就是隨機選擇一個Node來運行容器，一般用作調試用，spread和binpack策略會根據各個節點的可用的CPU, RAM以及正在運行的容器的數量來計算應該運行容器的節點。

在同等條件下，Spread策略會選擇運行容器最少的那臺節點來運行新的容器，binpack策略會選擇運行容器最集中的那臺機器來運行新的節點(The binpack strategy causes Swarm to optimize for the?Container?which is most packed.)。

使用Spread策略會使得容器會均衡的分布在集群中的各個節點上運行，一旦一個節點掛掉了只會損失少部分的容器。

Binpack策略最大化的避免容器碎片化，就是說binpack策略盡可能的把還未使用的節點留給需要更大空間的容器運行，盡可能的把容器運行在一個節點上面。

過濾器

Constraint Filter

通過label來在指定的節點上面運行容器。這些label是在啟動docker daemon時指定的，也可以寫在/etc/default/docker這個配置文件里面。

$ sudo docker run –H 10.13.181.83:2376 –name redis_083 –d –e constraint:label==083 redis

Affinity Filter

使用-e affinity:container==container_name / container_id –-name container_1可以讓容器container_1緊挨著容器container_name / container_id執行，也就是說兩個容器在一個node上面執行(You can schedule 2 containers and make the container #2 next to the container #1.)

先在一臺機器上啟動一個容器

$ sudo docker -H 10.13.181.83:2376 run --name redis_085 -d -e constraint:label==085 redis

接下來啟動容器redis_085_1，讓redis_085_1緊挨著redis_085容器運行，也就是在一個節點上運行

$ sudo docker –H 10.13.181.83:2376 run –d –name redis_085_1 –e affinity:container==redis_085 redis

通過-e affinity:image=image_name命令可以指定只有已經下載了image_name的機器才運行容器(You can schedule a container only on nodes where the images are already pulled)

下面命令在只有Redis鏡像的節點上面啟動redis容器:

$ sudo docker –H 100.13.181.83:2376 run –name redis1 –d –e affinity:image==redis redis

下面這條命令達到的效果是：在有redis鏡像的節點上面啟動一個名字叫做redis的容器，如果每個節點上面都沒有redis容器，就按照默認的策略啟動redis容器。

$ sudo docker -H 10.13.181.83:2376 run -d --name redis -e affinity:image==~redis redis

Port filter

Port也會被認為是一個唯一的資源

$ sudo docker -H 10.13.181.83:2376 run -d -p 80:80 nginx

執行完這條命令，任何使用80端口的容器都是啟動失敗。

轉載于:https://www.cnblogs.com/liuyansheng/p/6123103.html