問題
一般情況下,sriov插件和gpu分配插件是單獨工作的,網卡和GPU沒有根據連接關系分配
如果一個節點起了多個容器,會造成GPU和網卡的通信瓶頸
修改
如果一個點起兩個容器,可以按照NUMA親和來分配
修改kubelet配置文件/var/lib/kubelet/config.yaml
topologyManagerPolicy選擇restricted
topologyManagerPolicy: single-numa-node [none|best-effort|restricted|single-numa-node]
topologyManagerScope: pod
然后:
sudo systemctl daemon-reload
sudo systemctl restart kubelet