GPU集群怎么搭建?

GPU集群怎么搭建?

集群分为四个部分:计算节点、存储节点、管理节点、集群辅件。计算节点就是负责运算的节点,就GPU集群来讲,就是使用CPU和GPU卡(或PHI卡)计算,一般只安装一块硬盘作为系统盘,计算节点通过Infiniband网络(以下简称IB网络)连接存储节点来完成运算数据的读取和存储。2014年IB网络的主流速度是40Gb/s,换算成大家日常中说的“速度”就是8GB/s,也就是理论上一个8GB U盘所装满的数据一秒钟就能传输完毕。存储节点,顾名思义,就是存数据的,一堆硬盘。管理节点,顾名思义,就是负责管理的,一般是一台终端机。集群辅件,是包括IB网络(IB交换机、线材等)、千兆以太网络(千兆以太网交换机、