滚动新闻:
首页 > 解决方案 > 高性能并行计算

100万亿次/S的GPU异构HPC集群系统方案

  全球高性能计算TOP500的统计,有90%以上采用的是基于X86架构搭建的集群系统。不过随着高性能计算技术的发展和应用的不断扩大,目前占据市场主流的高性能集群系统在某些高性能计算领域的应用将面临CPU+GPU的强劲挑战。

  NVIDIA 新出的GPU并行计算卡GTX295,其峰值计算能力已达2万亿次/秒,成本是Tesla C1060的1/3,而速度确提高一倍。在科学研究项目中,虽然稳定性略差些,但从性价比角度考虑,这是最合适的选择,CPU+GPU异构多核架构的高性能计算系统在使用过程中也为用户带来更低的使用成本

  下面是运算速度在100TFlops的GPU集群系统方案

应用

设备

配置

单位

数量

GPU计算节点

  

19"标准, 3U机架式

18

◇  Xeon5500系列

◇16GB DDR3-1066 RECC

◇150G SATA硬盘 10K

◇主板具有6个以上PCI-E x16插槽

◇双1000M以太网接口

◇20Gbps INFINIBAND网卡

◇1000W  EPS 电源

◇3块nVidia GTX295,480个处理器,1792MB GDDR3 800MHZ显存

磁盘阵列

 

采用NAS系统,具体的主机配置如下:

2

19"标准, 5U机架式,24盘位

◇采用最新直连架构(Xeon 55系列主频2.26GHz,四核,8M L3) 或者同等性能的AMD24系列

◇8GB DDR3-1066  RECC内存

◇2*150G SATA 10rpm硬盘

◇1*20Gbps Infiniband网口

◇4* 1000M以太网接口

◇3+1冗余 1140W

◇22* 2TB  SATA 3.5”

◇IOP348芯片高速阵列卡(1GB DDR2-533缓存)

管理节点

 

19"标准,2U机架式

1

◇采用最新直连架构(Xeon 55系列主频2.26GHz,四核,8M L3) 或者同等性能的AMD24系列

◇8GB DDR3-1066 RECC 内存

◇2*150G 10Krpm SATA硬盘 热插拔

◇双1000M以太网接口

◇1+1冗余 510W电源

机柜

 

19"标准, 42U

2

计算网

Infiniband网络

24口infiniband 交换机  20Gbps

1

Infiniband高速互联卡 20Gbps

20

管理网

千兆以太网

24口千兆交换机

1

 

 

 

 

 

KVM

 

KVM切换器

1

 

 

 

 

 

操作系统

Windows

Win HPC server 2008

20

GPU编程环境

NVIDIA CUDA

◇nvcc C语言编译器

1

◇用于GPU(图形处理器)的CUDA FFT以及BLAS库

◇分析器(Profiler)

◇用于GPU(图形处理器)的gdb调试程序

◇CUDA运行时驱动程序

  主要HPC系统硬件配置

  1. GPU计算节点

产品编号

XASUN GPU U22308TI

分类

型号规格

数量

CPU

Quad Core Xeon E5520 2.26Ghz/QPI 5.86Gt/s

1

主板

Supermicro X8DTH-iF

1

内存

2GB  DDR3-1066 ECC/Reg

6

系统盘

WD 150G SATA 1万转

1

光驱

None

 

网卡

双千兆

 

高速互联卡

Infiniband 20Gpbps

1

电源

1000W EPS

1

GPU计算卡

nVidia GTX295

3

 

CPU 采用CPU-内存直连技术、Nehalem核心,

技术要点

GPU计算最完美架构平台

 

主板支持4GPU计算卡

 

  2.管理节点

产品编号

XASUN MC U22304TG

分类

型号规格

数量

CPU

Quad Core Xeon E5520 2.26Ghz/QPI 5.86Gt/s

1

主板

Intel S5500BC

1

内存

2GB  DDR3-1066 ECC/Reg

4

系统盘

WD 150G SATA 1万转

2

高速互联卡

Infiniband 20Gbps

1

电源

510W EPS

1

  3.存储节点

产品编号

XASUN NAS S22304TG

分类

型号规格

数量

CPU

Quad Core Xeon E5520 2.33Ghz/1366Pin/5.86Gt/s

2

主板

Intel S5500HC

1

内存

2GB  DDR3-1066 ECC/Reg

4

系统盘

WD 150G SATA 1万转

2

网卡

Intel 双千兆服务器网卡

1

高速互联卡

Infiniband 20Gbps

1

电源

3+1 1140W冗余

 

阵列卡

Areca 1680-24 SAS/SATA

1

阵列盘

WD RE4 2TB SATA

22

技术要点

存储最大瓶颈在硬盘、网卡的IO

阵列卡采用目前最快IOP348双核处理器,最高带宽达800MB/S支持远程管理,支持SAS硬盘

板载双千兆卡支持IO加速和绑定冗余功能