随着科学技术的进一步发展,并行计算已经成为经济发展、社会进步、科研创新不可或缺的基础支撑技术。云计算、人工智能、大数据等等创新概念无不以海量计算和数据处理作为基础和支撑。
用于科学计算的服务器配置方案,参考如下:
1、CPU处理器
推荐使用Intel Haswell 及 Intel Broadwell系列CPU,具体型号可以谷歌查询。在高性能计算领域,Intel系列CPU是绝对的主角,题主需要考虑的则是是否使用最新架构CPU。一般来说最新的架构性能总是最好的,但是性价比未免是最高的。
2、GPU处理器
相对CPU来说,GPU的选择面小很多,直接选择NVDIA的产品即可。至于具体型号则可以根据题主计算任务类型在K80、K40或者M系列中选择。
此外,可以考虑使用Intel 最新推出的Xeon Phi Knights Landing。相对GPU的优点在于软件的易用性,Knights Landing真正实现了与x86的二进制兼容,甚至可以直接替代CPU启动系统。使用Knights Landing所需要考虑的只有程序的并行性,一般来说并行度足够好的程序都可以在Knights Landing获得3倍以上的性能(相对单颗Broadwell CPU)。
3.互联网络
A. Mellanox 公司产品。 使用InfiniBand可以为集群互联网络带来卓越的性能,但同时价格也会高很多。
B. 千兆交换机。 这个类别的选择不用纠结,华为即可,性能稳定。
4、储存
储存系统的选择是集群搭建过程中的热点问题。
A. 非共享文件系统。 如果使用非共享文件系统则可以按照常规储存系统的解决方案来执行即可(HD, SSD, RAID...)。
B. 共享文件系统。
第一类方案,使用自行搭建的NFS共享文件系统。特性:性能不稳定,维护成本高。
第二类方案,使用专门未HPC集群定制的文件系统。此方面答主只能提供如下几个解决方案以供选择:a. Lustre file system b. ddn storage.
5、散热
散热问题是不可忽视的关键问题。在集群的维护管理中稍有不慎都有可能因为散热而给集群的稳定性及性能带来极大影响。
不论搭建的集群在多大的规模,都推荐使用刀片式服务器。优点很明显,易于管理,散热性能卓越。
6、规模
根据项目需求。
搭建集群的优缺点:
1、维护成本高昂
完成搭建以后集群需要的维护不仅仅是供电而已。用户管理,软件系统维护,机房温度监控,故障检测,故障检测及维修。
2、性能不能与时俱进
大家都知道现在CPU的发展速度。搭建好集群后过几年可能在自己的集群需要运行一天的任务在新型集群上只需要一个小时就完成了。
3、性价比低
与购买大型集群机时相比较,自建一个小型集群所需要的资金消耗高的多(对于相同的计算任务量)。同时,使用大型集群无需考虑集群的维护成本,不用担心自建集群的几年后性能问题。
总之,就像使用云服务一样,使用靠谱的大型集群总可以获得更好的使用体验以及更高的性价比。
需要科学计算服务器、深度学习服务器、人工智能服务器、AI服务器、GPU服务器等详询天下数据客服电话400-638-8808 官网:www.Idcbest.hk。 |