IDT、Orange Silicon Valley和NVIDIA基于RapidIO的集群加速计算技术突破,适用于游戏和网

本文作者:IDT       点击: 2014-11-28 18:40
前言:
采用RapidIO互连技术连接的NVIDIA Mobile Tegra K1 GPUs可扩展集群可实现数千个节点,并可提供同类最佳的计算到I/O(Compute-to-I/O)性能
2014年11月28 日--IDT 公司(IDT®)(NASDAQ:IDTI)今天宣布推出一项突破性的计算架构,通过高密度、低延迟连接的移动处理器集群专门设计用来处理在线游戏、高性能计算和分析的巨大数据需求。IDT公司通过与Orange Silicon Valley合作,采用IDT RapidIO®互连技术以高达16 Gbps的速率连接多个节点,共同开发出基于低功耗NVIDIA®Tegra®K1移动处理器的一个庞大的高可扩展性、低延迟集群。该架构可以扩展到一个机架超过2000个节点,并可实现超高Gflop密度,并取得用PCI Express®和以太网技术都无法实现的能源效率。
 
 
该突破性成果对于在很小的电路板空间创建高计算能力是独一无二的强大推动力量。由于可实现在1U服务器板卡上可实现高达23 Tflops,或每机架的计算能力超过800 Tflops,此集群架构可实现世界顶级超级计算机 “中国天河二号”的大约两倍计算密度。实现如此高密度计算主要是通过利用分布式交换和互联技术,以及移动级GPU技术,用同类产品中最少的空间实现每个节点在I /O和计算之间的平衡。
 
Linley Group的Jag Bolaria评论道: “通过在服务器机架上规模化集成大量的低功耗GPU,业界第一次创建了采用巨量基于云计算的集群进行分析和游戏的一个清晰路径。这一成就意味着开发低延迟和高可扩展性的大型集群最终是可能的。这种架构能够以高能效和低延迟的方式提供卓越的计算能力,可应对每年在无线网络中部署的大约200万个基站共址(co-locating)分析的挑战。”
 
新的架构使计算内核以16 Gbps的数据传输速率和每个节点相匹配,以便实现更佳的计算与吞吐量平衡,这是当今业界的一个主要难点所在。如果将来采用40 Gbps的IDT RapidIO 10xN技术,计算内核到I/O的速率将会继续提高。
 
该架构允许在一个19英寸1U板上实现60个节点,在一个机架上实现超过2000个节点。任何节点都可以与其他节点进行通信,而网络延迟只有400ns,存储器到存储器之间的延迟小于2ms。每个节点都包括有一个Tsi721 PCIe®连接至RapidIO NIC以及一个Tegra K1移动处理器,16 Gbps数据速率下计算能力达384 Gflops,或每bit I/O达到24浮点运算。这对于数据中心机架级水平和无线接入网络的各个分析服务器水平都具有非常高的价值。
 
此集群采用NVIDIA公司的Jetson TK1开发包完成,由具有颠覆性创新的NVIDIA Tegra K1移动处理器进行处理。NVIDIA的Kepler®GPU已经构建了世界上最快的超级计算机,Tegra K1是基于与Kepler®GPU相同的架构,并可提供用于高级图形和计算性能的192个完全可编程CUDA内核。
 
IDT公司接口和连接事业部副总裁兼总经理Sean Fan 介绍说:“在‘大数据’舞台上领先的创新者正越来越多地发现RapidIO互连技术给他们的应用带来的好处。我们与Orange Silicon Valley一起合作,通过RapidIO互连把巨量的低功耗NVIDIA移动处理器连接在一起,演示了一种突破性的技术途径来解决总的计算、功率和均衡的网络互连与处理器通信的平衡问题。”
 
在2014年11月18-20日于美国路易斯安那州新奥尔良Ernest N. Memorial Convention Center举办的Supercomputing 14上,IDT公司已经在RapidIO.org展位上(展位号3952)展示了用RapidIO与NVIDIA Tegra K1实现的集群技术。