英特尔在微软加速深度学习平台中提供“实时人工智能”技术

本文作者:英特尔       点击: 2017-08-25 16:05
前言:
人工智能(Artificial Intelligence)和深度学习(Deep Learning)有望转变人类与世界互动以及企业运作的方式,从而使人们做出更明智的决策,而英特尔®技术正在实现这场变革。今天,英特尔将着重介绍全球最大的云服务提供商之一是如何利用英特尔人工智能技术来运行复杂的深度学习模型,这些模型实现了各种应用,从智能手机上的人脸识别和语音识别再到自动驾驶等等。

更多详情请参考:英特尔FPGA如何在微软Project Brainwave中加速人工智能(Dan McNamara博客)| 人工智能(新闻资料)

微软选择了英特尔®Stratix®10 FPGA作为其新的深度学习加速平台(代号为Project Brainwave)的关键硬件加速器。这种基于FPGA的深度学习加速平台可以提供“实时人工智能”技术,使云基础设施能够以超低延迟来尽可能快速地处理和传输数据。在云中,系统需要处理直播数据流(包括视频,传感器或搜索查询)并快速将数据传送回用户,因此提供实时人工智能变得越来越重要。
 

Stratix 10 FPGA和SoC FPGA使用了英特尔14nm制程工艺

在发布的博客中,微软详细介绍了采用英特尔FPGA的Project Brainwave平台如何以“前所未有”的高性能来灵活处理极具挑战性的深度学习模型。微软在2017年高效能芯片大会(Hot Chips 2017)上展示了基于FPGA的深度学习平台,该盛会主要展示半导体技术领域中的最新成就。微软是第一家在其公有云基础设施中部署FPGA的大型云服务提供商,而其通过英特尔Stratix 10 FPGA实现的技术进步加速了深度神经网络(DNN),这种网络可以通过概念类似的方式复制人类大脑的“思维”。

人工智能是一个快速发展的领域,需要多种技术来有效管理各种工作负载的需求。英特尔提供广泛的技术以推动市场演进,包括英特尔至强®处理器,英特尔®FPGA和英特尔Nervana™ ASIC技术。与那些为运行单个工作负载而优化的专用深度学习硬件加速器相比,英特尔FPGA的高度灵活性让用户可以自定义硬件以满足特定的工作负载需求,并可以随着深度学习工作负载和使用模式的更改而快速地重新配置硬件。英特尔Stratix 10 FPGA结合了硬化处理器模块,这种模块可提供高水平的持续性能和效率,并可根据用户的自定义来灵活的编程。

许多硅人工智能加速器目前需要将多个请求分组(称为“批处理”)以实现高性能。微软的Project Brainwave平台利用英特尔Stratix 10技术,在单个请求上展示了超过每秒39万亿次浮点运算的性能,在云中确立了实时人工智能计算的新标准。Stratix 10 FPGA为实时人工智能计算确立了新的云性能标准,具有创纪录性的低延迟、高性能以及无需批量处理人工智能请求的多种特点。

微软研究院NexT的著名工程师Doug Burger说:“我们利用英特尔FPGA的高度灵活性快速整合创新,同时提供与许多基于ASIC的深度学习处理单元相当或更高的性能。微软正努力在Azure云中部署Project Brainwave,以便客户最终能够以创纪录式的高性能运行复杂的深度学习模型。”

通过加速模型训练、快速评分和高度可扩展的基础设施,基于英特尔技术的机器学习平台将数据转化为可操作的商业智能。结合最新的英特尔至强可扩展处理器,英特尔FPGA可自定义和编程以提供低延迟和灵活的精度,与单独的英特尔®至强™处理器相比,在深度学习推理方面每瓦特功耗具有更高的性能。

欲更详细地了解英特尔全面的人工智能解决方案产品组合,请访问
www.intel.com/ai.

关于英特尔
英特尔致力于拓展科技疆界,让最佳精彩体验成为可能。如需了解更多信息,如需了解更多信息,请访问英特尔中国新闻中心newsroom.intel.cn 以及官方网站intel.cn。