为ChatGPT提速10倍!芯片巨头放大招:AI的“iPhone 时刻”已来

2 个月前25.3k
“切勿错过AI的决定性时刻!”

在AI浪潮扑面而来之际,芯片巨头英伟达再次丢出“核弹级“产品,并高呼“切勿错过AI的决定性时刻!”。

当地时间周二,英伟达举办2023年春季GTC大会,CEO黄仁勋向开发者披露最新的硬件和AI应用软件进展。会上,他不仅多次提到生成式AI和ChatGPT,而且多次表示AI的“iPhone时刻”已经来临。

此外,还围绕AI、量子计算、芯片等前沿科技,发布了一系列超级重磅的技术和产品。


AI的“iPhone 时刻”已来


“我们正处在AI的iPhone时刻,初创公司竞相构建具有颠覆性的产品和商业模式,而老牌公司则在寻求应对之法,生成式AI引发了全球企业制定AI战略紧迫感,”

黄仁勋表示,近四十年来,摩尔定律一直是引领计算机行业动态发展的重要规律,而计算机行业又影响着各行各业的发展,但在成本和功耗不变的情况下,性能的指数级增长已经放缓。

然而,计算技术的发展日新月异,曲速引擎是加速计算,动力来源就是AI。各行各业正在应对可持续发展、生成式AI和数字化等强大的动态挑战,因此加速计算和AI的到来恰逢其时。

黄仁勋表示,在过去十年中,加速和纵向拓展的结合,使我们能够为许多应用实现百万倍性能提升,进而有助于解决以前无法解决的问题。虽然存在很多示例,但最著名的一个是深度学习。

加速计算并非易事,2012年,计算机视觉模型AlexNet动用了GeForce GTX 580,每秒可处理262 PetaFLOPS。该模型引发了AI技术的爆炸。”“十年之后,Transformer出现了,GPT-3动用了323 ZettaFLOPS的算力,是AlexNet的100万倍,创造了ChatGPT这个震惊全世界的AI。崭新的计算平台出现了,AI的‘iPhone时刻’已经来临。”


为ChatGPT提速10倍!


在黄仁勋的主题演讲中发布了全新的GPU推理平台。

该平台包括4种不同配置,针对不同工作负载进行优化,分别对应了AI视频加速、图像生成加速、大型语言模型(LLM)加速和推荐系统和LLM数据库。包括:L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超级芯片。

据悉,H100 NVL专门为LLM设计的GPU,采用了Transformer加速解决方案,可用于处理ChatGPT。

“当前唯一可以实际处理ChatGPT的GPU是英伟达HGX A100。与前者相比,现在一台搭载四对H100和双NVLINK的标准服务器速度能快10倍,可以将大语言模型的处理成本降低一个数量级。”

另外,英伟达最新确认,H100 NVL预计将在今年下半年上市。

另外,L4是针对AI生成视频的通用GPU,用于加速AI视频,可以提供比CPU高120倍的性能,能效提升约99%。

 L40则是用于图像生成,针对2D、3D图像生成进行优化,并可以结合Omniverse,直接生成3D内容,甚至是元宇宙内容。其性能是英伟达最受欢迎的云推理GPU T4的10倍。

Grace Hopper超级芯片则是为推荐系统和大型语言模型AI数据库设计的。可用于图推荐模型、向量数据库和图神经网络。它可以通过900GB/s的高速一致性芯片到芯片接口连接英伟达Grace CPU和Hopper GPU。


还有这些重磅产品


除此之外,在GTC大会上,英伟达还发布了AI超级计算服务DGX Cloud、突破性的光刻计算库cuLitho、云服务NVIDIA AI Foundations等,以及与Quantum Machines合作推出了全球首个GPU加速量子计算系统。

其中,DGX Cloud提供了专用的 NVIDIA DGX AI超级计算集群,用户能够按月租用这些计算资源,并使用简单的网络浏览器访问。从而消除在本地获取、部署和管理基础设施的成本,大大增加了AI的便捷性。

该服务目前已经与Microsoft Azure、Google GCP和Oracle OCI开展合作。每个DGX Cloud实例都具有八个H100或A100 80GB Tensor Core GPU,每个节点共有640GB GPU内存。

另外,发布的光刻计算库cuLitho可将计算光刻加速40倍以上。

“计算光刻是芯片设计和制造领域中最大的计算工作负载,每年消耗数百亿CPU小时。大型数据中心24x7全天候运行,以便创建用于光刻系统的掩膜板。这些数据中心是芯片制造商每年投资近2000亿美元的资本支出的一部分。”

据悉,全球最大晶圆厂台积电、全球光刻机霸主阿斯麦、全球最大EDA巨头新思科技均参与合作并引入这项技术。该计划旨在加快制造光掩模的任务,光掩模是塑造光投射到硅晶片上以制造电路的方式的屏幕。 

最新发布的全新云服务及代工厂NVIDIA AI Foundations包括语言、视觉和生物学模型制作服务。

另外,英伟达还推出了量子计算。英伟达与Quantum Machines合作推出了一个量子控制链路。它可将英伟达GPU连接到量子计算机,以极快的速度进行纠错。据悉,NVIDIA DGX Quantum是全球首个GPU加速的量子计算系统,可以实现GPU和量子处理单元(QPU)之间的亚微秒级延迟。

相关股票

US 英伟达

相关主题/热点

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

App内直接打开
商务、渠道、广告合作/招聘立即咨询

相关文章

华硕推出基于AI的服务,助力企业探索生成式AI潜力

· 37分钟前

cover_pic

格隆汇公告精选︱建发股份:拟以62.86亿元购买红星控股所持美凯龙29.95%的股份;佰维存储:产品未涉及ChatGPT等人工智能领域,未进行过英伟达GPU等产品的导入认证

· 1小时前

cover_pic

每日行业复盘|2023.06.01

· 1小时前

cover_pic
我也说两句
手机号码
+86
验证码
* 微信登录请先绑定手机号,绑定后可通过手机号在APP/网站登录。
绑定

绑定失败

该手机号已注册格隆汇账号,您可以选择合并账号。

关于合并:

1.合并后可使用手机号或微信快捷登录;

2.仅保留手机账号信息,清除原有微信账号信息;

3.付费权益将同步至手机账号;

4.部分特殊情形可能导致无法合并;

合并
返回上一步
确认您合并的手机号
获取验证码输入后提交合并账号
合并