商业日报网

滚动新闻:
·斩获颇丰!华谊兄弟率先披露 ·广州白云机场等重要口岸开启广交会专用通道 ·光伏业务快速发展,天合光能前三季度净利增超89% ·广州消费品工业兴旺化妆品工业年产值逾千亿元 ·如何看A股10月开门走势?多项数据传递出积极信号 ·汽车和汽车零部件行业周报:新势力销量高增,关注三季报优质个股-23100 ·研报掘金丨华鑫证券:天岳先进临港厂产能加速释放,在手订单充足 ·金价涨势暂歇!2023年10月8日各大金店黄金价格多少钱一克? ·物流运行迎来“金九”9月份中国物流业景气指数达到53.5% ·山东泰安公积金新政:认房不认贷,无房职工可提取公积金付房租 ·金盘科技“绿色低碳高效节能新能源装备和新材料智能制造产业园”正式开工 ·中国男篮已无优势可言,“大手术”迫在眉睫 ·达来:扎根基层的环保人 ·百家机构调研股出炉,明星基金节后建仓潜力股曝光!芯片博士“最后的爱股”曝 ·中国中免H股遭摩根大通减持A股机构持股数量大幅减少 ·10月7日-珠三角谷物行情快讯 ·终结九连跌黄金周黄金遭遇“黄金劫” ·乡村行·看振兴小酸枣大产业科技助力山西临县枣产业高质量发展 ·云南铁路中秋国庆假期发送旅客373万人次刷新单日客流纪录 ·福州机场“双节”假期出入境客流同比增长481% 

成本降低12倍!英伟达升级版大模型芯片明年投产,黄仁勋:AIGC时代来了

来源:中国网    发布时间:2023-08-09 13:35:48   阅读量:8909   

美国AI芯片巨头英伟达发布数据中心领域重磅芯片,剑指竞争对手AMD。

当地时间8月8日,英伟达CEO黄仁勋身穿经典皮衣,在计算机图形学顶会SIGGRAPH 2023现场发布新一代GH200 Grace Hopper超级芯片,并宣布将在2024年第二季度投入生产。GH200专为人工智能大模型设计,用于扩展全球的数据中心。

黄仁勋表示,生成式AI时代来临,英伟达将继续大力推动生成式AI发展的决心。

《华尔街日报》指出,这是英伟达对于AI数据中心芯片市场最大竞争对手AMD的“反击”,英伟达此前就已经预告将发布与AMD的Insight MI300X CPU + GPU对打的产品,后者是今年6月AMD刚刚发布的大模型专用芯片。

GH200超级芯片将于明年投入生产,较H100更强

GH200全球首发采用HBM3e高带宽内存,与英伟达目前最高端的AI芯片H100使用同样的GPU,但不同之处在于,GH200将同时配备高达141G的内存和72核ARM中央处理器,每秒5TB带宽。和现有Grace Hopper型号相比,最新版本的GH200超级芯片能够提供3.5倍以上的内存容量和3倍以上的带宽。和H100相比,GH200超级芯片的内存增加了1.7倍,带宽增加了1.5倍。全新一代的GH200预计明年二季度开始生产。

黄仁勋表示,一台服务器可以同时装载两个GH200超级芯片,大型语言模型的推理成本将会大幅降低。

据介绍,投资800万美元Grace Hopper,就相当于8800个价值1亿美元的x86 GPU,意味着成本降低12倍,能耗降低20倍。

GH200专为加速计算和生成式AI时代而打造,以巩固英伟达在AI界的主导地位,应对其老对手AMD于6月推出的数据中心APUInstinct MI300系列的更新。

更厉害的地方在于,在内存和运算能力得到大幅度提升的基础上,GH200超级芯片还可以基于NVLink技术继续拓展互连,让GPU有能力访问全部的CPU内存,帮助客户减少机器数量并更快地完成工作。为了突出产品的这一特性,黄仁勋在演讲中屡次幽默地重复自己的口头禅:“你买得越多,就省得越多。”

“任何人都可以成为程序员”

在本次演讲中,生成式AI成为了被黄仁勋挂在嘴边的一大关键词。他在演讲中展示了图像和AI之间的不可分割性,表示AI既能够在虚拟世界中学习,也能够帮助搭建虚拟世界。

“大型语言模型是一个新的计算平台……人类就是新的编程语言,我们已经使计算机科学民主化,现在任何人都可以成为程序员,”黄仁勋在会议上说道,“时隔15年左右,终于有新的计算平台出现了,计算机本身必然会以截然不同的方式处理信息。”

美国科技媒体TechCrunch评价道,作为一款最新的、专门面向数据中心的AI开发硬件,在性价比高且耗能低的GH200即将推出的当下,再花费数百万美元为CPU机架等上一代计算资源进行投资研发将成为一种愚蠢的行为。虽然黄仁勋并未在演讲中提及AI目前面临的许多挑战、监管乃至概念上的变化,但他为观众展现了一个属于AI的积极前景。

英伟达的工作站GPU系列也借本次发布会全面上新,一口气推出了4款新品:RTX 6000、RTX 5000、RTX 4500和RTX 4000。其中,性能最强的RTX 6000具有48GB的显存,18176个CUDA核心,568个Tensor核心,142个RT核心,和高达960GB/s的带宽。

针对企业客户,英伟达还为RTX 6000推出了最新的一站式解决方案RTX工作站。新的RTX工作站由英伟达和BOXX、戴尔科技、惠普和联想合作推出,支持最多4张RTX 6000 GPU,可以在15小时内完成8.6亿token的GPT3-40B的微调。

第三方开发者平台接入AI超算服务

对于开发者而言,英伟达将发布的全新统一工作空间是一个值得关注的话题。该空间被命名为NVIDIA AI Workbench,能够为开发者提供一个统一、易用的工作空间,使他们有能力在个人电脑或工作站上快速创建、测试和微调生成式 AI 模型,然后将这些模型扩展到几乎所有数据中心、公有云或 DGX Cloud。

OpenUSD的开发也是本次演讲中的重点内容。就在本次演讲一周前的8月1日,美国3D内容行业的5家主要公司苹果、英伟达、皮克斯、Adobe和Autodesk联合成立了OpenUSD联盟。OpenUSD技术是英伟达Omniverse平台的基础,可能会成为未来“元宇宙”的3D图形标准。

黄仁勋在演讲中宣布了英伟达 Omniverse 平台的重要更新,将为开发者、企业和行业带来新的基础应用和服务,使他们能够使用OpenUSD 框架和生成式AI优化改进3D流程。

另外,英伟达将发布四款全新Omniverse Cloud API,包括RunUSD、ChatUSD、 DeepSearch 和 USD-GDN Publisher,使开发者能够更加流畅地实施和部署 OpenUSD流程和应用。

合作伙伴方面,英伟达正在与人工智能初创公司Hugging Face展开合作,将支持Hugging Face名为“作为服务的聚类训练”的项目,简化企业创建新生成式AI模型的过程,这也意味着开发人员可以在Hugging Face平台上直接使用英伟达的超算服务。

5月25日,英伟达发布截至4月30日的2024财年第一季度财报,收入为71.9亿美元,高于市场预期的65.2亿美元,与上年同期的82.88亿美元相比下降13%,与上一财季的60.51亿美元相比增长19%。

Wind数据显示,英伟达2023年迄今的涨幅达到205.71%。或许是受到美股大盘集体走弱影响,英伟达美东时间8月8日股价低开低走,收跌1.66%,报446.64美元,总市值1.10万亿美元。英伟达将于太平洋时间8月23日发布截至2023年7月30日的2024财年第二财季财报。

【免责声明】 凡本站未注明来源为(商业日报网)的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。其他媒体、网站或个人转载使用时必须保留本站注明的文章来源,并自负法律责任。

热文推荐

首页 | 焦点| 业界| 财经| 企业| 消费| 行业| 股票| 视窗| 商业| 经贸| 产业| 资讯

Copyright @ 2010- 备案号:鄂ICP备2021013412号-3 网站地图