你的GPT跟ChatGPT可能只差了一个DPU_环球热点评
“人类永远不会嫌网络太快,就像永远不会嫌高铁太快,你只会嫌它慢,希望它更快些。”
【资料图】
一个月内,百度、阿里、腾讯、商汤、讯飞、360等国内大厂扎堆发布“中国版 GPT ”,这家的名字还没记清楚,另一家的又蹦了出来,一时间 AI 大模型“诸神混战”。可实话实说,和 ChatGPT 相比,国内的 GPT 还存在一定差距,但大家对于 AI 的狂热渴求已经被点燃,越来越多的企业意识到, AI 这班车,再不上,就来不及了。
01
大语言模型的成功与挑战
以 GPT 系列模型为代表的大语言模型成为近来最受关注的技术之一。
图 | OpenAI-ChatGPT
ChatGPT 凭什么落别人那么远?
模型越大, AI 回馈的效果越好。 OpenAI 的 GPT-1 模型有50亿个参数, GPT-3.5 有1750亿个参数,到现在的 GPT-4 预计将有超过一个T的参数。可以看出参数是成倍甚至成指数级增长。这种增长模型的变化,首先对内存性能有着极高要求,因为训练它需要海量数据,同时需要处理海量数据集;此外,是数据中心的计算能力,还有 GPU 与 CPU 之间的通信;更重要的是网络的带宽,这些因素将决定大语言模型的整体性能。
整体性能决定了大模型运行、训练所需的时长,也决定了对大模型后续调优再训练的周期。比如你的大语言模型训练需要6个月,一年可能最多训练2次,而别人训练只需要2或3个月,一年就可以训练多次,那么最后 AI 的迭代效果是完全不一样的。
图 | NVIDIA
如今,不只是提出大语言模型的公司,越来越多的企业已经意识到 AI 可能会优化工作流程或是给客户提供相应的服务,大家纷纷开始尝试做自己的产品。但一旦大家都在这个模型的基础上去做,就会遇到吞吐量和性能的瓶颈。要支撑这么一个大模型做训练,投入成本是非常高的。
图 | NVIDIA
此外还有电力的限制,能做大模型训练的数据中心的功耗和电力需求是非常大的,且增长趋势明显。数据显示,数据中心一年消耗电力200 T瓦时,也就是2000亿度电,占全球电力使用量的2%。2000亿度电是什么概念?2021年我国三峡水电站发电量为1036亿度,也就是三峡水电站两年发的电量才够全球数据中心用一年。而随着 AI 数据中心的部署和持续增长,到2030年,全球电力使用的预测份额将达到5%,这将为全球能源、环保、碳排放等带来巨大挑战。
02
你跟ChatGPT可能只差了一个DPU
在 AI 的竞赛中,有两种方式:第一种是用资源去堆,就像造车一样,后造车的永远要比先造车的人烧更多的钱去打市场;第二种是在同等资源下,比谁快,快就需要效率,而提高效率就需要 DPU 。
微软此前发布的博客透露了 OpenAI 的 ChatGPT 采用的硬件是基于 NVIDIA 智能网卡和 InfiniBand 200G 网络所做的产品,未来也有意部署 DPU 。
图 | 微软官博
而为了应对 AI 模型训练、推理带来的需求和挑战, NVIDIA 近日发布了其最新一代数据处理器 BlueField-3 DPU ,并宣布全面量产。
图 | NVIDIA
NVIDIA 创始人兼首席执行官黄仁勋先生表示, AI 时代需要云数据中心基础设施来支持非凡的计算需求。“ NVIDIA BlueField-3 DPU 实现了这一进步,将传统的云计算环境转变为加速、节能和安全的基础设施,以处理生成 AI 的苛刻工作负载。”
据 NVIDIA 介绍, BlueField-3 DPU 是一款专为数据中心设计的、软件定义、硬件加速的云服务计算平台。它集成了高达16个计算核心,可提供高达400Gbp/s的网络带宽,并且支持多种协议和功能,包括网络虚拟化、弹性负载均衡、数据中心互连等。 BlueField-3 DPU 还拥有世界领先的存储加速功能,可提供高达1.6Tbp/s的存储带宽,并支持 NVMe-over-Fabric 和 RDMA 等高性能存储协议。
大语言模型背后的硬件构成是怎样的?各家都不同。以 NVIDA DGX 为参照,支持大语言模型的服务器由8颗 NVIDIA 高性能 GPU 、4个 NVIDIA NVSWITCHES 、2颗x86 CPU、9块 NVIDIA BlueField-3 DPU 、2T DDR5内存、PCIe Gen5.0,以及服务器间的 NVIDIA Quantum-2 InfiniBand 网络构成。
其中 NVIDIA BlueField-3 DPU 发挥了怎样的作用?首先是加速性能:NVIDIA BlueField-3 DPU 具有丰富的硬件加速器,可以满足大语言模型严格的性能要求,并运行苛刻的工作负载;其次,云规模效率:NVIDIA BlueField-3 DPU 可以释放 CPU 核心,使大语言模型应用具有更好的性能和可扩展性,提升服务器的效率和能效,降本增效;第三是强大的零信任安全:安全的基础设施都可以运行在 NVIDIA BlueField-3 DPU 之上,并基于此构建零信任安全模型,在不影响性能的情况下,确保数据中心安全;第四是完全可编程的基础设施:NVIDIA DOCA 2.0 体现了 NVIDIA BlueField-3 DPU 的软件可编程性,借助 NVIDIA BlueField-3 DPU 可以获得完全可编程的加速数据中心平台。
图 | NVIDIA
简单地说,NVIDIA BlueField-3 DPU 可以提升整个网络性能,配合高算力 GPU ,可以支撑更大规模的大语言模型训练,从而缩短训练时间。根据模型需求动态调整部署以共享算力资源,并应对不同规模的模型训练;提升服务器能效、释放算力资源,用更少的服务器完成更多的任务,从而帮助企业实现节能环保、降本增效。
据 NVIDIA 介绍,大语言模型和生成式AI主要会构建在云基础设施之上,以云服务的方式服务于市场,因此,DPU 会主要应用于云服务提供商、AI 技术公司以及采用 AI 技术的企业。据悉,NVIDIA BlueField-3 DPU 已经在部分国内公有云服务提供商进行测试,后续会逐步开始采用。
在不久前的 GTC 2023 大会上,NVIDIA 创始人兼首席执行官黄仁勋先生坚定表示“ AI 迎来了‘ iPhone 时刻’”,回想当年苹果手机刚问世,当时的用户还都想着手机不就是用来打电话、发短信的?而今天,我们几乎已经遗忘了当时的想法和其他手机。同样,你会发现生活将慢慢被 AI 改变。
*声明:本文为MetaPost原创,如需转载请联系我们。未经允许严禁转载,文章版权及最终解释权归MetaPost所有。
END
标签:
你的GPT跟ChatGPT可能只差了一个DPU_环球热点评
2023-04-22
世界速看:距官宣仅3天 理想汽车首批4C超充站投入运营!
2023-04-22
淄博“信托”也火爆调查:并非“秒光” 不过近期好卖多了
2023-04-22
渤海千亿方大气田海底管线铺设完成 创我国最高压力、渤海油气田最长距离等多项纪录_世界动态
2023-04-22
世界关注:买手与商品 | 不同公司商品企划的商品逻辑异同点在哪里?
2023-04-22
英国首相办公室:苏纳克与吉布提总统就苏丹局势进行了交谈,并敦促立即停止敌对行动 当前滚动
2023-04-22
每日观察!北方华创董事长赵晋荣: 着力打造规范透明高效国有上市公司形象
2023-04-22
当前关注:张勇放狠话:哪吒GT三个月后单月销量超所有两门跑车
2023-04-22
隔夜美股 | 三大指数上涨 Lyft(LYFT.US)涨超6%
2023-04-22
房车游并非“说走就走”
2023-04-22
世界速看:距官宣仅3天 理想汽车首批4C超充站投入运营!
淄博“信托”也火爆调查:并非“秒光” 不过近期好卖多了
渤海千亿方大气田海底管线铺设完成 创我国最高压力、渤海油气田最长距离等多项纪录_世界动态
世界关注:买手与商品 | 不同公司商品企划的商品逻辑异同点在哪里?
英国首相办公室:苏纳克与吉布提总统就苏丹局势进行了交谈,并敦促立即停止敌对行动 当前滚动
每日观察!北方华创董事长赵晋荣: 着力打造规范透明高效国有上市公司形象
当前关注:张勇放狠话:哪吒GT三个月后单月销量超所有两门跑车
隔夜美股 | 三大指数上涨 Lyft(LYFT.US)涨超6%
房车游并非“说走就走”
淮河能源:4月21日融资买入832.85万元,融资融券余额3.56亿元|世界消息
梅赛德斯-奔驰Q1初步息税前利润为55亿欧元
世界热点评!将于4月24日开启预订 新款吉利ICON主角官图发布
卸甲归田和解甲归田 解甲归田的读音 聚看点
速读:天开园:一场大学与城市的“双向奔赴”
天天消息!智慧养鸡养出乡村振兴“产业数字化”新模式
铃兰花怎么种植-铃兰花怎么种 天天速递
量身定制育骨干 加油充电再出发——2023年株洲市党员教育工作骨干培训班侧记-环球聚看点
每日热门:美人无泪电视剧剧情_美人无泪简介
全球新消息丨港股21日跌1.57% 收报20075.73点
柯克兰辅酶q10好吗?|全球今日讯
水培玉米苗养殖方法 水培玉米苗图片
中超·前瞻|客战成都蓉城,沧州雄狮力争首胜
范从来:坚持健康优先,才能实现高质量发展-当前消息
快播:中汽协:3月商用车产销均完成43.4万辆 环比分别增长37.1%和34.2%
今年杭州已新增地铁出入口非机动车停车位4660个!
4月21日获机构调研最多的10只股票_环球快播报
“寻找聪明公司”系列活动生命科学专场在北京举行
去日本签证最新政策_去日本
两项新国标公布 "快递单"信息保护有了新标准 当前热门
- 当前热门:平舆县辛店乡:三举措让监测帮扶政策入民心
- 紧扣“地方特色” 更多优质旅游产品出炉
- 全球时讯:恒瑞医药一季度营收、净利同比均止跌回升 业绩拐点来了?
- 转专业申请理由800字(转专业申请理由)
- 天天快看:车间员工述职报告范文(汇总32篇)
- [快讯]天治转型升级混合公布第一季报 十大重仓股
- 全方位护航广电行业发展,维谛技术(Vertiv)为客户创造高价值体验
- 期货交易夜读所谓交易系统,就是经过观察实践练就的一套策略
- 致力于为车企、自动驾驶一站式数据解决方案,恺望数据完成新一轮战略融资
- 华丽家族(600503):4月21日技术指标出现观望信号-“黑三兵”
- 富宝资讯_焦点快看
- 中国移动(00941)申请增设人民币柜台_世界新资讯
- 五年级算式题大全 五年级解方程算式
- 海蜇皮的功效与作用 海蜇皮什么人不能吃_海蜇皮的功效与作用、禁忌和食用方法
- 欧洲最危险的男人
- 全球新资讯:杭州推公共交通出行优惠:学生半价,地铁公交换乘再优惠
- 英国副首相兼司法大臣多米尼克·拉布宣布辞职
- 统计局:一季度全国分省市粗钢产量出炉,河北增21.47%
- 新鞋子磨脚怎么办小妙招用醋_新鞋子磨脚怎么办_当前独家
- 强兵出阵 广汽本田全面加速电动化战略
- 环球动态:刺激买气,兰博基尼小牛推出60周年纪念版,值得抢吗?
- 观焦点:欧洲足球俱乐部排名国家_欧洲足球俱乐部排名
- 四川兴文县:苗族群众欢度花山节
- 民生加银基金蔡晓:A股稳健向上的确定性相对更强 每日简讯
- 6%数量“撬动”20%产值 上海汽车行业继续在智造上“深耕细作”|全球热资讯
- 热点在线丨ChatGPT新逆天功能曝光!GPT-4迎来AGI历史性时刻!
- 大同市气象局发布道路结冰黄色预警【Ⅲ级/较重】
- 环球今热点:米兰双雄很受伤!尤文-15分暂时被拿回 排名升至第3 米兰掉出前4
- 媒体宝马拒绝的是3162亿中国市场 宝马MINI你只会道歉吗
- 哈登直接被驱逐?美记吐槽:整笑了 该被驱逐的是这些傻X裁判 今日快看
- 河南气象快报:今天夜里河南多云转阴天 局地雷暴大风
- 当前热议!欠人人贷18年不还法院强制执行怎么办
- 金水区全面开展安全生产督导检查
- 27°黔地标:为什么创作《隐秘的船》这部小说?_天天新要闻
- 公司问答 | 空港股份:华大基因是公司的发起人之一,公司不直接或间接持有华大基因股份
- 韩国总统暗示有意向乌提供武器?克宫:表示遗憾
- 每日动态!西安极氪001过火,极氪回应:初步排除动力电池引发事故
- 深圳多家大行:尚未接到正式通知,目前仍按参考价办理按揭
- 有什么好用的日文输入法_最好用的日文输入法_环球快资讯
- 当前播报:西南证券:给予华锦股份买入评级,目标价位8.58元
- 【天天时快讯】宜兴丁蜀蓄力打造国际化非金属材料特色产业高地
- 你应该早上5点起床并坚持30天:这里是10个理由
- 输了比赛的汗水,才是青春啊|环球今日报
- 会涨的牛股均有一个好看的k图
- 冀凯股份:提请股东大会授权董事会,公司拟定增募资不超3亿元
- 樊振东:总结新乡表现要敢于和对手相持 期待和A-勒布伦激烈对抗
- 热点评!中华不振的原因和历史背景_为什么 ldquo 中华不振 rdquo
- 海南一贲门失弛缓症患者反复呕吐多年 POEM微创手术精准除病痛[图]-全球快消息
- 全国建筑市场监管公共服务平台_河南建筑市场监管公共服务平台_当前热文
- 绿军再胜2-0老鹰!塔图姆29+10+6怀特26+7吹杨24分|环球看热讯
