志在指尖
用双手敲打未来

华为版 ChatGPT“盘古 Chat”7 月 7 日发布

IT之家6月4日音讯,钛媒体从华为内部独家得悉,华为公司将发布一款直接对标ChatGPT的多模态千亿级大模型产品,名为“盘古Chat”。
据介绍,盘古大模型于2020年11月在华为云内部立项成功。这款“盘古Chat”估计将于今年7月7日举行的华为云开发者大会(HDC.Cloud2023)上对外发布以及内测,产品首要面向ToB/G政企端客户。
依据华为发布的一份论文数据显现,华为盘古PanGu-Σ大模型参数最多为1.085万亿,依据华为自研的MindSpore结构开发。全体来看,PanGu-Σ大模型在对话方面可能已接近GPT-3.5的水平。
IT之家查询公开资料得悉,华为盘古大模型于2021年4月正式对外发布,后来又在2022年4月升级到2.0版别。现在,AI大模型中的NLP大模型、CV大模型以及科学核算大模型(气候大模型)均已被标记为行将上线状况。
据介绍,这是首个千亿参数中文预练习大模型,CV大模型则初次到达30亿参数。盘古CV大模型业界最大CV大模型、初次完成统筹判别与生成才能、在ImageNet上小样本学习才能上的业界榜首;盘古气候大模型提供秒级天气预报;紫东.太初是全球首个图、文、音三模态大模型。
对于盘古大模型定位,华为内部团队确立了三项最要害的中心规划原则:一是模型要大,能够吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化才能,能够真正落地到各行各业的工作场景。ChatGPT
依据华为云高管的讲演PPT信息,现在华为“盘古系列AI大模型”基础层首要包括NLP大模型、CV大模型、以及科学核算大模型等,上层则是与合作伙伴开发的华为行业大模型。
华为云官网显现,盘古大模型由NLP大模型、CV大模型、多模态大模型、科学核算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发形式下不能解决的AI规划化、产业化难题,能够支撑多种自然语言处理使命,包括文本生成、文本分类、问答体系等等。
详细来看,盘古NLP大模型初次使用Encoder-Decoder架构,统筹NLP大模型的理解才能和生成才能,保证了模型在不同体系中的嵌入灵活性。下流使用中,仅需少数样本和可学习参数即可完结千亿规划大模型的快速微谐和下流适配,这一模型在智能舆论以及智能营销方面都有不错的体现。
盘古NLP大模型
盘古CV大模型是初次完成模型按需抽取的业界最大CV大模型,初次完成统筹判别与生成才能,依据模型巨细和运转速度需求,自适应抽取不同规划模型,AI使用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的才能获得了显著提高,到达业界榜首,这一模型在智能巡检以及才智物流方面有不错的体现。
盘古CV大模型
盘古气候大模型提供秒级天气预报,借助创新的3DEST网络结构以及分层时间聚合算法,在气候预报的要害要素和常用时间范围上精度均超越当前最先进的预报办法,速度比较传统办法提高1000倍以上。同时,盘古气候大模型支撑广泛的下流预报方案,如在飓风路径猜测使命上,比较传统数值气候预报办法,盘古气候大模型能够降低20%以上的位置差错。
盘古气候大模型
浙商证券此前披露的信息显现,华为在练习千亿参数的盘古大模型时调用了超越2000块的昇腾910芯片,进行了超2个月的数据练习才能。华为内部称,每年大模型练习调用GPU/TPU卡超越4000片,3年的大模型算力成本高达9.6亿元人民币。
东吴证券整理的华为盘古大模型产业链研报中指出,华为盘古大模型的优势在于人才储备和算力自主可控,有望成为国内抢先的大模型,其生态产业链标的有望迎来加快开展,包括拓维信息、四川长虹、麒麟软件(我国软件)、统信软件(诚迈科技)、麒麟信安等华为生态公司。国盛证券则认为,华为盘古为首个多模态千亿级大模型,有望赋能百业。

未经允许不得转载:IT技术网站 » 华为版 ChatGPT“盘古 Chat”7 月 7 日发布
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!

 

志在指尖 用双手敲打未来

登录/注册IT技术大全

热门IT技术

C#基础入门   SQL server数据库   系统SEO学习教程   WordPress小技巧   WordPress插件   脚本与源码下载