百度文心大模型源于产业、服务于产业,是产业级知识增强大模型。百度通过大模型与国产深度学习框架融合发展,打造了自主创新的AI底座,大幅降低了AI开发和应用的门槛,满足真实场景中的应用需求,真正发挥大模型驱动AI规模化应用的产业价值。

文心大模型的一大特色是“知识增强”,即引入知识图谱,将数据与知识融合,提升了学习效率及可解释性。文心ERNIE自2019年诞生至今,在语言理解、文本生成、跨模态语义理解等领域取得多项技术突破,在公开权威语义评测中斩获了十余项世界冠军。2020年,文心ERNIE荣获世界人工智能大会WAIC最高奖项SAIL奖。

百度文心大模型团队

百度文心大模型的团队代表人物:

王海峰

百度CTO,深度学习技术及应用国家工程研究中心主任。

先后创建和发展了自然语言处理、知识图谱、语音、图像、机器学习和深度学习等百度人工智能技术方向,先后负责百度搜索、百度地图、百度翻译、百度智能云等业务。

吴甜

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任。

负责百度人工智能技术平台与生态,涵盖自然语言处理、知识图谱、计算机视觉、增强现实、飞桨深度学习平台(PaddlePaddle)、百度大脑开放平台等。

马艳军

百度深度学习技术平台部高级总监、百度AI技术生态总经理。

总体负责飞桨(PaddlePaddle)开源深度学习平台的产品和研发工作。

文心基础大模型

文心 · NLP大模型

面向语言理解、语言生成等NLP场景,具备超强语言理解能力以及对话生成、文学创作等能力。创新性地将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化。

包括:ERNIE 3.0 Zeus(基于知识增强的千亿模型)、ERNIE 3.0、鹏城-百度·文心(全球首个知识增强超大模型,参数规模2600亿)、ERNIE 3.0-Tiny(首个基于多任务知识注入的下游无关蒸馏模型)等。

文心 ·CV大模型

基于领先的视觉技术,利用海量的图像、视频等数据,为企业和开发者提供强大的视觉基础模型,以及一整套视觉任务定制与应用能力。

包括:VIMER-CAE(视觉自监督预训练模型)、VIMER-UFO(视觉多任务统一大模型)、VIMER-StrucTexT(端到端文档OCR表征学习预训练模型)、VIMER-UMS(行业首个统一视觉单模态与多源图文模态表征的商品多模态预训练模型)

文心 · 跨模态大模型

基于知识增强的跨模态语义理解关键技术,可实现跨模态检索、图文生成、图片文档的信息抽取等应用的快速搭建,落实产业智能化转型的AI助力。

文心·生物计算大模型

融合自监督和多任务学习,并将生物领域研究对象的特性融入模型。构建面向化合物分子、蛋白分子的生物计算领域预训练模型,赋能生物医药行业。

包括:HelixGEM-2(业界首个考虑原子间多体交互、长程相互作用的模型)、HelixFold-Single(秒级别的蛋白结构预测模型)、HelixFold(蛋白结构分析模型)等。

行业大模型

文心大模型与各行业企业联手,在通用大模型的基础上学习行业特色数据与知识,建设行业AI基础设施。

包括:国网-百度·文心(国家电网)、浦发-百度·文心( 浦发银行)、航天-百度·文心(中国探月与航天工程)、人民网-百度·文心(人民网)、冰城-百度·文心(哈尔滨)等

文心大模型产品

文心一言

类似ChatGPT的项目,英文名ERNIE Bot。

于2023年8月31日向全社会全面开放,公众可以通过“文心一言APP”或登陆“文心一言官网”(https://yiyan.baidu.com)使用。

文心一格

飞桨文心一格是百度推出的AI艺术和创意辅助平台,让用户实现一语成画,只需输入一段创想文字,即刻生成创意精美的画作。

文心百中

百度搜索与文心大模型联合研制的产业级搜索系统。

文心大模型API

  • ERNIE 3.0 文本理解与创作:语言理解、语言生成等NLP场景
  • ERNIE-ViLG AI作画:跨模态文生图场景
  • 文心 PLATO 对话生成:开放域对话

相关导航

暂无评论

暂无评论...