当前位置: 首页 > 资讯 > >正文

观点:《数字经济洞察周报》2023年第17期 | 谷歌发布PaLM 2模型,科大讯飞发布星火认知大模型

来源:至顶头条    时间:2023-05-13 16:56:07
全文约1900字 阅读约需5分钟

谷歌I/O大会发布PaLM 2模型

5月10日,谷歌I/O大会发布PaLM 2模型,PaLM 2改进了数学、代码、推理、多语言翻译和自然语言生成能力,利用谷歌最新TPU算力基础设施提升了训练速度,PaLM 2模型在逻辑和推理方面比以往模型更加强大。构建方式是将计算、优化扩展、改进的数据集混合以及模型架构改进结合在一起,服务效率更高。PaLM 2模型提供不同尺寸规模的四个版本,从小到大依次为Gecko、Otter、Bison和Unicorn,更易于针对各种用例进行部署。

图片来源:谷歌I/O大会

PaLM 2是在具有100+语言的语料库上进行训练,因此更擅长多语言任务,能够理解、生成和翻译比以往模型更细致多样化的文本(包括习语、诗歌和谜语等)。PaLM 2通过了「精通」(mastery)级别的高级语言能力考试。


(资料图片)

谷歌还推出一些专业领域大模型。谷歌健康团队打造了Med-PaLM 2,其能回答各种医学问题,据称是首个在美国医疗执照考试中达到专家水平的大语言模型。

图片来源:谷歌I/O大会

科大讯飞发布星火认知大模型

5月6日,在科大讯飞成果发布会上,科大讯飞星火认知大模型正式发布。认知大模型的主要特点是多种类型的数据送到统一的认知智能大模型中学习和训练,最终在通用领域展现出令人惊喜的能力表现。

当前通用人工智能令人关注的维度主要有文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力,这七个维度的能力提升将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。进一步,科大讯飞联合中国科学技术大学将这七个维度作为评价当前通用人工智能发展程度的评测维度,建立了通用认知智能大模型评测体系,围绕该体系,科大讯飞向外界展示了星火认知大模型的核心能力。

讯飞星火认知大模型发布七大核心能力

图片来源:科大讯飞官方公众号

多风格、多任务的长文本生成能力:可以帮用户写发言稿、邮件、新闻通稿、营销方案等,具备各方面的文本生成能力,目前在国内处于行业领先地位。

多层次跨语种的语言理解能力:语言理解是将来认知大模型用各种插件和工具最核心的一项能力,在语言能力中强调多层次、跨语种的语言能力,中英文各个层次,比如说最细微的关于每个单词和语法、时态等等的检查,最高的是能够到情感分析、后台的深度理解。

泛领域开放式知识问答:对生活常识、科学知识、工作技巧以及医学知识等广受关注的方面都可以进行比较好的回答,而且还在不断地丰富学习和完善。

情景式思维链逻辑推理能力:包括常识推理、科学推理以及时空推理等多方面。

多题型可解析数学能力:数学能力一定意义上代表了今天通用人工智能认知大模型的智慧水平,包括计算、代数、几何、解方程、情景应用等。

多功能多语言代码能力:不仅可以生成也可以修改代码,理解和编译等,可以支持Python、Java等。星火大模型的代码能力尚处于起步阶段,重点针对工业互联网。

另外,科大讯飞表示,预计年内将对当前星火大模型进行版本升级,大致可分为三个阶段:到6月9日将 突破开放式问答(即实时问答),实现多轮对话再升级和数学能力再升级;到8月15日 突破代码能力,正式向客户开放多模态的交互能力及其他功能点;到10月24日实现星火大模型 在能力上对标ChatGPT,在中文上超越ChatGPT,在英文上与它水平相当。

图片来源:科大讯飞官方公众号

大模型发展至今,仍然存在三个方面的缺陷有待攻克:一是对新知识难以及时更新,因为对模型的训练是阶段性的,信息未更新到现在;二是在事实类的问题中容易出现“张冠李戴”;三是对于历史、传说典籍等容易出现编造情节的状况。

图片来源:科大讯飞官方公众号

讯飞星火大模型发布四大行业应用成果
目前,星火认知大模型已实现在 教育、办公、汽车、数字员工四大领域的产品应用落地。

图片来源:科大讯飞官方公众号

教育:星火大模型与讯飞学习机结合,有效克服作文指导耗时费力、英语听说环境匮乏的困难,实现语言学习能力再次升级。

办公:星火大模型与办公系列产品结合,升级会议纪要能力、语篇规整能力和一键成稿能力,进一步提升办公效能。

汽车:通过星火大模型,让人机交互再上新台阶。用户可以更自由、更拟人化地进行人机对话沟通,并实现与导航、媒体、餐饮、景点等各种技能链接融入,为汽车座舱提供丰富的实时信息和服务。

数字员工:AI虚拟人交互平台搭载星火大模型,使之变得更加智能化、人性化,可自动调动各种工具,从而延长营业时间、实现业务流程自动化、提升经营效率。

图片来源:科大讯飞官方公众号

百度智能云举行文心大模型技术交流会

5月9日,百度智能云在北京举行文心大模型技术交流会,具体介绍文心大模型在产品技术、场景研发、生态建设等领域进展。

文心千帆大模型平台具有更易用、更全面、更安全、更高效、更开放、更扩展六大特点,帮助企业高效、低成本地获取大模型能力。该平台提供包括文心一言在内的文心大模型服务,支持大模型定制开发,提供覆盖全生命周期的大模型工具链。

图片来源:百度官方公众号

往期回顾

X 关闭

推荐内容

最近更新

Copyright ©  2015-2022 时代制鞋网版权所有  备案号:   联系邮箱: 514 676 113@qq.com