24日至29日,第六届世界声博会暨2023科大讯飞全球1024开发者节在安徽合肥举办。本届活动继续以“解放生产力,释放想象力”为主题,举办主论坛、AI开发者大赛、科博展、17场行业论坛、16场城市峰会等系列活动,还有来自278个城市的超3.4万支开发者团队角逐2023届AI开发者大赛十佳团队。

在今天的开幕式主论坛上,科大讯飞正式发布“讯飞星火”认知大模型V3.0,七大维度能力全面提升,大模型代码能力迭代升级。据科大讯飞董事长刘庆峰介绍,星火V3.0已经超越了去年底的GPT-3.5。

星火V3.0亮相,超越GPT-3.5,七大能力全面升级
  第1张

对此次的超越,刘庆峰解释称,根据《通用认知智能大模型评测体系》构建测试集,在10月16日至20日的测试中,星火V3.0的中文能力客观测评超越GPT-3.5;而根据OpenAI在官网发布的英文任务测试集,在同样时间段进行的测试中,星火V3.0的英文能力对标GPT-3.5的48项任务结果相当,二者得分分别为星火V3.0的85.1%和GPT-3.5的84.3%。

而根据今天现场的演示,星火V3.0相比八月时的表现,在文本生成、逻辑推理、代码能力等七个方面的能力都有3%到9%不等的提升。不过刘庆峰同时也表示,和GPT-4相比,科大讯飞“还有一个学习的过程”。

星火V3.0亮相,超越GPT-3.5,七大能力全面升级
  第2张

值得注意的是,刘庆峰现场展示的一份由国务院发展研究中心国研经济研究院的横评报告显示,目前星火V3.0的综合能力已经在国内属于领先,在教育、医疗、法律等行业的表现格外突出。不过刘庆峰也表示,国产大模型必须正视和GPT-4的差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上和GPT-4相比还有差距。”

星火V3.0经过升级后,拥有了启发式对话、AI人设等新功能,AI助手的个性化程度更上一层楼,星火V3.0的背后是科大讯飞自主创新的算力底座。与星火V3.0同步亮相的,还有科大讯飞联合华为合作的新成果,基于昇腾生态的“飞星一号”大模型算力平台。

星火V3.0亮相,超越GPT-3.5,七大能力全面升级
  第3张

“大模型正在走进我们每个人的生活。”刘庆峰表示,在今年亚运会上,工作人员借助讯飞星火与中国移动开发的5G新通话助手,刚挂完电话待办事项就已自动生成;在星火iFlyCode的帮助下,原本需要三个月的平台迁移开发工作一个月就能完成;讯飞星火还与国家自然博物馆合作,让300万年前的黄河象“复活”,还能与人对话。

而在关键性的落地应用方面,科大讯飞联合不同的行业龙头共同发布12个行业大模型,包含金融、汽车、运营、工业、住建、物业、法律等众多行业,加速产业升级。在如此蓬勃发展,欣欣向荣的生态背后,同样离不开自主创新的算力底座,讯飞和华为“联合特战队”已经在半年内实现星火大模型训练和推理效率均翻番。

此外,科大讯飞还发布了AI心理伙伴产品,可用于陪伴孩子成长;科技文献大模型,为科研工作者提供助力;还有星火医疗大模型,以及在此加持下的“讯飞晓医”APP及小程序。据介绍,星火医疗大模型已通过信通院和国家卫健委组织的标准规范评测。刘庆峰表示,星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题解答率等方面甚至比GPT-4更高效。

星火V3.0亮相,超越GPT-3.5,七大能力全面升级
  第4张

“讯飞星火正日益成为解放生产力工具,大模型时代的大幕才刚刚揭开,让我们一起共创、共享、共进化。”刘庆峰表示,当前讯飞星火已有1200万用户,为千万用户持续创造刚需场景价值。唯有实事求是的科学精神,才能真正实现超越。对标GPT-4的更大参数规模的星火大模型正式启动训练,2024年上半年将实现对标GPT-4。