科大讯飞刘庆峰:中国大模型距离GPT-4的最好水平还有差距

1月30日下午,科大讯飞正式发布了Spark V3.5大型语言模型的升级版本和首个大型开源模型。据悉,Spark开源模型由去年5月发布的Spark 1.0版本(130亿参数)改进而来,该版本增加了针对应用场景的数据、能力和工具链,并针对国产安全性和可控性做了更系统的设计,深度适配国产算力。

根据科大讯飞官方发布的测试结果,Spark开源模型在典型应用场景中领先同等规模的其他开源模型20%以上。

截至下午收盘,科大讯飞股价上涨近2%。1月29日,科大讯飞发布业绩预告显示,公司2023年净利润预计同比增长15%-30%,达到6.45亿至7.3亿元,2023年营业收入预计超过200亿元,同比增长7%左右。

同时,Spark开源模型发布,科大讯飞的升级版Spark V3.5模型也发布了。据悉,该模型是基于科大讯飞和华为联合发布的中国首个支持万亿参数大规模模型训练的国家级产品。“邢飞一号”平台已经完成了训练,但具体参数和尺寸尚未公布。

科大讯飞董事长刘庆峰表示,Spark 3.5版本的大模型在逻辑推理、语言理解、文本生成、数学回答、代码和多模式方面的能力有了很大提高,并进一步接近OpenAI的GPT-4 Turbo的最新水平。

刘庆峰告诉第一财经记者:“通用大模型的关键是看谁有好的性能,而大模型是开源建立的生态,所以从技术层面来说,通用开源大模型会比通用大模型略低一些。”

科大讯飞的大型开源模式并非中国首创。园区招商引资政策

此前,浪潮信息发布了Source 2.0的基本模型,该模型完全开源,可免费商业化,包括1026亿、518亿和21亿不同的参数规模。此外,国内开源的机型还包括智远研究院的大午天鹰34B机型。对话模型InternLM-Chat-7B的升级版,上海人工智能实验室的学者-浦宇语言模型;清华大学团队的VisualGLM-6B和ChatGLM2-6B模型;MPLUG-Owl;,阿里巴巴达摩院的多模态模型;百川-7B,百川-13B等等。

展望2024年科大星火模型的发展,刘庆峰指出三点:一是要在通用模型底层能力上继续对标国际最先进水平,在算法研究上做出相对更好的成果,包括更少的算力;二是真正把大模型做成“齐飞”它不仅是一个工业应用,也是很多关键技术创新中的一个联动模型;第三是大模型要建立在安全可控的平台上,在自主可控的平台上实现生态繁荣。

刘庆峰说,一方面,我们应该清醒理性地看到我们与国外的差距。目前,在小样本、快速训练、多模态深度学习和训练、超复杂深度理解等领域,中国大模型与GPT-4的最佳水平仍有较大差距;另一方面,未来在对抗网络的深度连接领域,需要整个创新生态。

国内大牌车型的竞争越来越激烈,最近又有新一批国产大牌车型备案。上周,监管部门批准了第四批14个大规模语言模型向公众开放,其中包括小米集团、第四范式和拥有1万个对象的AI模型。据不完全统计,自去年8月以来,中国已批准了40多个大规模语言模型。

zol恶性甲状腺能活几年

未经允许不得转载:科技让生活更美好 » 科大讯飞刘庆峰:中国大模型距离GPT-4的最好水平还有差距