阿里云大模型再开源！通义千问720亿、18亿参数模型填补行业空缺，音频理解大模型也来了-科技让生活更美好

作者|香草

编辑|李水清

Zhidx月1日报道，今日，阿里云在京召开依桐千问发布会，并开放720亿参数模型Qwen-72B，同时开放18亿参数模型Qwen-1.8B和大音频模型Qwen-Audio。

阿里云CTO周静表示，Qwen-72B实现了开源模型在10项权威基准测试中的最佳性能，性能超越开源基准测试Llama 2-70B和大部分商用闭源模型，为未来企业和科研的高性能应用提供了有力支撑。

此外，Qwen-72B配备了系统提示能力，用户可以通过自然语言设置角色、语言风格、任务和行为模式，只需一个提示即可定制AI助手。

▲周发布Qwen-72B模型。

截至目前，依桐钱文已经开放了四大语言模型，涵盖18亿、70亿、140亿、720亿参数规模，加上视觉理解和听觉理解两大多模态模型。周静表示，阿里云在业内率先实现“全尺寸、全模式”开源。

▲周解读钱文开源模型矩阵

Qwen-72B开源地址:

modelscope.cn/models/qwen/Qwen-72B-Chat

一、同规模超性能的Llama 2，搭载系统指令一键定制AI助手

据介绍，Qwen-72B基于3T令牌的高质量数据进行训练，延续了依桐千题预训练模型的优异表现，在10项权威基准评测中取得开源模型的最好成绩，在部分评测中超过闭源的GPT-3.5和GPT-4。

▲Qwen-72B在10大权威评测中超越了美洲驼2-70B。

据周静介绍，Qwen-72B填补了国内空白，以高性能、高可控性、高性价比的优势，提供了不亚于商用闭源机型的选择。基于Qwen-72B，大中型企业可以开发商业应用，高校和科研院所可以开展AI for Science等研究工作。

具体来说，在英语任务上，Qwen-72B在MMLU基准测试上得分最高。在中文任务上，Qwen-72B在C-Eval、CMMLU和GaokaoBench等基准测试中名列前茅，得分高于GPT-4。在数学推理方面，Qwen-72B在GSM8K和MATH的评测中明显领先于其他开源机型。在代码理解方面，Qwen-72B在HumanEval和MBPP评测中的性能有了很大的提升。

Qwen-72B可以处理高达32k的长文本输入，并在长文本理解测试集LEval上取得了比ChatGPT-3.5-16k更好的结果。

▲依桐钱文720亿的开源模型，有一些超越闭源的GPT-3.5和GPT-4的成就。

与此同时，R&D团队对Qwen-72B的指令遵从和工具使用等技能进行了优化，使其能够更好地被下游应用集成。

Qwen-72B装备有系统指挥能力。用户可以通过自然语言设置角色、语言风格、任务和行为模式，只需要一个提示就可以定制AI助手，要求大模型扮演某个角色或者执行某个特定的回复任务。

《智事考》Qwen-72B能演鲁迅，既能惟妙惟肖地模仿鲁迅的口吻，又能站在鲁迅的角度表达自己对现代技术的看法。放债科技学院

▲Qwen-72B的系统命令能力，只需要一个提示就可以创建AI助手。

二、18亿参数模型“见底”，阿里云全面布局开源模型生态

如果说720亿参数Qwen-72B是在“摸高”，试图触碰大型开源机型尺寸和性能的天花板，那么18亿参数Qwen-1.8B则是在“触底”，探索国内大型开源机型尺寸的下限。

据周静介绍，Qwen-1.8B推理只需要3G显存，推理所需最小显存不到1.5G，可以部署在消费终端。与之前发布的Qwen-7B相比，Qwen1.8B的微调速度提升3倍以上，最小微调成本不到6GB。

▲周发布Qwen-1.8B

从18亿、70亿、140亿到720亿的参数规模，依桐钱文成为业内首个“全方位开源”的大型模型。

周静表示，开源生态对于推动中国大模型的技术进步和应用非常重要。依桐钱文将持续投入开源，希望成为“AI时代最开放的大模型”，与开发者共同推进大模型的生态建设。

目前，阿里云用户可以在魔骑社区直接体验Qwen系列模型的效果，或者通过阿里云纪灵平台调用模型API，或者基于阿里云安百里平台定制大型模型应用。阿里云AI平台PAI深度适配依桐钱文全系列模型，提供轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。法律科技创业国外

第三，第一次将开源的音频理解模型升级到2.1

此外，阿里云首创开源音频理解模型Qwen-Audio。

据周静介绍，Qwen-Audio可以感知和理解人声、自然声、动物声、音乐声等各种语音信号，支持基于单个或多个音频的理解、推理和创作。

用户可以输入一段音频，要求模型给出对音频的理解，甚至可以基于音频进行文学创作、逻辑推理、故事续写等等。科技带来的浮躁

▲周发布音频模型Qwen-Audio。

除了开源音频模型，依桐·钱文还宣布了视觉模型Qwen-VL的重大更新。

Qwen-VL的通用OCR、视觉推理、中文文本理解等基础能力有了很大的提升，还可以处理各种分辨率、规格的图像，甚至可以“看图做题”。

▲周宣布升级Qwen能力。

通义千问的闭源模式也在不断进化。一个月前发布的依桐钱文2.0版本的闭源模型，最近已经升级到2.1版本。上下文窗口长度扩展至32k，代码理解和生成、数学推理、中英文百科知识、幻觉诱发抗性能力分别提升30%、10%、近5%、14%。用户可以在依桐钱文APP免费体验最新版本的闭源模型。

▲周发布2.1版本的钱文。

结论:开源生态为更多开发者提供AI R&D平台。

发布会上，周一直强调阿里云坚持打造开源生态的决心。从此次发布中，不难看出依桐钱文的开源模型矩阵已经逐步完成，走向“全尺寸、全模式”。

周提到，钱文模式累计下载量已超过150万，催生了150多个新模式和应用。发布会上，阿里云还宣布举办首届依桐钱文AI挑战赛，免费为参赛者提供价值50万元的依桐开源模型家族和云计算能力。

正如Meta首席科学家杨丽坤所说，开源模式有助于创造大量的社会和经济机会，让更多的人和企业使用最先进的技术，减少社会差距，提高竞争力。未来，我们期待看到更多优秀的开源模型，以及更多开发者在此基础上开发的模型和应用。

未经允许不得转载：科技让生活更美好 » 阿里云大模型再开源！通义千问720亿、18亿参数模型填补行业空缺，音频理解大模型也来了

阿里云大模型再开源！通义千问720亿、18亿参数模型填补行业空缺，音频理解大模型也来了

作者：pu

相关推荐