直逼GPT-4开源模型大泄漏，AI社区炸锅！Mistral CEO自曝是旧模型，OpenAI再败一局？-科技让生活更美好

俞光耀律师

新智元报道。

编辑:埃涅阿斯

【新智元简介】最近在人工智能界引起巨大讨论的性能接近GPT-4的泄漏模型“miqu”确实是Mistral公司训练的旧模型的定量版本。此前，这种冲上各大榜单的开源模式引发了开发者的热烈讨论，开源AI或已进入关键时刻。

案子解决了。

让许多网友挠心的新开源模型“miqu”确实是Mistral训练模型的旧量化版本，该模型在Llama 2上进行了重新训练。

今天，米斯特拉尔CEO亲自证实了这一点。

这位首席执行官表示，该模型是由一名“过度热情的员工”从一名“预先体验过的客户”那里泄露的。

过去几天，这个在AI界引发热议的“悬案”终于有了答案。

神秘的模型泄漏

事情是这样的。

1月28日，一位名为“miqudev”的用户在HuggingFace上发布了一组文件，这些文件共同构成了一个看似全新的开源LLM，命名为“miqu-1-70b”。

奇怪的是，网友在HuggingFace词条中发现，这款新车型的提示格式与Mistral完全相同。

随后，“miqu-1-70b”的链接在4chan上被泄露。

该链接是由4chan上的一名匿名用户发布的，据推测他很可能是“miqudev”。

随后，X上的网友们争先恐后地告诉对方，因为他们发现miqu-1-70b的性能太强了！

在EQ-Bench基准测试中，它甚至接近上一代车型国王GPT-4。

网民们感到困惑的是，为什么这种神秘的新型号可以击败米斯特拉尔中型并接近GPT-4。

有人干脆建议不如用EQ-Bench检查一下miqu的数据集有没有被污染。

米趣车型的真面目，是Mistral还是Llama？

为了确定“miqu”的真实身份，有网友向Mistral-Medium和miqu发送了相同的俄罗斯问题。上海家电以旧换新补贴2023结束了吗?

原来两个模型的答案是完全一样的俄语。

最后，他得出结论，我现在100%相信米曲是西北风。

一些网友熬夜测试并比较了miqu和Mixtral模型的功能。

事实证明，无论在德语拼写和双语语法上，还是在回复中的一些语言习惯上，miqu和Mixtral确实非常相似。

总的来说，miqu的性能比Mistral中小型产品好，比Mixtral 8x7B指令差。

因此，miqu可能是Mistral模型的泄露版本，这是一种较旧的概念验证模型。

当然，一些开发人员认为miqu更像Llama 70B而不是专家混合模型。

根据当时的推测，miqu可能是Mistral Medium的早期版本，也可能是Llama 70B在Mistral Medium数据集上的微调。

米斯特拉尔定量版？

随着噪音越来越大，摩根大通的机器学习研究员马克西姆·拉博恩也注意到了这一点。

他发帖称，“不确定miqu是否是Mistral的量化版本，但可以肯定的是，它很快就会成为最好的开源LLM之一。」精灵虚拟光驱破解版

感谢@152334H，现在每个人都有一个未量化的miqu版本。

拉博纳说，调查仍在进行中，我们很快就会看到微调版的miqu的性能将优于GPT-4！

在机器学习中，量化指的是这种技术，通过将模型架构中的特定长数字序列替换为较短的数字序列，使得在功能较弱的计算机和芯片上运行某些AI模型成为可能。

许多人猜测miqu很可能是新的Mistral型号，这是该公司故意泄露的。

或者，可能是员工或客户泄露的。

CEO确认:是的，它是Mistral的定量版本。

今天，事情终于水落石出。

Mistral的联合创始人兼首席执行官Arthur Mensch在X上澄清说:

我们有一位抢先体验的客户，对接他的过于热情的员工泄漏了我们训练和公开分发的旧模型的量化和水印版本。为了快速开始与一些选定的客户合作，我们在访问整个集群的那一刻，就从Llama 2重新训练了这个模型——预训练在Mistral 7B发布当天就完成了。从那以后，我们又不断取得了良好的进展，敬请期待！

有趣的是，这位首席执行官并没有要求删除HuggingFace上的帖子，而是表示发帖人“可能需要考虑归属问题”。

简而言之，“请等待”这几个字表明，米斯特拉尔似乎不仅仅在训练这种接近GPT-4的miqu模型。

开源AI进入关键时刻？

miqu模型的泄露会引起如此大的轰动，因为它很可能成为开源生成式人工智能的分水岭，也是整个人工智能和计算机科学领域的分水岭。

2022年3月发布的GPT-4在大多数基准测试中仍然是世界上最强大的LLM。即使是谷歌传闻已久的Gemini也无法超越它。根据一些测试，当前的Gemini模型实际上比旧的open ai GPT 3.5模型更差。

如果现在有一种与GPT-4性能相似的模型，并且可以免费商业化，那么它将不可避免地给OpenAI及其订阅服务带来巨大冲击。

尤其是现在，越来越多的企业正在寻找一种开源模式或开源与闭源的混合模式来支持自己的应用程序。

在GPT-4 Turbo和GPT-4V的帮助下，OpenAI尽最大努力保持其优势，但开源人工智能社区的快速追赶也不容忽视。

OpenAI是否有足够的领先优势，GPT商店和其他功能是否有护城河使ChatGPT保持在LLM的顶端？

参考资料:

https://venturebeat . com/ai/mistral-CEO-confirms-leak-of-new-open-source-ai-model-nearing-GPT-4-performance/

未经允许不得转载：科技让生活更美好 » 直逼GPT-4开源模型大泄漏，AI社区炸锅！Mistral CEO自曝是旧模型，OpenAI再败一局？

直逼GPT-4开源模型大泄漏，AI社区炸锅！Mistral CEO自曝是旧模型，OpenAI再败一局？

作者：pu

相关推荐