估值飙至 138 亿美元,27 岁天才少年再获融资:数据标注会是下一个风口?

【新智元简介】Scale AI由王创立,是一个为人工智能模型提供训练数据的数据标注平台。最近,它完成了10亿美元的新一轮融资,其估值飙升至138亿美元。该公司表示,它将利用新的资金产生丰富的前沿数据,为AGI铺平道路。

Scalai为希望训练机器学习模型的公司提供数据标注服务,并从亚马逊和Meta等众多知名机构和企业投资者那里筹集了10亿美元的F轮融资。冒险岛2韩服官网地址

本轮融资由Accel领投,Accel之前也领投了Scale AI的A轮融资,并参与了后续的风险投资。

本轮融资让Scale AI的身价暴涨。尽管去年年初裁员20%,但该公司目前的估值已达138亿美元。

Scale AI联合创始人兼首席执行官王

除了亚马逊和Meta之外,Scale AI还吸引了各种新的投资者:思科、英特尔、AMD等风险投资部门,许多已经投入资本的公司已经回归,包括NVIDIA、Coatue、Y Combinator等。

天才少年辍学创办独角兽

Scalai由亚历山大·巴甫洛夫·王和露西·郭于2016年创立,由著名的创业孵化器Y Combinator投资。该公司使用机器学习对大量数据进行标记和分类,供客户在训练模型中使用。

Scalai的客户包括Meta、微软、NVIDIA、OpenAI、丰田和哈佛医学院。

在由创始人基金领投的1亿美元C轮融资后,Scale AI在2019年获得了独角兽的地位,从Index Ventures、Coatue和Tiger Global等知名投资者那里共筹集了6.026亿美元。

2022年,王以15%的股份成为世界上最年轻的白手起家的亿万富翁。

在创业之前,王一博从小到大的履历也让人印象深刻。

1997年出生于新墨西哥州,父母都是新墨西哥州洛斯阿拉莫斯国家实验室的物理学家。

高中时,我开始通过互联网自学编程,并报名参加了一些世界级的编程比赛,如USACO。

17岁成为美国知名问答网站Quora的全职码农;

18岁时,他考入麻省理工学院学习机器学习;

麻省理工学院大一新生毕业后的那个暑假,他和郭一起创立了Scale,并获得了Y Combinator的投资。

王告诉他的父母:“这是我夏天做的事情。」

当Scale AI刚刚起步时,一些人真的认为这是一个笑话。毕竟,当时公司只有三名员工。

然而,在持续的融资和发展下,Scale AI发展迅速,到2021年,它已成长为价值73亿美元的独角兽企业。2023年初,公司规模也扩大到700人。

在接受《财富》杂志独家采访时,王透露,随着企业客户竞相训练生成式人工智能模型,Scale AI在这一领域的业务增长迅速。

2023年,该公司的年度经常性收入(企业为数据服务支付的长期费用)增长了两倍,预计到2024年底将达到14亿美元。

由于规模人工智能的惊人成就,亚历山大·巴甫洛夫·王入选了2021年福布斯企业技术“30 under 30”榜单,他本人也被称为硅谷的“下一个扎克伯格”。

AI 模型的「数据工厂」

AI领域公认的三大基本支柱——数据、算法和算力。

在算法领域,之前有谷歌、微软的大型研究院,后来有了OpenAI推出了黑脸田鸡和GPT系列车型。算力领域有NVIDIA,但在Scale AI诞生之前的2016年,数据领域还是空白。

看到这一点后,19岁的王决定辍学创业。“我创立Scale的原因是为了解决人工智能中的数据问题。”

大部分数据是非结构化的,AI很难直接学习这些数据;此外,标记大型数据集是一项资源密集型任务,因此“数据”被许多人认为是科学和技术领域中最困难和最卑微的部分。

但规模AI在短时间内取得了巨大成功。他们可以为不同行业的企业客户量身定制数据服务。

在自动驾驶领域,Cruise和Waymo等公司通过摄像头和传感器收集了大量数据。Scalai将机器学习与人工在环监督相结合来管理和标记这些数据。

他们曾经开发的“自动驾驶数据引擎”推动了L4自动驾驶技术的发展。

2019年,Scale AI帮助OpenAI团队训练了GPT-2,进行了RLHF的首次实验,并将这些技术推广到InstructGPT等其他LLM。

在接受《财富》杂志采访时,Scale AI首席执行官王表示,Scale AI将自己定位为整个人工智能生态系统的基础设施提供商,并建立了一个“数据铸造厂”,而不是仅仅在其子公司Remotasks雇佣大量承包商进行人工标注。

Scalai已经开始与不同领域的专家合作,如博士学者、律师、会计师和作家。

为什么一个医生级别的专家可以参与对聊天机器人的回复进行评分的工作?

王回应说有很多原因:“如果你是一名医生,习惯于做一些非常小而深刻的研究,可能世界上只有少数人能理解它。但在这项工作中,你可以帮助改善和建立这些人工智能系统的尖端数据,并有机会产生真正的社会影响。」

同时,Wang还认为,这些专家提供的高质量数据对AI的未来非常重要。

他补充说,来自专家的包含复杂推理的数据是未来人工智能的必要条件。你不能只把旧数据输入算法,然后指望它自我改进。

传统的数据源,如从Reddit等社区的评论中抓取数据,具有局限性。Scalai构建了一些流程。模型首先输出一些内容,比如写研究论文。在此基础上,人类专家可以改进这些内容,从而提高模型的输出。光遇工装裤展示

对于人工智能生成和标注的数据,一些人持肯定态度,认为可以消除人工标注数据的标注,但王的观点并不那么简单。昂达vi10豪华版多少钱

他表示,无论是合成数据还是人类创造的数据,都投入了规模人工智能。“尽管人工智能生成的数据非常重要,但获得具有一定质量和准确性的数据的唯一方法是通过人类专家的验证。」

数据日益重要

数据是人工智能的命脉,因此数据管理和处理领域的公司正站在风口浪尖上。

就在上周,印度数据平台Weka表示,它筹集了1.4亿美元,投后估值为16亿美元,以帮助该公司为其人工智能应用建立一条数据管道。

人工智能数据的主要问题仍然存在。标度律的存在意味着随着模型变大,对数据的需求也呈指数级增长,越来越多的人担心大型模型会耗尽可用数据。

亚历山大·巴甫洛夫·王在Scale AI的官方网站上写道,“数据丰富不是默认选项,而是一种选择,它需要将工程、运营和人工智能领域最优秀的人才聚集在一起”。

Scale AI的愿景之一是“丰富的数据”,从而将前沿的LLM扩展到更大的数量级,“为AGI铺平了道路。”在实现GPT-10的过程中,我们不应受到数据的限制。”

参考资料:

本文来自微信公众号:新智元(ID: AI _ ERA)。

未经允许不得转载:科技让生活更美好 » 估值飙至 138 亿美元,27 岁天才少年再获融资:数据标注会是下一个风口?