美国小中结棍了,MIT辍学后创立高科技公司5年从0做大到73亿美元市值的AI 数据独角兽

ert0000

本站元老
VIP
注册
2005-12-07
消息
17,570
荣誉分数
4,369
声望点数
373
两个创立人Alexandr Wang 和Lucy Guo都是二代小中,父母是第一代留学赴美的。


97年的MIT辍学青年,五年成73亿美元独角兽​

文章来源: 硅兔赛跑 于 2021-07-02 22:58:16 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
(被阅读 21957 次)
A- A A+

从团队到业务,Scale 拥有一切硅谷宠儿的标签:AI、API、YC、野心勃勃、年轻、才华横溢、大学辍学创业、行业洞察。

作者 | 江江

编辑 | 蔓蔓周


这几年,硅谷有一家 SaaS 公司的表现非常亮眼,光看下图的增长曲线,剔去我们熟悉的Slack、shopify、twillio,谁最横?

73077389790c04ad25a64e830567ac05.jpg


图片来源:CapIQ

无疑是那条陡峭的橙色曲线——Scale。从 0 到估值 73 亿美元只用了五年,ARR 从 0 到 1 亿美元只用了四年,Scale 几乎是 SaaS 公司里最快达到这些数字的。

脏活累活起家,Scale 是无名之辈吗?

Scale 所在行业无疑是当下最 fancy 的行业之一,人工智能(AI)和机器学习(ML)。想到人工智能,我们脑子里可能都是科幻电影中那些能够与人争天下的机器人,但事实上,这个景象还离我们很遥远,离身处于这个行业的 Scale 更是遥远。

Scale 最初做的是这个行业最不性感、最接地气、最能被称为脏活累活的事情,即数据标注。

所谓数据标注,就是企业客户,比如自动驾驶汽车公司,给到 Scale 一些图片、视频等等,Scale 找一群人,给这些图片和视频打上标签的过程。

这里的打标签,不是我们理解的命名那么简单。举个例子,Toyata 和 Lyft 给 Scale 发送一张马路上的图片,如下图,Scale 就得找人把这些汽车圈出来,并且标注为 " 汽车 "。

51622ffd7df28e40003d1b1765045af9.jpg


图源:Scale Pandaset

这个过程其实大家都很熟悉,我们经常在登陆验证的时候被要求指出某些物体,比如下图要求指出所有带有船的图片,即标注这些图片:

b0e425cf8c9805822d4a21e6294c3f4d.jpg


你也许不会相信这世界上最性感而又高端的行业里,有如此鼓噪的一环, 而这才是开头那个具有靓丽增长曲线的 Scale 起家的业务。

Scale 由Alexandr Wang和联创Lucy Guo创立于 2016 年的 YC,当时这个公司还叫做 Scale API,只是一家有 API 的土耳其机器人。

土耳其机器人指的是亚马逊的一个众包平台,研究人员在网站上发布琐碎任务,比如给图像加标签、进行调查、抄录收据等,用户领取任务,在完成后能赚取少量现金。这听起来是个人力驱动的公司,需要大量来自发展中国家的外包团队,依靠经济发展的不平等获利。

但目的比手段重要。

尘埃里的资本宠儿

Scale 的创始人Alexandr Wang出生于 1997 年,父母都是 Los Alamos National Lab 的物理学家。他的名字从 Alexander 去掉了一个 e,因为父母想让他的名字刚好有 8 个字母,8 在中国代表着好运。他本身非常优秀,大学被麻省理工录取,大一满绩,之后辍学。辍学之后,他先去了 Addepar 和 Quora 工作,也在 Hudson River Trading 也工作过一小段时间。

2016 年,他和另一名来自卡内基梅隆大学的辍学生Lucy Guo和 Thiel 的一名同事一起组队,进入了YC2016 春季营,其实当时的他也不清楚自己创业具体要做什么,只是对市场痛点有一定的洞察。

他曾描述道:" 尽管麻省理工有数百名才华横溢、天资过人的学生,但是没有人用 AI 成功地构建任何东西。我们都在研究人工智能,却都遇到了一大瓶颈——没有好的数据。尽管如此,市面上也没有可以解决这个问题的标准化工具,我们有 AWS、Strip 和 Twillio,却没有任何人系统性地解决数据问题,这导致 AI 和 ML 的发展止步不前。"

具体来说,他每天打开冰箱的时候,都会想在冰箱里安装一个摄像头,摄像头会告诉他什么时候需要补充哪些杂货,这听起来并不难,但他根本做不到,因为没有适用的数据工具。

因此,他们决定做 Scale。

Alexandr 确实精准地击中了市场痛点,因此 Scale 发展地顺风顺水:

2016 年 6 月,Scale 正式成立,YC 投资了 12 万美元换取公司 7% 的股份。

2017 年 7 月,Accel 领投 450 万美元 A 轮。

2018 年,完成 1800 万美元 B 轮,同年,Scale 进军自动驾驶领域,并且拿下了许多行业内赫赫有名的客户,比如 GM、Cruise、Lyft、Zoox 和 nuTonomy,标注的数据超过 20 万英里。

2019 年 8 月,完成 Founders Fund 的 Peter Thiel 领投的 1 亿美元 C 轮,跟投包括 Accel、Coatue Management、Index Venture、Spark Capital、Thrive Capital、Instagram 的创始人 Kevin Systrom 和 Quora 的 CEO Adam d ’ Angelo。此时的 Scale 正式迈入独角兽行列,估值十亿美元。同年,Scale 宣布扩展行业领域,拿下了 OpenAI 和 Lyft 这种其他行业的头部用户。

2021 年 1 月
,以 35 亿美元估值完成老虎基金领投的 1.5 亿美元 D 轮融资,同时宣布进军标注之外的新业务,发布 Nucleus。

2021 年 4 月,以超过 70 亿美元估值完成来自 Greenoaks Capital,Dragoneer 和 Tiger Global 的 3.25 亿美元 E 轮融资

至此,可以说,Scale 是个彻头彻尾的资本宠儿。

从团队到业务,它拥有一切硅谷宠儿的标签:AI、API、YC、野心勃勃、年轻、才华横溢、大学辍学创业、行业洞察。

Scale 一扫早期的包工头形象,俨然已经是一家性感的 AI/ML 公司。而相比其他 AI/ML 公司,它又不受 " 红颜薄命 " 的诅咒,就连Peter Thiel都说:" 在激烈的竞争中,AI 公司们会出现又消失,但是 Scale 会一直存在。"

那么这样的转变原因是什么呢?

Peter Thiel 一语中的:" 因为 Scale 提供的是整个 AI/ML 行业的基础设施,数据是这个行业最重要的东西。"

AI/ML 的基础是数据,所谓的机器学习就是机器输入并学习数据,从而输出正确的编码。没有数据也就不会有 ML 或者 AI,并且,不好的数据比没有数据更加糟糕。学习一堆垃圾只会导致机器产出另一堆垃圾。

可以说,数据标注是个普适性的需求,只要一个公司存在,它就有数据标注的需求。

这个领域的领头人 Andrew Ng 曾发推说:"AI 系统 = 代码 + 数据 ",大多数的学术型竞争对手都不会去碰数据,而是在代码上埋头苦干,但试想一下,如果有一个 team 可以不动代码,光在数据上下功夫。" 而这刚好就是 Scale 在做的事情。

a65ecadf4797bdd9f343266f779f6c41.jpg


既然数据如此重要,为何没有更有实力的巨头躬身下场,拿下这块香饽饽?

前文也提到,数据标注是份脏活累活,受过良好教育的精英们宁可在代码堆里狂卷也不愿意碰数据标注。巨头不太可能在这个领域费心,他们的员工都太优秀了,不太可能把时间浪费在注释上。这一点刚巧给到了早期的 Scale 足够大的成长空间。

始于数据标注,不止于数据标注

当然,如果一直沉迷于数据标注,Scale 无疑只是一家利用发展中国家便宜人力牟利的外包公司,何谈科技?

其实不然,尽管 Scale 的商业模型最初看起来更像是服务业,通过人工支撑起业务,但是随着它自身数据的积累和模型的成熟,有些标注工作正在被机器取代。

相比于最初的纯人力驱动,现在 Scale 能让算法和人工配合着去做数据标注。算法会先把视频切成一帧一帧,并且粗略标注这些图片,在这之后,人工会接过来做更精细的标注。由此,Scale 在服务价格降低的同时,利润率也在升高。

同时,Scale 在战略上颇有远见,他们从很早就计划着从数据标注起家慢慢开发出一整套产品,让这些产品协同作用,以更快的速度创建更好的模型和更好的结果。

Alexandr Wang 认为,数据是 ML 和 AI 领域的基础设施,因此数据标注只是个开始。Scale 的存在就为了通过建造最以数据为中心的基础设施平台来加速 AI 应用的开发,它的核心信念是,数据就是新一代的代码。Scale 想做 AI 领域的 AWS,支付领域的 Stripe,数据分析领域的 Snowflake。

f0f258ea72f7fe367ae7ad2068363440.jpg


图源:NotBoring.co

2020 年 1 月,在完成 D 轮融资之后,Scale 宣布除了标注之外的新业务Nucleus。Nucleus 是一个用于数据调试的 SaaS 工具,具体包括解读数据、数据可视化、清洗数据和数据合作,从而帮助公司们建立更好的 ML 模型。

b3e08b76c1110b810c6851f5371870ec.jpg


图源:Scale

Nucleus 的推出使 Scale 开始得到一些长尾客户,并且拓展到更多行业。同年 5 月,Scale 发布文档产品Scale Document

Scale 在完成了前五年数据标注积淀之后,一步一步把触角伸向整个 AI 的生命周期,毕竟,数据标签和数据生成只占整个 AI/ML 基础设施图谱中的 1/20。按照 Scale 的划分(如下图),AI 的生命周期包括标注、管理、自动化、评估、搜集、产生数据,这其中的每一步,Scale 都要漂亮地拿下。

e7b81d8b89cd44c850ecea5f22f09f3a.jpg


AI 的生命周期,图源:Scale

在 E 轮融资过后,Scale 正式宣布其愿景为" 让每个行业都能实现 AI 的应用。Scale 为公司提供管理 AI 的整个生命周期的基础,无论他们是否有自己的 AI 团队,我们都会帮助他们建立 AI 策略,保证他们能够拥有产出高效模型基础设施。"

这是一副极其宏伟的蓝图,回忆一下互联网如何从一个小圈子扩展到如今万物互联,我们就可以想象,Scale 的野心有多么大。

AI/ML 基础设施市场将在未来几年内达到 3000 亿美元。到 2024 年,预计 Scale 的数据标注的潜在市场份额能达到 200 亿美元,光是 Document 和 Nucleus 的潜在市场份额就可以达到 100 亿美元和 80 亿美元。

除了战略远见之外,Scale 的内功也够硬。

和 Stripe 一样,Scale 很受程序们的喜爱,它把细节做得很好,"API 非常好,有开源数据集、文档很干净。"

许多大客户用 Scale 也不单单是因为不想干数据标注的活儿,而是因为 Scale 的人才密度更高,Scale 的推特有一半都是在欣喜若狂地宣布从哪儿挖了大牛,或者是组织了什么集聚大牛的行业盛会。

4979a868eb23feb9a93fe363d0fc7fa2.jpg


图源:Twitter

Scale 的 CTO 就是从 Amazon 挖过来的 AI 专家,而战略负责人则是前美国国家首席技术官。

898c620dfc149251bccb637622d650ab.jpg


图源:Twitter

财务 SaaS 公司Brex也是 Scale 的客户,而在问及为什么 Brex 不直接自己雇佣一个 AI 团队时,其 CEO Dubugras 说:" 他们拥有许多 AI 市场上最优秀的人才,而我不能只是打个响指就雇好一个优秀的团队。AI 工程师们也希望可以在解决领域内最难的问题的公司工作,Scale 就是其中之一。"

回望 Scale 短短的五年,它的故事像极了灰姑娘,看似毫不起眼,却一路逆袭,骨子里是对商业极度敏锐的纯正血液。


我们期待着 AI/ML 领域的 AWS,Twillio,Stripe,Snowflake 的诞生。
 

billwanhua

本站元老
注册
2005-07-07
消息
4,804
荣誉分数
1,391
声望点数
373
前年我们公司用数据,试了三个公司同时标注数据,其中有scale,后来我们根据数据质量,没有选scale。靠现在这个公司大牛
 

lili25777

初级老帮菜
注册
2013-03-14
消息
10,863
荣誉分数
2,656
声望点数
273
比尔辍学了,扎耶辍学了,华牛辍学了,都发了,我们发现了成功的必经之路也是唯一能效仿的路----辍学,要想成功必须先辍学,什么多大生活费,全省了:monster:
 

uglyducking

从前有座山
VIP
注册
2003-09-30
消息
76,459
荣誉分数
22,605
声望点数
1,373
比尔辍学了,扎耶辍学了,华牛辍学了,都发了,我们发现了成功的必经之路也是唯一能效仿的路----辍学,要想成功必须先辍学,什么多大生活费,全省了:monster:
葵花宝典啊
 

茶马盐铁

我想看看自定义头衔到底能有多少字。继续加,看系统什么时候把这个字符串截断。呃,居然还有?那就继续吧。
注册
2015-08-14
消息
9,279
荣誉分数
2,439
声望点数
223
赶快回国! 大把的钞票等着!
 

lili25777

初级老帮菜
注册
2013-03-14
消息
10,863
荣誉分数
2,656
声望点数
273
赶快回国! 大把的钞票等着!
还没看明白真正让这公司起来的是什么?---资本,好乌拉,外行看热闹,内行看门道:evil:
 

Jay Wang

薄皮大馅
VIP
注册
2008-05-09
消息
25,753
荣誉分数
5,273
声望点数
373
比尔辍学了,扎耶辍学了,华牛辍学了,都发了,我们发现了成功的必经之路也是唯一能效仿的路----辍学,要想成功必须先辍学,什么多大生活费,全省了
要是虎贲,金刚,明珠娃统统退学,不得一统江湖啊!
 

lili25777

初级老帮菜
注册
2013-03-14
消息
10,863
荣誉分数
2,656
声望点数
273
要是虎贲,金刚,明珠娃统统退学,不得一统江湖啊!
我纳闷那些辍学的,他们为什么当初还考大学:wall:
 

ert0000

本站元老
VIP
注册
2005-12-07
消息
17,570
荣誉分数
4,369
声望点数
373
要是虎贲,金刚,明珠娃统统退学,不得一统江湖啊!

不能因为个别超牛的辍学,就全盘否定虎贲,金刚,明珠大学名校的作用和功绩。那就叫形而上学 :mad:
 

lili25777

初级老帮菜
注册
2013-03-14
消息
10,863
荣誉分数
2,656
声望点数
273
不能因为个别超牛的辍学,就全盘否定虎贲,金刚,明珠大学名校的作用和功绩。那就叫形而上学 :mad:
据上大学的学生的普遍反应,老师教不了什么,和他们期待的名校里导师能醍醐灌顶的期待相差甚远。很多孩子都是靠自己自学,文理科都存在这现象。以前的大学,谁藏书多,谁师资强,谁笑傲江湖,现在信息化社会,这种原来获取知识的模式开始了一定程度的变化,所以智力超群的孩子,的确觉得上大课浪费时间
 

茶马盐铁

我想看看自定义头衔到底能有多少字。继续加,看系统什么时候把这个字符串截断。呃,居然还有?那就继续吧。
注册
2015-08-14
消息
9,279
荣誉分数
2,439
声望点数
223
还没看明白真正让这公司起来的是什么?---资本,好乌拉,外行看热闹,内行看门道:evil:
没错啊,说到资本,哪里比得上中国?
 

billwanhua

本站元老
注册
2005-07-07
消息
4,804
荣誉分数
1,391
声望点数
373
据上大学的学生的普遍反应,老师教不了什么,和他们期待的名校里导师能醍醐灌顶的期待相差甚远。很多孩子都是靠自己自学,文理科都存在这现象。以前的大学,谁藏书多,谁师资强,谁笑傲江湖,现在信息化社会,这种原来获取知识的模式开始了一定程度的变化,所以智力超群的孩子,的确觉得上大课浪费时间
这是误导。那些创业退学的不是因为上课浪费时间,而是因为大学时候已经创业没有时间完成学业,这个要佩服美国大学,不会因为你创业,没有时间通过课程就放松要求。人家本来就是创业,不是学知识,他们是雇佣学知识的人。
以前创业的也退学,比尔盖茨,杨志远等等。
 

KIKI&COCO

资深人士
注册
2004-10-09
消息
1,044
荣誉分数
75
声望点数
208
Musk念完大学读phd才辍学创业的吧
 

lili25777

初级老帮菜
注册
2013-03-14
消息
10,863
荣誉分数
2,656
声望点数
273
这是误导。那些创业退学的不是因为上课浪费时间,而是因为大学时候已经创业没有时间完成学业,这个要佩服美国大学,不会因为你创业,没有时间通过课程就放松要求。人家本来就是创业,不是学知识,他们是雇佣学知识的人。
以前创业的也退学,比尔盖茨,杨志远等等。
咱智商低,实在理解不了这些牛人的知识储备来自哪个阶段?高中?初中?小学?大学毕业创业,多少还靠点谱,多数都是在大公司积累几年管理理念和人脉,再拉出去单干。大一大二的学生就创业并且还能5年内成功,必须五体投地的折服:zhichi::shale:
 
顶部