对话北美AI教育Top产品创始人:6 个月收获 200 万用户,我们做的只是补齐缝隙
文章原标题:Z Potentials|周立,6 个月收获 200 万用户,霸榜北美 AI 教育 TOP1
文章来源:Z Potentials
这次我们有幸邀请到了 Answer.AI 的创始人&CEO 周立。周立 2000 年通过数学竞赛保送北大,本科期间就创业开过奥数辅导班、写过奥数教材,很早就涉足了教育领域。
2007 年周立从北大硕士毕业后就开始创业,先后在老虎地图、豌豆荚、Kika 输入法和 LiveIn 作为创始人(创始成员)的身份工作。
从 2015 年开始,周立的精力都集中在海外市场。这一次创办 Answer.AI,周立定位自己是一家由中国团队创办、专注美国市场的公司。周立很明确要做“X+AI”的公司,Answer.AI 的 X 就是教育,他们要基于 AI 技术在教育行业高维打低维,为 C 端用户带来价值。
本期万字**中,周立详细分享了他的创业历程,对教育行业、AI 技术和美国市场的思考,干货满满。我们摘录了周立的核心观点放在文首,Enjoy!
使用 NLP 和 LLMs 的核心是帮助人们表达他们的意愿,在这个角度上,AI 教育的本质是让学生更好地表达他们的学习需求。
LLMs 的目的创造出一个 Decent Person,而 Decent Person 到 Best Teacher 之间是有一个 Gap,作为一个 AI Tutor 公司,应该是我们来补齐这个 Gap。
AI Tutor 0.1 是拍照搜题,Answer AI 现在做的是 AI Tutor0.2——拍照解题+论述。未来 1.0 版本的 AI Tutor 应该能管理整个学习环节,特别是课后学习环节;1.0 版本是 Tutor 主动,主动找到用户不明白的东西。
我们观察到,65%以上的学生在拿到答案之后,依然在和 AI Tutor 交互,为什么?这就是 Curiosity。这部分有好奇心的用户是大量真实存在的。我们更多关注的是 Really Learning(真正在学习)的用户在做什么,我们不断迭代新的功能,然后在我们用户群中,找到哪些是他们真正感兴趣或者经常使用的功能。
“X+AI”类公司,往往是由产品人主导,而且是团队里对于「X」这个行业有 Know How 的人。这类公司对原有行业而言是高维打低维,它的成功概率会更高。LLMs 的目标是希望模型尽可能像人类,我希望通过我自己对教育行业的理解和对用户需求的理解,可以让 LLMs 当好一个老师。
AI 的兴起不仅改变了行业格局,也促使公司内部组织结构发生变革。
保送北大,毕业即创业,坚信“找到一个你能比其他人解决地更好的问题”
ZP:首先请向大家简单介绍一下自己。
周立:我读高中是在广州的华南师大附中。1997 年上高中的时候,我参加了我们学校的奥赛班,期间获得了冬令营银牌,全国排名 30 左右。后来我保送进入了北大。
我们那一届有一个特别有意思的地方。你可以认为那时是中国奥数热开始之前的一个阶段,奥数最早的时候只是小学升初中的一个选拔性的考试,它是作为一种知识性的内容。大概是在 2000 年左右,由于正式的小升初考试被取消,学生基本上是通过摇号进入中学。很多中学为了择优录取,它会特别参考小学奥赛的分数,这就造成了当时的数学竞赛比较火热,尤其是小学竞赛。当时就出现了像迎春杯、华罗庚金杯赛这样的一些比赛。北京的数学竞赛组织者(也就是人大附中)当时开设了一些特别针对小学生的奥数培训班。我们有很多北大数学系的同学就被拉到这个培训班中去培训小学生了。
在 2000 年到 2004 年间教小学数学和后面纯粹的奥数辅导班不太一样。因为当时我们教的学生都是属于拔尖的小学生,所以教的时候我们可以直接把题目和解题思路讲清楚。我的教学目标并不仅仅是提升学生的分数,而是希望让他们能够掌握一些数学的思考方法。在这个点上面,我们和家长是一致的。
简单的小结,我在大学本科的期间就开过奥数辅导班,教过小学生的奥数,写过奥数教材,这是对于我来说很特别很难忘的一段经历。
大约在 2004 年,我进入了北大计算机系读研。从 2007 年开始,我一直在创业,毕业即创业。我一共创办了四家公司。从 2015 年开始,我基本上把我的精力都集中在海外市场上。严格来说,我们并不能算是一家出海公司,而是一个由中国团队创办、专注美国市场的海外公司。
ZP:你从毕业后就一直在创业,当时是什么想法?
周立:首先,我很少关注其他人是如何选择的,尤其是在职业方面,其他人的选择和我关系不大。我只关注自己要做什么事情,然后去做就好了。当时的契机是我在北大期间与一位老师合作做一个叫地理信息编码的项目。在项目进行的过程中,中国刚好开放了手机地图的资质。在此之前,GPS 只能军用 ,直到大约 2007 年才开始向民用开放。你还能观察到一些国家还发放许可证,允许商业公司直接使用高精度的 GPS 数据。这样一来,数据的规模使得我们可以通过经纬度定位到各种不同的场所,手机地图也成为可能——因为每部手机都可以搭载一个 GPS 芯片,通过它进行定位、导航等各种功能。所以在 2007 年,也正是由于这个契机,我认为这个事情是正确的。基于这一点,我决定去做手机地图。
最开始,这个项目的导师是想开展一项 ToB 的业务,但我对此并不是很感兴趣。我的想法很简单,如果我认为这个东西我会用,我就会去做;如果我觉得做了之后没有什么意义,那我为什么要去做呢?在实习期间,我也去了很多大公司实习,但我发现他们做的事情不直接,我想不出来他们为什么要做这些事情。关键问题是我无法操作这件事,这都是领导给我的任务。如果我觉得这些事情不对,我与领导谈他也搞不清楚为什么,那我为什么要做呢,这不是在浪费生命吗?基于这个非常朴素的想法,我当时就决定创业。
ZP:你创业过程中做过不同的角色,觉得1号位最大的不同是什么?
周立:作为 1 号位,你必须为公司把好最后一道关。1 号位没有任何借口或退路可言,需要为所有乱七八糟的事情兜底,不能抱怨任何事情。一般来说,2 号位可以探索和天马行空地思考问题,但是1号位不能这样做。因为在 2 号位激进完之后,有些事情需要 1 号位为 2 号位兜底。2 号位冲的时候可以不需要考虑某些事。当 1 号位考虑这些事的时候,可能就冲不了那么快。所以一般来说,很多公司都需要这样两个人彼此配合。
打个比方,如果你是 2 号位,你会觉得自己可以兜底,但可能 1 号位的能力与你不同,他认为自己无法应对这个问题。所以当你激进时,1 号位会拉你回来。有时候你会觉得这种做法很荒谬,但这是因为我们能力不一样。我认为无论是1号位、2 号位还是其它的角色,他们都有各自的分工。1 号位是公司的最后一道关口,需要综合考虑问题。好的 1 号位并不是自己能冲多远,而是给 2 号位或 3、4、5 号位一大堆的自由度让他们往前冲,并且雇最好的人。如果1号位把这些事情都兜住了,让其余人的认知能够发挥到极限,那就是一个非常好的一把手。
基于 LLM 探索 AI Tutor 1.0,解决 Decent Person 和 Best Teacher 之间的 Gap
ZP:回到你目前的公司,这是一家教育公司,是什么样的背景让你选择创办这家公司?
周立:我认为做一项新的创业只需要考量两件事情。首先,确定这个事情是否有价值。人生是很短暂的,我们能够工作的时间也非常有限,我们不能把精力浪费在对整个行业、科技发展或者世界进步中没有意义的事情上。所以,第一点就是我所从事的事情必须产生真实的、正向的价值。其次,我得要确认我是否是最适合做这件事情的人。如果我无法证明这一点,那么我一定要有和其他人不一样的认知。
第一,我当时看到 ChatGPT 和 Stable Diffusion。我认为虽然它们是两个不同的东西,但是在技术上,它们产生了一个重大区别。原先是状态对状态的映射,现在变成了分布对分布的映射。在它的世界中,它是概率分布到概率分布的映射。这意味着它可以产生创造力。它用了一个非常好的模型生成了创造力。这就是生成式模型在做的事。
第二,ChatGPT 和 Stable Diffusion 解决了时序的问题。LSTM 可以被视为用一种规则化的方法来模拟时序,但 GPT 以一种非常完整和优雅的方式处理时序问题。从应用角度来看,它可以形成非常良好的多轮对话。所以,第一它有多轮交互和长期记忆,第二它有创造力,这两个东西可以产生完全不同的结果。我们在 2022 年底意识到这个事情,认为它将对各行各业都产生改变。接着,我们开始去找美国的高中生去谈,主要是从社交角度问他们在花时间最多的地方是在哪里。我们发现课后作业是花费时间最多的地方。学生卡在课后作业了,但仍然需要完成作业,所以课后作业是刚需。无论是写论文、做题、做研究还是看书,他们一定会有不懂的地方。那么他一定要去解决问题,所以这是刚需。
第三,学生现在是怎么做这些题目的呢?美国的高中生目前主要是在 PC 上使用 Google 或 Chegg,通过撞库的方式来搜索相应的题目。相当于我有一个巨大的题库,搜索时就在题库里查找并选出和这道题目最相似的题目,比如用于做数学题的 Photomath 和 MathWay。我们发现虽然用户的需求可以分为两类。第一类是"hit and run",意思是抄完答案后,什么事情也不想,直接跑去玩了;第二类在完成作业后,他们心中空荡荡的,有罪恶感,在想我是不是还要把知识学明白。**后我们发现大多数的用户都属于第二类。做完作业后,他们其实还是想了解这件事的过程。只是他们可能在某个题目上卡了 15 分钟,父母也无法帮助解决,最后不得不用这个答案。但答案如果就是一个答案,那并不能解决他们的问题,他们还想问额外的东西。譬如这道题目用了什么定理,最后他怎么去证明这个问题。我意识到,当时的技术已经完全达到了可以解决并回答他们问题的水平。它不仅可以帮助他们完成卡住的作业难题,还可以教他们如何解决这个题目。
举一个简单的例子,比如 A 除以 B 等于 C 除以 D,学校里都讲交叉相乘,它是指 AD 等于 BC。有一次,一个小孩问我 A1 除以 B1 加上 A2 除以 B2 等于 C 除以 D 如何使用交叉相乘。这显然是不行的。如果他只看到答案,他可能就糊涂了,因为老师只教过他交叉相乘,他不知道该如何处理有加号的情况。作为一个好的老师,我们应该告诉他什么?首先,交叉相乘只是老师为了方便记忆而简化的说法,在数学定义中并没有交叉相乘这个概念。交叉相乘的本质是等式的两边可以乘以一个相同的数。它的目的是让式子中间没有分母。基于这一点,当公式包含三个带分母的部分时,我们要做的不是考虑如何交叉,而是考虑如何去掉分母。我们应该将三个分母相乘,或者乘以它们的最小公倍数。通过这样的讲解,这个小孩才能明白,而不是只看答案。因此,AI Tutor 可以通过良好的 fine-tuning、RAG 和其他技术,将我刚才的过程解释给学生听。在原来的拍照搜题的模式下,它只是给出了答案,学生并没有理解。
ZP:你将用户分为两类,一类是那些只想解决问题的人,而另一类则对问题背后的原理感兴趣。在整个用户群体中,第二类人所占比例有多大?
周立:我认为这是一个会随着 AI Tutor 做的好与不好而改变的比例。如果这个老师只会成天让学生背交叉相乘,那么这个比例会越来越高。这个世界上有一波死硬分子,他们对做题毫无兴趣,只是在完成任务而已。死硬分子在中国和美国都存在,但我认为在美国的比例会非常低。因为美国的大学并不过分强调成绩本身,而是一个发展导向的教育系统。举个例子,我们在德州**时,有一位学生梦想成为一名厨师,那么他为什么要学习代数?他只需要获得高中毕业证就可以了。他不需要这么复杂的知识。如果这些学生连最基础的知识都不想学,那他们就不应该学这门学科,而是应该去找自己喜欢的事情。这就是发展导向的教育。但前提是他们要完成六年级,拥有自主学习的意识。六年级以前的小学生可能还没有自主学习的意识,但到了七年级之后,当他们有了自主学习的意识后,我们应该鼓励他们去找到自己感兴趣的领域。
在中国,存在一个普遍问题,即整个教育系统呈现线性、选拔导向的特点。同时,家长在其中扮演着过度干预的角色,也就是我们常常提及的“鸡娃”现象。这种现象表现为家长为孩子设定一个明确的目标,并据此进行校验。举个例子,在高考志愿填报时,人们常说“一分都不能浪费”,意味着即使孩子考了 600 分,如果他特别喜欢一个只需要 580 分的学校,家长也会坚持填报一个分数线更高的学校。这种思维方式正是线性思维的一种体现。
在了解了一些情况后,我意识到 AI Tutor 可以帮助学生们自主学习他们感兴趣的内容,而无需被迫学习那些他们毫无兴趣的领域。这样的教育方式更加符合个性化学习的理念。
ZP:我看到你的 LinkedIn 上有一段话:“Early on I became passionate about the ways people will communicate in the future. I quickly began working on ideas to create expressive, adaptable communications software and apps utilizing LLMs and NLP models to make effortless applications in this current smart-tech era.”写这段话是什么背景?
周立:这是十年前我的一个想法。我认为使用NLP或各种各样方式是可以帮助人们表达他们的意愿,在沟通方面做得更好。随着 AI 技术的发展,它所能做的事情已经非常多了。从这个角度来看,我做 Answer AI 的时候,我能更加落地地实践这个想法。我之所以强调做好人的表达,是因为我意识到人们可能需要多样化的个性化服务。然而,在过去,我们过于关注对方,例如,教育机构花费了大量心思去考虑如何实施个性化教学。但如果我们从表达的角度出发来审视这个问题,它实际上是如何更好地让学生表达他们的学习需求。这与搜索和今日头条的信息流推送有些相似。今日头条将搜索转变为信息流的过程,其实就是利用简单的方法和算法来寻找符合用户个性化需求的内容,这种方式其实是在帮助用户更好地表达自己。这是我认为 AI 价值所在的地方,它值得我用职业生涯的三分之二去做这件事。LLMs 这个词是我后面加上的。虽然 NLP 这个词现在用的不太多,但在我看来这两个声音是一致的。
ZP:请你介绍一下 Answer.AI 这个产品是做什么,提供了什么样的服务和功能?
周立:一句话来说,Answer.AI 是现在美国最大的一家移动的 AI Tutor,有超过 200 万用户,用户群体主要是中学生,这里我指的是从七年级以上、高中生再到 AP,再到一部分的大学生。9 到 12 年级的高中生占六成以上的比例。
这个产品核心的点是你可以与一个 AI Tutor 对话,你可以做拍照、搜题、解题。而且在拍照搜题完了以后可以与 Tutor 继续的去做深度的问答。同时 Tutor 也可以在你写 Essay 或 Report 的时候找到更多的 Reference。此外对于各种图表的题目我们还有独特性的深度处理。
我们认为 AI Tutor 的 0.1 版本是拍照搜题。我们现在做的是 AI Tutor 的 0.2 版本——拍照解题+论述。我们认为未来 1.0 版本的 AI Tutor 应该是把管理整个学习环节,特别课后学习的环节。我们现在是个 0.2 版本,距离 1.0 版本还很远,但在 0.2 版本的赛道里我们比别的人跑的远一些。
ZP:现在 AI Tutor 的 0.2 版本,和拍照搜题的 0.1 版本相比,它的区别是什么?
周立:第一个区别是用户可以与 AI Tutor 进行持续讨论,直到用户可以清楚理解。0.2 版本已经有相应的对话功能,用户可以给他出题或者做一些学习辅助的功能。0.1 版本的交互是一来一回,用户给 Tutor 一个题目,Tutor 输出答案就结束了。0.2 版本不光是输出答案,还会Propose给用户各种各样的东西,让用户自己选择输出的内容究竟是不是对的,Tutor 还会告诉用户一些方向上的 Reference。
1.0 版本是 Tutor 主动,他主动找到用户不明白的东西,给用户做规划,然后主动去跟用户做各种各样的交互,同时辅助用户完成学习。他的触发不一定非要是由拍照或者提问来进行。现在的 0.2 版本还是由拍照和提问来触发。但未来的 1.0 版本是 Tutor 主动帮学生规划出来。
ZP:之前你提到目前市场低估了学生们的好奇心,这个思考和观察和你的产品路径有关吗?
周立:我先讲下我对于这个学生的 Curiosity 的看法。我跟国内很多教育从业者聊过,他们对于国内的教育,对于从学生这边来获取收入特别悲观,是因为在中国选拔导向的教育体系里面待久了之后,会认为学习是一个纯被动的过程。一个国内教育行业非常资深的人士提到,“绝大部分学生是不想看到教育产品的,所以在教育产品里推什么都没有用”,学生对教育产品是有情绪的。
第一件事是,目前看下来,学生主动地去用学习产品只有一个情况,就是当他碰到问题卡住的时候,那么在解决问题的过程中,给予其良好的引导,如果他觉得这个产品是在帮他,而不是硬塞的一个任务,他是没有那么强的抵触情绪的。在我们的产品上,我们能看到的是 65%以上的学生在他拿到答案之后,依然在他的 AI Tutor 交互,这部分人肯定不是对 Tutor 厌恶和避之不及的。拿到这个答案,用户仍在持续提问是为什么,这就是 Curiosity。
第二件事是,我们现在的付费体系是用户每天可以免费用十次,超过十次的情况下,才有必要去买年费。在美国,就学生的作业量而言十次是足够使用了!那么买月费和年费的人,肯定是对学习真正感兴趣的。
这两件事情我觉得就已经可以说明,这部分有好奇心的用户是真实存在的。
ZP:你刚才提到情绪,你观察到用户在用 Duolingo 的时候,用户有情绪吗?
周立:我觉得它是正向的情绪,用户会把这个东西当做一个游戏在玩。譬如我就在 Duolingo 上学越南文,如果有一门越南文的课程,他规定我一个月内一定要学多少,下个月一定要学多少,学到什么时候会有一个考试,我可能看到越南文就头疼,但我现在居然主动在 Duolingo 上学越南文,还学得挺好的,这是因为 Duolingo 给了我一个正向体验。
ZP:你觉得我们在产品设计上怎么做去做,能够让用户没有情绪,或者让用户的这个负面的情绪更少一些?
周立:首先,AI Tutor 在形式就会比原来的产品要好。老师有三个身份,就像韩愈说,“师者,所以传道受业解惑也”。第一个传道是言传身教,老师首先是你的道德楷模,所以学生见到老师的时候是上对下的关系。第二个授业分为两部分,一部分是教给你知识,还有一部分是就认证,就是现在的文凭,在古代说的是谁谁谁的弟子。第三个解惑是你问什么问题老师帮你解除疑惑,解惑这个事情是 AI 最擅长做的,因为解惑得要基于双方平等状态下的对话,学生心里才会比较舒服。如果是一个地位比你明显高的、能掌控你传道授业的名师,你和他聊天的时候,也许会觉得这个老师和你是有距离的,有很多想问的问题都不敢问。在这一点上面 AI Tutor 有天然的优势,它可以和你在一个平等位置上进行交流,你不会把他当做你不敢问的人。
其次,如果这个朋友的嘴特别严,在和他聊天的过程中不会有很大压力。我们后面可能还会有一些激励性的功能,比如说要有成就系统,当你完成得比较好的时候,可以增加每天的对话次数,可能还会做一些更多的偏游戏化的东西。
所以综合来看 AI Tutor 它从产品基础上就会优于其他的各种教育产品。
ZP:你刚才说我们目前在 0.2 版本,那下一步如果要优化到 1.0 版本,我们还需要做哪些事情?
周立:今天来看,要做的事情全行业都不太明白。但我们现在有做事情的方法。核心就是得抛弃原来的 DAU/MAU 这些,不把它们当作我们产品里最重要的事情,我们需要找到究竟有多少人在用这个产品真正在学习,而且是在反复的回来学习。这部分用户才是产品的真正用户。我们现在做的所有的产品功能都是在验证这类用户有没有因此而变多,比例有没有增加?他们是不是真的喜欢现在的功能?我们更多关注的是 Really Learning(真正在学习)的用户在做什么,我们不断迭代新的功能,然后在我们用户群中,找到哪些是他们真正感兴趣或者经常使用的功能,这是和传统互联网产品不一样的地方。
ZP:那你是怎么样去观察他们的需求,以及如何把他们的需求转换成产品?
周立:需要每天去看一下 AI 和用户的对话,去看它的 Raw data,你就慢慢会知道会有些什么样的需求。譬如说,在美国有很多人写 Essay 的时候需要正反两面的观点,但表述出来的时候可能就会变成“能不能给我关于这件事情你的评论?”。举个例子,在分析马歇尔计划的时候,题目的问法是“你觉得马歇尔计划对欧洲究竟是好是坏?写一个这方面论述”,但用户提问的时候可能会这么问“你能不能直接告诉我马歇尔计划对欧洲是好的还是坏的?”。作为一个 AI Bot 我不应该回答这个答案。但是用户确实问出了这个问题,而他真实想表述的意思是他需要知道马歇尔计划对欧洲影响优劣的两方面观点,然后他依照这些观点,自己去查阅资料,慢慢去找到最后的论述,这是题目在教育方面的本意。在诸如此类的问题上,如果你不去看对话流程的话,是猜不到用户会有这些的 Prompt 的。我们需要知道用户究竟想要从什么角度去提问,然后把这些东西转化为合适的角度,再去给用户提供相应的答案。
ZP:目前大语言模型的技术发展,是否足够支撑我们开发一个你心中理想的 1.0 版本的产品?如果不能的话,还需要有哪些能力上的提升?
周立:第一个问题的答案是现在的 LLMs 肯定还不够好,但是这个不仅仅是需要技术层面的进步。LLMs 的目标是希望模型尽可能像人类,像人类一样和你对话,提供给你很多帮助。我希望通过我自己对教育行业的理解和对用户需求的理解,可以让 LLMs 当好一个老师。
目前 LLMs 是有一些不好的地方,譬如他会说胡话,会有 Hallucination(幻觉),所以需要给模型很多的训练。我不认为教育行业可以把所有的 Hallucination 解决掉,但是对于课纲范围内的事情是可以解决的,这个也是我们要做的。现在最主要的事情是由于落地的AI应用太少,所以 LLMs 厂商现在不知道该怎样去给第三方应用开放一个良好的 Plugin 和 API,只能基于 LLMs 厂商自己的想象去做。譬如说对我们这样的公司来说,GPT Store 完全满足不了我们的需求。还有譬如说它里面的 Plugin 功能的前提是用户要先到 ChatGPT 来问,问的时候我们也无法把控用户什么时候能触达到我们。而教育行业要求的是学生获得的信息,要是 Authorized 的信息,是不能给学生错误的,或者是完全胡说的信息,而我有自己的符合教育这个场景的调研方式,我不认为 LLMs 厂商在技术上做不了这个事情,而是应用场景太多了,但在应用方面落地的公司又太少了,所以他们根本不知道如何为第三方应用公司提供服务。
换种说法就是全行业对于“LLMs 应该做什么?LLMs 上的应用厂商应该做什么?”的认知还非常模糊,这两者之间的分界线是不清晰的。LLMs 的目的创造出一个 Decent Person,而 Decent Person到 Best Teacher 之间是有一个 Gap,作为一个 AI Tutor 公司,应该是我们来补齐这个 Gap。
而在 Decent Person 这个层面上,现有的技术的基础架构是够的。但因为界限的不清晰,导致 LLMs 厂商不知道这个 Decent Person 要多做什么、少做什么,有一些明明可以做好的事情但目前还没有做好。LLMs 在未来一定是可以做什么的事,它的能力是动态改变的,一定是越来越接近。LLMs 作为一个 Decent Person 和我们公司把一个 Decent Person 训练成一个很好的教师,这件事情的瓶颈不见得会在 LLMs 模型本身,可能会在 LLMs 厂商没有想清楚分界线和如何给第三方应用提供服务上。
ZP:OpenAI 最近发布了 GPT-4o,这对我们有什么影响?
周立:GPT-4o 把我们应用行业和基座模型行业的边界定义的更清晰。LLM 会解决知识性的问题,尽量把准确性做的更好,把解释性的工作也可以做好一部分。
Tutoring 和其他 Agent 公司更多是做前置和后置的部分,比如在前面引导学生学数学;完成之后,是对学生的评价。引导和评价合起来是激发学生学习动力的过程,这两个部分是 tutoring 公司来做。
其他的东西更多是 LLM 本身来做,这省去了 tutoring 公司和 LLM 重叠的部分,包括 finetuning、垂直模型,这些都没意义了,这些东西都被 GPT-4o cover 了。但是 GPT-4o 把边界定义的更清晰了,前置和后置的工作需要 tutoring 公司来做。
GPT-4o 对行业的发展是正向的,但 tutoring 公司需要想清楚自己能做什么。
ZP:我们一方面希望 AI 能力更强一些,但另一方面,AI 基座模型的能力比我们想象的成长速度都更要快,那沉淀在 Answer.AI 产品上的最有价值的资产会是什么?
周立:我们首先是个教育公司,其次才是 AI 公司。作为一个教育公司,我们思考的问题是如何给目标用户提供更好的服务。我们沉淀的最有价值的资产是学生在现阶段对 AI Tutor 的用例是什么样的,这是第一步,也是在 AI Tutor1.0 之前,让我更快地冲向 AI Tutor1.0 的第一步是了解用户如何使用 AI Tutor。
在实现了 AI Tutor1.0 之后,作为一个 AI Tutor1.0 的公司,我们所沉淀下来的东西是用户的个性化数据以及他与整个美国教育行业的对接。因为师者,传道授业解惑也,AI Tutor 只能做到授业的一半和解惑的一半,而没有认证的功能。
教育有三个目的,一个是人的理性思维能力,一个是道德水准,还有个身体素质。那道德水准和身体素质是需要老师言传身教。AI Tutor 目前取代不了这个事情,所以后面要做的事情是与老师得对接起来,这个对接过程和个性化这两件事情,是非常久之后 AI Tutor 公司做的事情的实质。
ZP:Answer.AI 的长期愿景是什么?
周立:我觉得 Answer.AI 在尝试解决美国教育的平等性问题。即使是线下辅导班,对于比较贫穷的人来说,他是很难获得较好的教育服务的学校,比如私校里面一个老师对 15 个学生,公立学校里可能一个老师对 120 个学生,这就是教育资源上不平等。未来你可以通过 AI 使得不同水平的人都用在低廉的成本下能享受到良好的教育服务。因为可能我们的最基础的成本就是服务器成本,一个月也就几美元。最终学生是通过 Answer.AI 在做很多知识性的事情,通过 Answer.AI 来学习。
X+AI,基于 AI 技术在教育行业高维打低维,为 C 端学生带来价值
ZP:回到我们创业的起点,为什么选择做 AI Tutor 这个方向?
周立:我的思考方式不是说我要做 AI,而是在某个行业中,我有一些别人没有的 Know How,再把 AI 技术迭代进去,很多事情就会变得非常清楚。在这些事情里能够成长得起来的有两类公司,一类是“X+AI”,一类是“AI+X”。
“AI+X”类公司的特点,是对 AI 这件事上有独有的认知,譬如说在某方面可以省成本、可以造出来某种特定的芯片......。一般来说,这类公司主导者往往是在技术方面非常厉害的人。
“X+AI”类公司,往往是由产品人主导,而且是团队里对于「X」这个行业有 Know How 的人。X 可以是教育、可以是医疗、也可以是其他的行业。首先要想在这个行业里需要什么东西,再看现有的 AI 还可以帮助我做什么。这类公司对原有行业而言是高维打低维,它的成功概率会高一些,但可能没有那么通用。
我自己既有技术背景,也有产品背景,而且产品背景可能稍微多一点。我现在选择的是“X+AI”公司。这一次AI热潮中,我希望“X+AI”类公司会更多一些,因为市面上更缺的是这类公司。因为目前“AI+X”类公司表面上的技术领先是非常暂时的。当 OpenAI 或行业内最好的几家 AI 公司在融了数以亿计美金的时候,很多技术上的小改进很容易被填平。
ZP:目前赛道的这个竞争格局是怎么样的?从终局来看的话,你觉得会是什么样的一个格局?
周立:我看到有价值的玩家有 Khan Academy、Duolingo,以及还有一些新兴公司,这些公司的特点是,它们原本在美国是有一些教育底蕴的,而且是做 C 端产品的。之前美国教育市场里 B 端产品非常多,因为美国原先大部分的教育资金是给学区、教师或者是给政府的预算,所以很多美国教育公司是面向 B 端的,做 C 端付费的公司没有像中国这么大规模的,因为中国 C 端有一个特殊的群体——家长,以前的美国是没有一个家长愿意付费的。
今天在美国,我们所面对的是一个“学生作为消费的 Decision maker,可能会由家长代付”的市场。之前最大的几家公司估值很低,比如 Chegg,但这几年我们会发现 Duolingo 这个公司发展得很快,而且 Duolingo 通过 C 端在慢慢侵入一些B端的认证市场,Duolingo 的英语认证已经是美国第三大认证,这些事情表明大家已经发现了新的商机。我认为当前赛道的主要竞争对手是能够发现教育在 C 端市场有价值的美国传统教育科技公司,以及一些美国初创公司。
ZP:那么在大学阶段,我们的竞争对手会是大学里的助教吗?
周立:大学助教的钱不是由学生付的,而是由教师付的。但有一个类似的 C 端付费的产品 Kumon,是美国的一个连锁线下辅导班,有很多家长在放学之后会把学生放在这个辅导班里做题,除了辅导以外,还会有托管的意义。在美国很多地方都可以看到这样的在线咨询室,还有一些线上答题的产品。
但我认为我们的竞争对手是真正瞄准 AI Tutor 这个赛道的,会想在 C 端有没有可能让学生真的能够通过 AI Tutor 学到东西,如果这家公司有这个思路,他可能会慢慢形成我们的竞争对手。但正如我所说,目前 AI Tutor 市场是从 0.1 到 0.2 的时期,我相信有很多人来做这个事情。但市场到 1.0 的时候会发生什么才是最重要的,我现在的状态是基本不怎么去看竞争对手,只想着自己能够想明白什么是 AI Tutor 的 1.0。
ZP:现在这个教育+AI 的领域里也有很多现存者和新进入者,最后大家比拼的核心点是什么?
周立:最核心的还是谁能够搞清楚 AI Tutor1.0 最后应该是什么样的,最终要有一个用户喜欢用的 AI Tutor 产品,最后大家比拼的是产品。这是一个综合能力,你要有产品、技术、运营,甚至商务、资金等各方面的能力,不是看单个能力。而且也不是一个人在中国可以做得好的产品,因为这个产品太关系到本地的教育机制。
Answer.AI 的差异化优势,定位上第一主做 ToC、第二主做课后,以及我们不以传统 DAU 作为指标,而是以真正用产品在学习的学生作为指标,不在乎最后挣回来的钱是否是行业最多的,在乎的是在 APP 上真正学习的用户是不是全行业最多的。
再出发,做最适合自己过往经历和能力禀赋的事儿
ZP:作为创业的一号位,具备什么样的素质是最重要的?
周立:勇气、求真、耐烦。勇气是指意味着当你碰到一个事情的时候,能不能尽可能做好的决断,要敢于下别人不敢下的决断;求真是指你要看到所有的事情一定都要是真实的事情,而不能够用某些东西糊弄自己、糊弄别人。成本是巨大无比的。当你错失一个信息的时候,所有的决策会带来非常大的损失;耐烦是指你一天到晚会处理很多看似与现在公司没多大关系、很无聊的事情。而且你可能会觉得这件事情不是你来做。但作为一号位,作为最后一关,漏下来的很多是一些很垃圾的事情,这个时候你需要耐烦,要控制好自己的情绪,要把这些问题一个个解决掉。
我觉得在知识性和别的东西上都会有别人帮你补齐。但创始人需要去思考愿不愿意成为这样的人,如果最后答案是这不是你真正擅长的事情,那最好别去选择做一号位。
ZP:你现在创业还会有痛苦的时刻吗?
周立:在我前几次创业里,痛苦和快乐或兴奋共存的时刻是比较多的。可能到我第三次,第四次创业的时候,这已经成为我习惯的生活状态了,在我看来创业已经是一个比较平和的事情。
而且这次创业我的思考角度可能不太一样,更多的是站在“我适不适合做这件事?”、“我有没有可能比全世界别的人做的都好”这些角度去考虑。我思考之后觉得这个事儿确实是非常适合我做,第一是因为我自己当过数学老师,教过课,我了解教学本身是怎么回事,学生这边会有什么样的需求;第二是我自己搞过 NLP;第三是中国创业者做增长和做 C 端的能力是远远超过全行业的,这是移动互联网内卷的结果;第四是我做了十年的美国市场。这几个能力拼到一起,我觉得找不出第二个创业者符合的。到今天为止,这次创业是基本符合我的预期的。也有一些很令人兴奋的点,就是美国用户对AI的接受程度,这个的发展速度远远快于我的预期,这件事情对我来说很兴奋的。
ZP:过去一两年的时间是AI发展非常快的时间段,在这个时间段里你有没有印象比较深的一件事或者一个人?
周立:有一件事儿,是和之前一个在 Mistral 工作的朋友聊,我觉得这个人特别厉害,他自己一个人做了(在我的认知里)以前需要一个团队才能做的事,而且跟以前的团队构成不一样的是,他的团队是由一个 Super Engineer 和 5、6 个初级工程师构成的,就把产品里的某一块技术架构搭起来了,而且这些初级工程师完全不知道他们在干什么。我问他是怎么做到的,他说 LLMs 出来以后就教这群初级工程师自然语言编程,Mistral 在线上提供服务的某些东西是由自然语言编程编出来的,他们让这些初级工程师用自然语言编程编写初级代码,然后由一些 Super Engineer 改出来,这样可以把一个 Super Engineer 的带宽提升到原来 4、5 倍以上,这是令我印象非常深刻的。
它意味着 AI 的兴起不仅改变了行业格局,也促使公司内部组织结构发生变革。原来在 Google 的时候是 10 个非常优秀的工作者在一起工作,现在可能是 1 个非常优秀的工程师和N个普通水平的助理。10 个非常优秀的工程师可能变成了三 3 个,他们每个人带 10 个普通水平的助理,然后他们自己之间碰触一些火花等等,那时候我意识到我们原有的工作模式可能会发生巨大的变化。
ZP:最近你看到的觉得最有意思的 AI 产品是什么?
周立:最有意思的 AI 产品是有一个做 PPT 的产品——PopAi,效果非常好。我用它做过广告。基本上我现在需要的东西,这个产品都可以做出来,配图配的非常好。还有 Perplexity,我原来认为它的用户可能更多的是像我这样的职场人士,现在发现学校里也已经有很多人在使用它写文章,当然它有一些东西是没有经过权威认证的,譬如他会从互联网上搜出来内容后丢给学生,但目前学生已经很爱用。
ZP:给我们的读者推荐你最近在看的书或者是印象深刻的文章。
周立:我最近看了印象深刻是李光耀的《李光耀观天下》。这本书是李光耀去世前不久写的关于各大国之间关系的书,我看完以后觉得李光耀对很多的事情看得非常准,而且我从李光耀的人格中间也学到很多,比如他是怎么当 Leader 的,我认为李光耀是一个非常厉害的 Leader,他领导的是个国家,但我们可以将新加坡看作一个拥有几百万人的公司,他的管理方式很厉害,值得一看。
ZP:你自己有什么日常的兴趣爱好吗?
我自己是个桥牌爱好者,我有时候会打桥牌比赛。我自己曾经在北京青年队里面,我打到过全国的亚军。而且我招人的话也觉得这是个很重要的指标,我希望他都有一个额外的爱好,并且在这方面最好有不错的成绩。
【本篇文章属于白鲸出海原创,如需转载:需联系授权方可,未经授权严转载!】
友情提醒:白鲸出海目前仅有微信群与QQ群,并无在Telegram等其他社交软件创建群,请白鲸的广大用户、合作伙伴警惕他人冒充我们,向您索要费用、骗取钱财!