Tumgik
readonline · 6 days
Link
0 notes
readonline · 20 days
Link
0 notes
readonline · 26 days
Link
0 notes
readonline · 2 months
Link
作者 | 张小珺
出品 | 腾讯新闻 《潜望》
金沙江创投主管合伙人朱啸虎很快对美版AIGC故事丧失了兴趣。他随即决定不再和美国同事开原定每周一次的远程例行会议,探讨两边大模型产业格局变化。“打了半年我不打了,没有意义。”他说。
中国科技界针对大模型的态度已分裂成两股阵营。一股是技术信仰派,他们大多技术出身,认为应该像OpenAI一样信仰AGI、信仰scaling law(规模定律),思维更偏硅谷。在他们眼中,随着模型能力跃升、模型成本降低,过程中会解锁丰富的应用。倘若不追求“更大更强的AI能力”,一旦其他人的模型飞跃,很快会降维碾碎现有根据地与护城河。
另一股是市场信仰派,他们信奉陡峭的技术曲线终有放缓的一天,只需将“足够的AI能力”投入可以快速变现的商业场景中,用中国市场庞大而独特的数据构筑壁垒。这类人往往在中国丛林式的商场中浸泡更久,思维更偏本土。
二者对技术判断的一个根本分歧是,开源模型会不会有一天,缩小甚至拉平与闭源模型的差距?技术信仰派的观点是,绝对不会,差距只会更大。市场信仰派的观点是,一定会,那意味着你今天做闭源只会处境尴尬——世界观的迥异,让双方对自我的判断都深信不疑。
有趣的是,Sora的出现不但没有弥合认知沟壑,反倒是加强了各自的态度。
我们试图呈现这两种态度。就在几天前,我们发布《
月之暗面杨植麟复盘大模型创业这一年:向延绵而未知的雪山前进
》,杨植麟是技术信仰派代表,而朱啸虎的观点正好处在与他相反的另一端。
事实上,市场信仰派在中国人数更众,特别是在当下资本泡沫破裂的无奈氛围下。只是,他们有时会羞于展露自己的真实想法——会被鄙视为“不信仰AGI”,或不为人类理想而战斗——所以他们大多数时候选择性沉默。
朱啸虎毫不怯懦于公开表达。他近期似乎迷上了这样一句话:“AIGC PMF(Product/Market Fit,产品/市场匹配),你十个人找不到,投一百个人同样找不到。”某种程度上,他的观点是展现了一个更现实版的中国AIGC故事。
你说这些有压力吗?
“我也没啥压力。”
你的观点比很多人都更激烈,在线下被同行或者创业者怼过吗?
“没有啊,我问的问题都回答不了啊。谁能回答出来?”
在你看来,中国的AIGC应用已经大爆发了?——外界没有人这么说。
“已经大爆发了。大家都不知道!”
这位1974年出生于上海,父亲是数学家,在上一个时代成名作有拉手网、饿了么、滴滴、ofo等的知名投资人,有很强的个人语言风格。他在我们的整个访谈中总共说了16次“PMF”、15次“说实话”、13次“没有意义”、13次“不烧钱”、11次“妈的”,还有20次“哈哈哈”。读起来时常想要笑起来。所以,文章尽量保持了他说话风格的原汁原味。
他看上去心情不错。他说过去一年投资人休假很多,见面这天,他就刚休假回来,还看完了电视剧《繁花》。由于被投公司现金流不错,他一点也不焦虑,连一根白头发都没有。
以下为访谈节选。(为方便阅读,作者进行了文本优化)
“我信仰AGI,
但我信仰应用啊,
我信仰能马上商业化的”
腾讯新闻《潜望》:你是什么时候确定,你不会投场上任何一家中国大模型公司的?
朱啸虎:我们一看就知道,这个肯定没戏。
腾讯新闻《潜望》:一看就知道是什么时候?
朱啸虎:他们出来融的时候。我们一开始就说了,我就不看好大模型。
腾讯新闻《潜望》:第一家你看的谁?
朱啸虎:我都不愿意去聊,你知道吗?这没有意义——这些公司,要场景没场景,要数据没数据,你说它有什么价值?而且一上来估值这么贵。
“AI四小龙”(云从科技、商汤科技、依图科技和旷视科技)投资人赚钱的没几个,对吧?回到大模型,结果可能还不如“四小龙”。“四小龙”早年还是有些黄金时代的,一开始收入上去算挺快。大模型你有啥收入啊?
关键是我就现在问你一个很扎心的问题:GPT-4你要不要投入做科研?你做GPT-4科研至少砸四五千万美金。
腾讯新闻《潜望》:(做科研)到GPT-5?
朱啸虎:不是,到GPT-4!!GPT-5要几亿美金!
关键是万一你砸了四五千万美金做出来,别人开源了呢?你不是全白砸了?这个是很扎心的问题。现在中国大部分公司,有几个敢真的砸钱去研发GPT-4的?
今天到GPT-3.5,大家都差不多,但GPT-4是要做一些研究的,不是那么简单,现在还不完全是工程问题。那你万一砸下去,又等别人开源了,你不是全都白砸钱?大厂肯定要自己做。创业公司你敢吗?
腾讯新闻《潜望》:都说要做。
朱啸虎:真的敢砸钱的,心里肯定很虚的。
腾讯新闻《潜望》:你在2023年上半年决定不投大模型公司的时候,压力大吗?另一家没有参投大模型公司的基金,就表示压力挺大。毕竟大部分一线美元基金都入场了。
朱啸虎:不大啊。为什么压力很大?中国VC从来没有靠共识赚过钱。
腾讯新闻《潜望》:也有从业者说,如果你在2023年上半年承认自己不看好大模型,会被视作没有信仰。
朱啸虎:什么叫没有信仰?哈哈哈哈哈。
腾讯新闻《潜望》:不信仰AGI(通用人工智能)。
朱啸虎:不,我信仰AGI,但我信仰应用啊,我信仰能马上商业化的。
“马上能变现!马上能变现!”
腾讯新闻《潜望》:你过去一年投了哪些AIGC公司?
朱啸虎:很多不一定是过去这一年投的,但它转型做AIGC反而很好,我们再追加投资。
有个做AI视频面试的,2023年做得非常好。这让我很吃惊!去年招聘市场很冷,但它AI视频面试比2022年翻了一倍以上。哈哈。招多少人我不知道,但面试还是要面的。校招面试成本很贵啊,现在用AI可以降低成本。
这种场景很多。本来做微信私域营销,现在可以用AI取代人——用LLaMA训练两三个月,至少做到人类top 30水平,马上去掉50%人工销售。中国在这方面场景远远领先美国。
FancyTech,你知道吗?——我给你看看——AIGC视频广告,这个很酷的。他们产品做得特别效果好,而且马上能变现。2022年我们投的时候才1000多万收入,去年5000多万了,涨了五六倍,都是盈利的。你说这个在美国能做吗?美国根本做不出来!Pika(一家全球炙手可热的AI视频生成公司)今天根本做不出来的!
腾讯新闻《潜望》:如果底层是大模型能力,上面应用公司构建的壁垒是什么?
朱啸虎:数据啊,美国没有产品短视频数据。在美国看亚马逊、Shopify,还是基于照片。所有的电商,美国基于照片。中国过去三年全部转成短视频了。
腾讯新闻《潜望》:可是其他中国公司看到效果好,可以立马抄一家。
朱啸虎:抄很难的,它比别人领先一年。很多垂直领域,都要积累数据、积累优化。他们60%-70%客户授权监控效果,就知道哪些视频适合淘宝,哪些适合小红书,哪些适合抖音,有闭环数据反馈。后面追不容易。
二是销售管理能力。大部分大模型创始人不知道怎么管销售。不懂商业化、不懂管销售,那你做什么?
你说AI视频面试也没啥门槛,但今天全中国只有一个做到人机双盲测试。人面试打分和机器AI打分基本一致。而且它是唯一能机器追问的——我问你一个问题,根据你的回答追问。现在客户抱怨面试时间太长,让机器追问少一点。
它的融资额是竞争对手1/10,但今天竞争对手都死了,只有它一家能做好。2023年招聘市场面试接近100万人次,今年至少200万-300万人次。所以,中国在应用层有很多机会。
腾讯新闻《潜望》:都是to B项目?
朱啸虎:对啊,都是to B。
腾讯新闻《潜望》:你没有投to C项目?
朱啸虎:to C有的,还有点早。to B马上能商业化,基本不用烧钱。
昨天我们投的一个公司说:AIGC PMF,你十个人找不到,投一百个人同样找不到。和人数、成本没关系的。
你不要去砸钱。砸钱做AIGC,不可能的!关键是找不找得到PMF。你如果找到PMF,不用砸几千万美金去砸个大模型,成本不高,拿LLaMA训练两三个月足够了。
像我们(投)的公司都不需要多少张卡,最差的就一张卡。Fancy可能十几张卡,现在收入高了,所以到一百多张卡。
腾讯新闻《潜望》:Sora横空出世,会对这些项目形成降维打击吗?
朱啸虎:还是会帮助。我们生成的视频,是大模型不可能100%做的,有部分人工、部分AI。今天大模型,尤其用Transformer这种结构一出来有幻觉和偏差,必然要整合到工作流,需要人工修改,去fine-tuning。你一定要做成AI 100%做不了的东西,这才是中国的机会,100%大模型能做的很快就被颠覆掉,你现在做的都是浪费。
腾讯新闻《潜望》:所以在中国的AIGC机会第一波爆发在企业服务,可以这么理解?
朱啸虎:短期内肯定做to B,起来快。iPhone、大哥大、电脑出来的时候,都是to B先用啊。马上能提高生产力、见到效果。企业愿意花钱。
to C要见到iPhone 3时刻。就像当年移动互联网to C应用爆发是Multi-Touch(多点触控),想不到的,对吧?愤怒的小鸟和切西瓜是Multi-Touch出来以后,才成为全球爆款。
大模型到底在什么点让to C应用爆发,不知道。今天说“个人助理”都是技术人员的想象。我就问你,有几个人需要个人助理?都是典型的伪需求!
腾讯新闻《潜望》:这些to B公司在AI上训练达到什么效果,会实现指数级提高?
朱啸虎:很简单,见到客户第一面就能签单。
见面签单,是一个考核指标,就是PMF。以前企服为什么难?销售周期长,半年,所以销售增长难。现在你给客户创造数量级价值提升。定制化那就没戏了,就是标准化服务、第一面POC(Proof of Concept,概念验证)、第二面正式合同。
腾讯新闻《潜望》:怎么看中国企服投资人都说这个赛道上没有大仗、更没有挣过大钱?(“一个billion return的机会都没有。”)
朱啸虎:美国企服公司第一年三倍,第二年三倍,第三年两倍,第四年两倍,很快做到一亿美金ARR(Annual Recurring Revenue,年度经常性收入)。中国以前的企服软件在几千万人民币的时候增长放到50%了,很难增长。AIGC出来以后不一样,去年很多公司增长三倍到五倍以上。
腾讯新闻《潜望》:你怎么看过去两年,一些投资机构中,企服赛道投资人被迫群体性消失的这个现象?
朱啸虎:哈哈哈。就是啊,这个说实话很可惜,没有熬到春天。中国企服还是有机会的,但可能还有三到五年冬天。宏观太多不确定,企服就是剩者为王。今天你能不能靠AIGC迅速达到不烧钱的爆发增长是唯一之路。
腾讯新闻《潜望》:to C大爆发需要iPhone3时刻,现在是什么时刻?
朱啸虎:刚刚iPhone1、iPhone2吧。大模型进化速度比移动互联网快了十倍。什么时候每个手机上都有大模型,to C应用可能会爆发。
腾讯新闻《潜望》:如果回顾2023年大模型,不管是全球来看还是中国来看,你会把哪些时刻作为关键节点?
朱啸虎:(此处思考了2秒……)LLaMA上线是非常重要的。
开源是完全不一样的局面,至少让中国在应用层面创新有基础了。LLaMA之前,很多套壳用OpenAI,是有点问题的。但LLaMA以后,至少没啥问题了。
我们那些CTO都很年轻,拿LLaMA训练个两三个月。最差的就一张卡,训练两三个月就马上能商业化了。大家想想看——这个商业化门槛真的很低很低。马上能变现!马上能变现!
腾讯新闻《潜望》:Google刚推出开源模型Gemma,相对之前的LLaMa、Mistral表现怎么样?OpenAI之后开源的可能性有多大?
朱啸虎:总体反馈比LLaMa 2好一点,行业里有些人觉得它要抢在LLaMa 3之前发,LLaMa 3也快了。OpenAI目前没必要,现在LLaMa、Mistral和Google,这三个在竞争。离OpenAI差距还远,如果他们表现追上GPT-4,OpenAI开源一个小模型也有机会。很多垂直应用,我们发现Mistral 2比LLaMa 2好用。
反正开源一个模型,我们都试试,看看哪个更好用一点。
“这是典型的FOMO嘛”
腾讯新闻《潜望》:我问2023年中国大模型卷了一年卷出了什么?一位投资人告诉我,卷出几家大模型创业公司。
朱啸虎:再过一年再看看吧,这几家能有几个还在?
腾讯新闻《潜望》:他们每一家你都看过吗?
朱啸虎:我一看见这个概念就知道没戏的,没有可能性的,我一个都不聊。我都很熟的。王慧文(美团联合创始人、光年之外创始人),我这么熟,我都不愿意去找他和他谈这个事。
腾讯新闻《潜望》:你属于他上一场战争���的敌人战队——他在美团阵营、你在饿了么(作为投资人)。
朱啸虎:没有、没有,和他私交很好的。
你说这些创业公司有啥资格、有啥条件去做大模型?百川发布了给游戏的NPC(角色大模型),你有啥数据去训练游戏的NPC?大厂有大把、大把的数据。我们让一家公司去体验了一下,没看出任何差别。
腾讯新闻《潜望》:当王慧文振臂一呼,说要入局大模型的时候,你是什么反应?
朱啸虎:大家冷静一点,让子弹飞一会儿。飞半年,你就知道到底行不行了。
腾讯新闻《潜望》:一个正常的投资人不应该是,我先想办法入局再说?
朱啸虎:很便宜的话入局,大家还试试。这么贵的估值,去那干嘛啊?
我根本聊都不愿意聊。现在和这个“四小龙”时不一样,“四小龙”是在资本泡沫时期长大的,一轮加一轮呢,根本不停的。你到今天为止,现在谁还能融下一轮?今天这个国产大模型基本都要找政府拿钱,政府的钱现在也不好拿了。而且,估值已经抬到这里了,你后面的估值怎么弄?
腾讯新闻《潜望》:王慧文携5000万美元入场和突然的病退离场,在大模型战事里扮演什么样的角色?
朱啸虎:这就是技术男的浪漫主义,王慧文没有想明白这个事,他的擅长在商业化。他一开始如果做应用,结果肯定比现在要好很多。
那个时候,大家就FOMO情绪比较高涨的时候。
腾讯新闻《潜望》:怎么看一些基金在这波大模型公司中的布局?
朱啸虎:有些是典型的FOMO嘛,就是Fear of Missing Out,怕错过。
腾讯新闻《潜望》:你不怕错过?
朱啸虎:我们无所谓的,我们有啥好错过的?当年移动互联网刚出来,大家想做中国本地化OS,后来这些公司都在哪里啊?
我们投了点心操作系统(李开复旗下创新工场孵化的第一家公司),后来还好,被百度收了。今天的大模型也要等大厂收,今天大厂怎么收啊?移动互联网的时候还没有反垄断,我们还赚点小钱嘛。
腾讯新闻《潜望》:如果你现在有一亿美金,必须要投场上的这几家基础大模型公司,你会怎么投?
朱啸虎:我和王小川在开会的时候见过。我说如果没有反垄断,我愿意投王小川的。至少能卖给腾讯或者阿里。有了反垄断,我不知道怎么退了。所以,我在会场上就和他说,不是说和他关系不好不投他,确实我不知道怎么退,所以大模型我就不愿意看,就不和他聊了——我和王小川说过的。
腾讯新闻《潜望》:你会投一家,还是投多家呢?一亿美金哦。
朱啸虎:王小川至少技术靠谱的,人也靠谱的,和大厂关系也还可以。
腾讯新闻《潜望》:如果一亿美金不一定非要投这几家基础大模型公司,而是用来布局整个AI赛道,你会怎么用这笔钱?
朱啸虎:应用啊。现在我们都是两三千万人民币先进去,好的话持续追加。
你十个人找不到PMF,一百个人同样找不到PMF。花钱是无效的。找到PMF以后速度上去很快,也不用烧很多钱。第二,管理销售能力是稀缺的。
腾讯新闻《潜望》:2024年会涌现中国大模型公司的并购或收购潮吗?——就像之前你见证过的美团与点评合并,或者阿里收购饿了么。
朱啸虎:技术的人,都是不相信我比别人差的。你说这个怎么合并?(笑)
第二,现在谁愿意并购啊?而且今天并购,如果大家都用LLaMA开源改一改,有啥东西是我没有的?我有数据,有场景,你有啥?你就有几个人。
现在可能并购就是为并购一个团队。这个团队值多少钱?你能花多少钱?和以前那个时代是完全不一样的。
腾讯新闻《潜望》:这些大模型公司的出路在哪?
朱啸虎:我也不知道。我都不愿意去关心这些事情。今天我对所有的公司就说,你有多少收入?你能不能不烧钱?都只关心这个。
腾讯新闻《潜望》:你在之前的采访中说,上半年投了大模型的投资人下半年后悔了。这是他们告诉你的,还是你猜的?
朱啸虎:这个就不好说了。肯定有人后悔的。
关键你下一步钱真的不好拿,你现在手上钱又不够。真的很尴尬。你GPT-4到底干不干?——不干,你和别人有啥差异性;你干,万一别人GPT-4开源,你又好后悔。你要做垂直场景,垂直场景哪一个你有优势?
腾讯新闻《潜望》:很多大模型公司现在沿着王慧文提出的“双轮驱动”在做。
朱啸虎:怎么双轮驱动?你双轮能转起来吗?有哪一个大模型双轮转起来的?百度,我说实话都不敢说自己双轮转起来。百度至少还有很多场景,文心一言至少做得早,至少有100万DAU。它也不敢说今年双轮驱动转起来了。
腾讯新闻《潜望》:但就在今年2月,月之暗面刚融了10亿美金,投资方是阿里、砺思资本、小红书等。据说其他大模型公司也在做这样大笔的交易。这意味着市场上仍然有人愿意投,而且不少。
朱啸虎:主要是大厂,大厂还是FOMO,怕自己错失。月之暗面大部分钱是阿里出的。
腾讯新闻《潜望》:阿里和月之暗面会形成微软和OpenAI这样的模式吗?
朱啸虎:需要看阿里的投资部和内部的调节了。这个还不一定,阿里内部也有好几个团队在做,这到底是要看谁好用,业务部门才会用。
腾讯新闻《潜望》:其他巨头接下来会也这么大笔地投资或者干脆并购一家大模型公司吗?
朱啸虎:关键是对内部团队的信心了。现在看来,大厂就阿里展现出并购意愿。不像以前,大厂都有并购意愿。但阿里今天愿意出的钱,和以前肯定是完全不一样的啊。
字节应该是没有并购意愿的,觉得自己能做。百度肯定觉得自己能干。腾讯现在不好说,腾讯内部好几个团队在做,但至少目前没有看到强烈的并购意愿。而且腾讯一贯思路是不急的,在后面慢慢跟,它有场景、有数据,你看腾讯从游戏到视频到音乐到文学,都是在后面跟着跟着第一了。
腾讯新闻《潜望》:你怎么看美团收购光年之外?虽然这个很特殊。
朱啸虎:完全是给老王(王慧文)一个解脱了,而且基本是投资人把本金拿回来。这也是一个警示——以后的并购,如果不是那么成功的并购,可能就是让投资人拿点本金加利息回去。大厂都不是那么财大气粗,并购和以前没法比的。如果就是让投资人拿点本金加利息回去,那投资有啥意思啊?
当然月之暗面如果证明自己,大模型能追上闭源水平、能做到GPT-4.5或GPT-5,收购是有价值的。但如果只做到开源水平,就收个团队,你能给多少钱?中国大模型的进展,如果追上开源,至少你还有存在价值;如果追不上开源,就没有意义了;如果追上闭源,你才能有独到的额外的价值。
腾讯新闻《潜望》:对已经入局的同行们,你想说什么?
朱啸虎:(想了好久)这个他妈的不太好说,对吧。
(又想了好久)我觉得这个事大家……这个不太好说,这个不太好说,这个不太好说。
反正他们也无所谓,他们钱多,说实话。
“这就是我不建议
国内创业者用国内大模型的原因”
腾讯新闻《潜望》:中美在这波大模型浪潮中,差异有多大?
朱啸虎:说实话在AIGC这波,中美差距还是非常大。美国是在底层大模型,投入越来越大,像OpenAI说十万张GPU卡连在一起。在中国是不可能的。
美国你看AI的应用创新,说实话只有两条路,一条要么非常、非常薄,因为底层大模型太强大了,所以上面叫套壳应用。另一层是看上去很伟大,但肯定走不通的,像Pika。这种目标很伟大,AIGC生成视频、电影。但这条路可能在几年之内都看不到走通的可能性。
中国反而相反,中国在“当中”的多一点——底层大模型不够强大,我在上面加的东西可以比较多。我在上面做增值服务,为客户马上能变现。这种在中国有机会。美国这种几乎没有,因为底层大模型太强大了,上面创业公司能做的很少。中国套壳,现在肯定没人看的。在中国也套不了壳,因为大模型本身功能也就那样,必须在上面有value add。
(中国)整出200多个大模型有啥意义呢?没啥意义。但在应用层有很多创新。中国在数据和应用场景上是远远超过美国的。
腾讯新闻《潜望》:你为什么不去美国投AI?
朱啸虎:我们美国有团队的。2023年我们上半年每个周打一个电话,中美之间交流AIGC有哪些信息——美国看哪些项目,中国看哪些项目。打了半年我不打了,没有意义。
美国四大模型确实很牛逼,中国投资投不进去,今天的估值投进去也没有意义了。中国有场景,中国电子商务比美国远远发达,后来美国公司就:卧槽你们怎么做出来的?感觉很惊讶,在美国做不出来你知道吧。
我再给你看一个,普通的2G电话,接起来变成虚拟直播,帮你做推销,今年马上直接点击购物了。你如果签代言人,可以让王一博给你打,转化率至少比2G电话翻一翻。我给中东投资人看,中东投资人惊呆了:卧槽,这是什么东西?他都没看到过!这都是中国的创新啊。中国在销售营销当中创新太多了。
腾讯新闻《潜望》:在你看来,中国的AIGC应用已经大爆发了?——外界没有人这么说。
朱啸虎:已经大爆发了。大家都不知道!因为都是to B应用,消费者都不知道,你知道吗?
腾讯新闻《潜望》:投资人也没有人这么说。
朱啸虎:他们都没看到,这些公司都不烧钱的,所以根本无所谓。
腾讯新闻《潜望》:中美两边的融资环境呢?
朱啸虎:美国确实,像Pika,大把钱可以砸进去。中国你今天一个公司,做垂直模型的,没有商业化收入,一亿美金估值现在都没人投了。
一亿美金估值现在没有人投!可以告诉你。
腾讯新闻《潜望》:这个变化是2023年中开始?
朱啸虎:对,6月份以后。所以你前面最多几千万美金估值融个两轮,后面的出路在哪里?必须靠自己造血,自己找商业化场景。
腾讯新闻《潜望》:怎么看中美大模型公司和巨头的关系?
朱啸虎:在美国,大部分会被巨头并购。中国是很难,即使被并购,也很难出好价格,就是买个团队。说实话,今天(中国)大模型有什么差别?
腾讯新闻《潜望》:所以不该拿着锤子找钉子。
朱啸虎:现在200多个大模型拿着锤子找钉子,找不到啊!
现在我找到了钉子,找一个锤子是容易的。为了这个钉子,可能我找一个很小的锤子就行了。不需要那么高、那么大的锤子。
腾讯新闻《潜望》:现在大模型牌桌上的明牌是什么?
朱啸虎:现在开源比非开源落后一代,但长远来看,开源肯定会赶上来。
腾讯新闻《潜望》:拾象创始人李广密的判断是,开源模型追不上闭源模型,而且差距肯定会越来越大,大模型很像芯片或者Space X。从人才密度看,LLaMa也还不够,他认为硅谷大模型的核心secret在OpenAI、Anthropic和Google这三家公司。
朱啸虎:现在OpenAI技术迭代曲线还比较陡峭,开源肯定比非开源落后一年甚至一年半。但等非开源技术迭代曲线缓慢下来,开源会上去的。OpenAI就一两百个工程师,开源的全世界几百万、几千万工程师在用,怎么可能一直比非开源的落后?就像安卓,今天比iOS差吗?肯定不会。
就在于十万张卡到底能不能出来?到底“大力出奇迹”会不会一直下去?如果十万张卡还能“大力出奇迹”,那确实牛逼的;如果十万张卡不能再显著提高性能,就放缓了。技术迭代曲线只要放缓,开源立马就追上去了——谁能永远保证保持秘密,没有秘密可言的。
腾讯新闻《潜望》:月之暗面创始人杨植麟的观点是,开发方式跟以前不一样,以前所有人都可以贡献到开源,现在开源本身还是中心化的,开源的贡献可能很多没有经过算力验证——你怎么看他这个偏技术推论式的判断?
朱啸虎:应用层会更偏向开源,尤其对中国开发者,用开源至少你不担心被别人抄嘛。国内大模型,说实话你在它们上面盖房子,还是担心别人抄你。模型和应用的技能完全不一样,模型需要科学家,这些人对技术懂得很深,而且不需要很多人,只需要精干的人。应用,你需要对场景、市场投放、销售非常了解,和科学家是完全不一样的技能。
腾讯新闻《潜望》:大模型公司理想化的想法是,我一手做最牛的模型,一手做最牛的应用。
朱啸虎:这就是我不建议国内创业者用国内大模型的原因。你用国内大模型,你做得好,肯定别人会抄你。他们都是做大模型,确实不懂应用啊,但你如果基于它上面做得好,它抄你是容易的。美国有清晰分工,国内大模型公司知道自己大模型比美国落后,然后都想做,那创业者肯定更不敢用它。我一直和国内创业者说,千万不要在别人地基上盖房子。
腾讯新闻《潜望》:OpenAI是不会做应用的?
朱啸虎:它是被逼做一个GPT出来。它确实没发现应用者在上面做很多场景,做了GPT出来展示一下。美国前端场景都有人做,微软为什么和OpenAI合作?微软有一堆场景,OpenAI自己去做也没优势,必须和别人合作。现在美国很明显,大模型以后就是云服务的组成部分。
腾讯新闻《潜望》:杨植麟团队你怎么看?
朱啸虎:我们投了他的上一个公司。他人是很厉害的,大模型确实比较适合他。他做科研是可以的,但我不知道他怎么商业化。妈的,王小川也一样的。
他们(月之暗面)在国内大模型上领先,但长远还是要证明自己价值,至少能追上美国开源。如果能超过开源,他这个团队是真的有价值了。
腾讯新闻《潜望》:还有一家大模型公司,MiniMax呢?
朱啸虎:那个时候我们就没聊过,因为开始就很贵。同样的一个问题,他……哎——这个不点评了,不点评了。
腾讯新闻《潜望》:你的观点比很多人都更激烈,在线下被同行或者创业者怼过吗?
朱啸虎:没有啊,我问的问题都回答不了啊。谁能回答出来?
我希望被怼,关键是谁能回答出来。你商业化场景在哪?你的数据在哪?都不知道的。你自己去和他聊就知道了。
这个真的比“AI四小龙”还差。“四小龙”进入的时候竞争对手还没那么多,市场就五六家、七八家,竞争没那么激烈。还有两三年的黄金时期,收入做起来了,到后面才是杀价格。
现在200多大模型。大模型2023年年初,一千万私有化部署一个,到6月份五百万部署一个,到年底一百万都不要。给央企部署一个私有化大模型,不要一百万人民币。一年时间就价格杀到地板价去了。怎么搞?创业公司怎么搞?这么早就陷入价格战,大模型公司就会很难单独生存。
今年就可以看出大模型本身是不是好的商业模式,多少OpenAI的用户会因为价格差异迁移到Google的Gemini——OpenAI 20美金一个月,Gemini 10美金一个月。我们美国团队已经有一半人切换到Gemini,一部分是因为价格,另外一部分是因为Google的ecosystem。
三星的AI手机已经绑定Google Gemini。下面就看苹果的新iPhone会绑定哪个大模型,会向大模型公司收多少钱。
腾讯新闻《潜望》:OpenAI后面会怎么样?
朱啸虎:如果有1/3以上客户迁移,那估计只能卖给大厂了。
腾讯新闻《潜望》:有人和你观点一致吗?
朱啸虎:现在肯定有很多。大家不大说而已。
腾讯新闻《潜望》:其他人为什么不大说?
朱啸虎:我也不知道。
腾讯新闻《潜望》:你说这些有压力吗?
朱啸虎:我也没啥压力。哎呀,现在大家都比较明确的一点,企业都至少别烧钱——今年投资人的共识是这个——所有企业别给我烧钱,都自己造血。
腾讯新闻《潜望》:从第一天起不烧钱是今天的创业新趋势。
朱啸虎:对啊,后面有没有人投资不知道的,所以每一轮都要当成最后一轮!千万别烧钱。
腾讯新闻《潜望》:怎么退出?
朱啸虎:退出再说啊。你不烧钱,这个至少就有机会,现在就要活下去!
像《繁花》讲的一样,要活下去!
真的,一步一个脚印,活下去再说!活下去就有机会。
腾讯新闻《潜望》:《繁花》好看吗?
朱啸虎:好看,很好看。
腾讯新闻《潜望》:好看在哪?
朱啸虎:确实那个时代大家真的可以搏一下。
今天就别搏了,就是要活下去!
“你必须现实”
腾讯新闻《潜望》:《繁花》那个时代你多大?
朱啸虎:我刚念大学呢。比我早个十年吧。我毕业的时候黄河路已经不太行了哈哈。
腾讯新闻《潜望》:你说你现在的状态和2005年左右刚入行的时候很像?你是怎么进入投资行业的?
朱啸虎:2005年、2006年,就是VC刚开始的时候,中国没几个VC,看项目看三到六个月才出手。我和有一个合伙人比较熟悉,我之前创业是卖to B的。妈的,销售周期,我们卖保险公司应用至少半年到一年,实施周期还有半年到一年,太累了。
腾讯新闻《潜望》:教你投资的老师是谁?从他身上学到最多的是什么?
朱啸虎:美国那个合伙人,他投的小红书和去哪儿。Number-driven(数字驱动),我们都是看数字的,我们不听故事。
当然也看人。所以,哎呀,一鸣(字节跳动创始人、原CEO)当年真的是,看人也看不出来,看数字看不出来,哈哈哈真的是。
腾讯新闻《潜望》:你错过最后悔的项目是字节,从这里面学到了什么?
朱啸虎:字节的case确实,哎……就是……说实话一鸣确实很难判断。你和他聊天,他也不太怎么说怎么说。今天你和他去聊天,他也是一样的。他也不会很sharp地告诉你很多事情。所以,真的很难判断。
第二,当时只有今日头条,个性化新闻这件事情确实不大,我判断没错。但后来出来个抖音谁知道?
腾讯新闻《潜望》:一鸣是怎么找到你的?
朱啸虎:我和王琼(海纳亚洲创投基金合伙人)很熟的,她投了A轮,B轮第一个让我看的。就在大会议室。我还记得就是十一二年前。
一鸣和王琼两个人一起来的。我就和王琼说,你如果第一轮投一千万美金估值,两千万美金,估值翻一倍,我愿意干的。你第一轮就是两千万美金,第二轮要五千万美金,我觉得太贵了。
个性化新闻这个事情失败过很多次,当年百度做也不行,为什么个性化新闻能起来?这个东西确实看不明白,估值又不便宜,而且一鸣又失败了三次。对吧!为什么他能成功?我看不出来啊。
如果人很牛,应该也行,但是一鸣那个时候真的看不出来很牛。过去的经历也看不出很牛,说话也看不出很牛。
腾讯新闻《潜望》:你从这个case里学到了什么?
朱啸虎:这个确实不是我的菜。你说做什么99房,做什么酷讯,都很一般啊,真的看不出来很牛。
腾讯新闻《潜望》:当时对他态度冷淡吗?
朱啸虎:反正也不是那么热情。
我一般都不(听)讲PPT,你就直接聊。十几分钟、二十分钟,最多了吧。那还是看在王琼的面子上。哈哈哈哈。王琼是我师姐,比我高一届。我看在王琼的面子上聊了十几分钟、二十分钟。哈哈哈。
腾讯新闻《潜望》:你觉得你投过的让你觉得最浪漫主义和理想主义的一个项目是什么?
朱啸虎:饿了么。张旭豪那时候虽然没啥经验,但我觉得他商业头脑还是比较可以的。
腾讯新闻《潜望》:他跟你看起来比较像。
朱啸虎:对对对,张旭豪是和我比较像的。
腾讯新闻《潜望》:但张旭豪会被说带有匪气。
朱啸虎:张旭豪那时候是有点匪气,但适合他的生意,他做的就需要这个,特别接地气啊。
腾讯新闻《潜望》:别人说你匪气,你生气吗?
朱啸虎:你说宝总有没有匪气?当年那个时代,都是有点那个的,对吧?
腾讯新闻《潜望》:和张旭豪现在沟通多吗?
朱啸虎:现在还行,他也是投了我们基金。成LP了。
腾讯新闻《潜望》:今天AIGC的创业时代,还有下一个程维、张旭豪、毛文超的机会吗?他们都是你投过的CEO。
朱啸虎:有机会啊。当年我们投张旭豪、毛文超的时候,也不知道他们能做多大。AIGC应用今天也是一样。但你只要不烧钱就有机会——就像宝总一样的,只要活下去就有机会。
腾讯新闻《潜望》:现在这些中国的AI创业公司在哪个场景能长出独角兽?
朱啸虎:十亿美金独角兽还是很容易的。但千亿美金,今天是看不见的。
腾讯新闻《潜望》:你感觉,现在这个时代和上一个时代有哪些共性和不同?
朱啸虎:我觉得Midjourney是守不住的。为什么Midjourney现在还很火?因为技术迭代周期还陡峭。Midjourney 5、Midjourney 6,版本速度快。但是,一旦技术曲线放缓就守不住了,因为to C应用太低频,给里面附加一个东西太容易了。为什么大厂给你机会?美国公司可能还是并购,中国就不一定好做了。
所以,和移动互联网一样,to C应用必须刚需、高频,长远才有机会守得住。我对Midjourney是有很多顾虑的。
腾讯新闻《潜望》:你2023年的工作状态和之前几年有什么不一样?
朱啸虎:更悠闲,我刚刚休假回来哈哈。今天投资人的状态就是休假时间会比较多一点,大家都不急的。看到一个项目,都要观察三到六个月的时间。比如像大模型有变化,今天技术迭代的曲线还比较陡峭,大家都看下一款大模型会不会对你有颠覆性的影响。
腾讯新闻《潜望》:中国VC的好时代过去了吗?
朱啸虎:这个很正常,市场不需要那么多钱。全行业一年投一两千亿,平均下来全行业是亏损的,没有那么多退出机会。洗牌是正常的、需要的。美国现在一年投的金额也下去很多。
腾讯新闻《潜望》:你为什么不看新能源车赛道?
朱啸虎:我们不太喜欢太重的。我们就喜欢软件驱动的,不需要砸很多钱、一张GPU就能跑起来的。这种是比较适合我们的。马上能验证行不行。
腾讯新闻《潜望》:你有喜欢的创业者画像吗?
朱啸虎:思路很清晰的,十几分钟能讲明白一件事情,而且表达比较直接。
(我问题的问题)基本上都一样,你的市场机会在哪里?市场机会多大?为什么是你?就是这几个问题。能讲明白的不多的。
腾讯新闻《潜望》:错过的项目有总结过共性的原因吗?
朱啸虎:共性还是对人看不懂。有些人我们确实看不懂。
内敛的看不懂。我就喜欢E人,I人就看不懂。
腾讯新闻《潜望》:你是哪个MBTI?
朱啸虎:我是E。
腾讯新闻《潜望》:你也不准备弥补这一边?
朱啸虎:不需要弥补。
腾讯新闻《潜望》:你这个性格有在投资生涯里吃过亏吗?
朱啸虎:妈的,错过了字节这样的,贡献了过去二十年投资圈一半的利润。再多的项目可能都弥补不了一个字节。
腾讯新闻《潜望》:现在很多人说杨植麟是AI时代的一鸣,你会不会再错过一次?
朱啸虎:一鸣始终在用户端,真正能做大的最终还是用户端的。
腾讯新闻《潜望》:现在业余时间干嘛?
朱啸虎:更悠闲一点,看看书,看看电视剧不挺好的嘛。
《繁花》真的拍得挺好。别加杠杆,别加杠杆,千万别加杠杆。这些都是很朴素的,但是真的在关键时刻能救命的。与人为善,那个强总,别把别人逼向死路,与人为善挺好的。
腾讯新闻《潜望》:你2022年在国外比较多,有没有一些海外观察?
朱啸虎:国外真的还不如中国。中国供应链体系是无与伦比的,其他国家没法和中国比。中国创业者的拼搏精神,也是创新精神,其他地方没法比的。所以AI就是中国跟美国两个地方,其他地方没机会的。韩国,也是有人才的,到中国来cold call找上来的,你想想看。
我和创业者说,2023年就聚焦中国,先把中国的地圈起来,2024年再考虑出海。
腾讯新闻《潜望》:很多投资人经过慎重考虑后最终选择离开这个行业,你为什么没有决定退休?
朱啸虎:宏观上很多不确定性,微观上还是有很多机会的。很多创业者真的能在不烧钱的情况下一年涨两三倍、三五倍。为什么(我)讲Next China is still China?中国创业者真的很厉害——你去找宏观的人聊,找二级投资人聊,都很悲观;但是你和创业者聊天,很幸福、很兴奋的。很多时候是让我们大吃一惊的。
否则,你干嘛呢?哈哈哈。
腾讯新闻《潜望》:今年给被投企业说的最多的话是什么?
朱啸虎:就是不烧钱,不烧钱。
昨天晚上还有个公司说,今年的baseline假设(基准假设)是:假设收入降20%,你还能打平。你千万别假设收入增长,收入部分达不到,你的成本就先花出去了。
腾讯新闻《潜望》:会不会有时候觉得自己太过于现实?
朱啸虎:现在根本没有资本泡沫时期的容错能力,你必须现实。所有公司都得不烧钱。
腾讯新闻《潜望》:如果你今天讲的关于大模型的判断都是错的,你怎么想?
朱啸虎:那很正常,也是有可能性的。但我个人看来,核心问题还是到底能不能产生AGI,能不能产生人工智能懂世界模型。目前给我感觉,至少5到10年之内是看不见的。
从哲学角度看,智力级别的提升首先需要能量级别的提升。可控核聚变实现前,我不太相信地球有足够的算力能够实现真正的AGI。帮人类降低90%的工作可能未来3到5年可以实现,但最后的10%可能需要天量的算力和能耗,这也是为什么Sam Altman想融天量的资金!行百里者半九十。
Sora证明了一个新路数,美国有钱敢于试错,那挺好,中国就在后面慢慢跟呗。技术迭代曲线肯定会放缓,PC刚出来也一样,(电脑的CPU型号)286、386、486,大家都觉得美国牛,但586以后,联想都收购IBM了。技术迭代曲线不可能一直这么陡峭。英伟达昨天又涨20%,说明它离顶部越来越近。
腾讯新闻《潜望》:你预计技术曲线什么时候会放缓��
朱啸虎:GPT-5以后就基本会放缓——GPT-4.5今年应该很快发布,GPT-5不一定,可能明年。GPT-5是把视频生成做到今天图像生成的水平,再往前走不太容易。现在看,语言模型进步差不多见顶,突破在多模态,Sora再发布三四个版本也能见顶。后面突破按他们自己说7万亿美金,至少几十万张卡拿出来训练,成本太高太贵了。就像当年建大型高能对撞机,先让别人试错,我们在后面跟是最好的、最稳健的策略。
腾讯新闻《潜望》:回到AGI信仰的话题,如果大模型公司注定看不到商业化的可能,退一步讲,你能不能用你手上的钱支持一下人类梦想与科学研究?
朱啸虎:那个是需要大厂和政府去支持。为什么美国人敢投?微软3万亿美金市值,苹果2万亿美金市值,他们敢砸钱。中国不需要砸,美国有钱在前面试错,它一旦证明路通了,后面要花的钱少一个数量级。
我们跟在后面,花的钱少一个数量级,风险小很多,干嘛不跟在后面?
——————End——————
0 notes
readonline · 2 months
Link
如果所有人都觉得你正常,你的理想是大家都能想到的,它对人类的理想总量没有增量。
作者 | 张小珺
出品 | 腾讯新闻《潜望》
就在一年以前,AI科学家杨植麟在硅谷做了一笔精确的计算。他意识到,如果决定启动一场以AGI为目标的大模型创业,要在未来几个月立马筹措超1亿美金资本。
然而,这仅仅只是一张入场券。一年后,这个数字翻了13倍。
大模型公司的竞争,与其说是一场科学竞争,不如说首先是一场残酷的金钱角力。在资本方捂紧口袋的情况下,你要领先对手找到更多的钱,购买更多的卡,抢夺更多的人才。
“它需要人才聚集、资本聚集。”成立于2023年3月1日的大模型公司月之暗面(Moonshot AI)创始人兼CEO杨植麟说。
过去一年,国产大模型公司似乎处在一种紧迫而逼仄的生存边缘。看上去,他们每个都手握重金。但一方面,他们要把刚融的钱,立马投入极高昂的科研中追赶OpenAI——先是追齐GPT-3.5,没等追上GPT-4,Sora又来了;另一方面,他们要马不停蹄在落地场景上找可能,自我验证你是一家公司、而不是只会吞噬资本金的研究所;这还不够,每个项目不管是上市还是并购,出路更是毫不明朗。
在中国大模型创始人中,杨植麟年纪最轻,于1992年出生。业界评价他是坚定的AGI信徒和有技术号召力的创始人。他的学习与工作履历很多与通用AI相关,论文引用超22000次。
对于大模型,中国科技界于2023年中从狂热骤然转冷,进入加速落地的实用主义主旋律。这不免让大模型CEO们处于理想与现实的剧烈拉扯之间。在人人喊PMF(Product/Market Fit,产品/市场契合)、人人喊商业化的中国AI生态里,这位AI研究员出身的创始人倒不那么着急。
月之暗面是头部国产大模型公司中,人数最少的一家,为80人。他没有像他的对手那样,做更稳妥的to B生意,或是在医疗、游戏等细分场景中找落地,而是做且只做了一款to C产品——智能助手Kimi,支持20万汉字输入。Kimi也是杨植麟的英文名。
杨植麟倾向于将他的公司看作是,构建一个结合科学、工程和商业的系统。你可以想象成,他要在人类世界上空,架起一张AI实验台,一手做实验,一手将尖端技术落进真实世界,通过与人类互动找到应用机会,再将应用送入消费者手中。理想状况是,前者烧掉数以十亿、百亿计资本;后者再把这些钱数成百上千倍地挣回来——怎么听,都像“走钢丝”一样惊险。
“AI不是我在接下来一两年找到什么PMF,而是接下来十到二十年如何改变世界。”他说。
这种抽象和理想主义的思考,令人不免替他捏一把冷汗:一位年轻的AI科学家,在现实主义的中国能否找到生存空间?
2024年2月,月之暗面逆势完成一笔大额融资。据了解,它以15亿美金投前估值完成超10亿美元B轮,阿里领投,砺思资本、小红书等跟投,该笔交易完成后,月之暗面投后估值约25亿美元——由此,它成为中国大模型赛场上现阶段估值最高的一家独角兽。(他们拒绝回应和评论此事。)
就在第三笔融资的过程中,我们和杨植麟聊了聊他过去一年创业故事,这也是国产大模型抢跑一年的截面缩影。
他的公司没有选址在大模型企业聚集地,北京搜狐网络大厦。对于一家融资总额约90亿元人民币的公司,这间位于量子芯座的办公室,显得简陋又破旧。门口连公司logo都没有,只有一架白色钢琴守在门口。
会议室在一个角落,由于窗户小黑漆漆的,冬天送来暖风的空调机器嗡嗡作响。暗沉的光亮中,杨植麟形容自己过去一年的感知:“有点像开车在路上,前面有延绵的雪山,但你不知道里面是什么,你在一步一步往前走。”
以下是对杨植麟的访谈全文。(为方便阅读,作者做了一些文本优化)
杨植麟与导师Ruslan Salakhutdinov(右)、William Cohen(左)合影
站在开端
“要ride the wave”
腾讯新闻《潜望》:最近你的状态怎么样?
杨植麟:忙啊,事情很多。但还是很兴奋。站在产业开端,有巨大想象空间。
腾讯新闻《潜望》:我刚进来看到你们公司门口放了一架纯白色钢琴。
杨植麟:上面还有一张Pink Floyd专辑。我都不知道谁放的,前两天突然看到,没来得及问。(Pink Floyd是发布专辑《月之暗面》的英国摇滚乐队)
腾讯新闻《潜望》:2022年11月,ChatGPT发布那天,你在做什么?
杨植麟:我正在筹备这个事,找人组团队,碰撞一些新认知。看到ChatGPT很激动。放到三五年前,甚至2021年,都是不可思议的。这种高阶推理能力过去很难做到。
我预感市场会发生很多变量:一方面是资本,一方面是人才,这是做AI的核心生产要素。如果变量成立,我们就有可能正儿八经搞一家公司做这件事——一个为AGI搭建的组织从0到1存在可能性,这是很大的顿悟。独立公司更make sense,但不是你想做马上就能做,ChatGPT刺激了变量,使生产要素齐全。还是要ride the wave。
腾讯新闻《潜望》:你在决定创立一家AGI公司后,做了哪些准备?怎么凑齐资本和人才这两个生产要素?
杨植麟:是曲折的过程。ChatGPT扩散需要时间。有的人知道得早,有的人知道得晚,有的人一开始怀疑、后面变成震惊、再变成相信。找人找钱,跟timing结合得很紧。
我们2023年2月开始集中做第一轮融资。如果delay(延迟)到4月,基本没机会了。但如果2022年12月或2023年1月做也没机会,当时有疫情,大家没反应过来——所以,真正窗口就是一个月。
当时,在美国有一个晚上,我做了精确的计算。算完觉得至少要在几个月内拿到1亿美元。市场上很多人没开始融资,很多人觉得你这个不一定能融这么多钱。但后来证明是可以的,甚至比这个更多。
人才市场开始流动。受ChatGPT启发,很多人在2023年3月或4月有这样的realization(意识):这是接下来十年唯一值得做的。要在正确时间积极触达对的人。如果是前两年,人才聚集度不会这么高。那时更多人做传统AI,或者跟AI相关的业务,都不是通用AI。
腾讯新闻《潜望》:总结一下,2月是融资的窗口期,3月、4月是招人的窗口期?
杨植麟:差不多。
腾讯新闻《潜望》:你在美国那一晚是在哪算了这笔账?具体怎么算的?
杨植麟:22年底到23年初,我在美国待了一两个月,找人聊。
在我住的地方。算一下你对应多少FLOPs(Floating Point Operations,每秒浮点运算次数)、Training Cost(训练成本)、Inference(推理)、用户量。
腾讯新闻《潜望》:彼时彼刻,硅谷沉浸在什么样的情绪中?
杨植麟:这个产品开始有很多early adopters(早期用户),集中在技术圈,我们本身在这个圈子,感受更深刻。硅谷大厂每半年要写performance review(绩效评估),开始很多人用ChatGPT写。有的人平时写的语言不大professional(专业),用ChatGPT写,大家都一本正经的样子。
暗流涌动。很多人考虑下一份工作去哪或者创业。很多和我们聊的朋友后来纷纷创业。而且,有很强FOMO情绪(Fear of Missing Out,害怕错过)。所有人每天睡不着觉。不管晚上12点、1点、2点,你去找,always大家都在。有点焦虑,有点FOMO,又很兴奋。
腾讯新闻《潜望》:算出要融1亿美金那晚,你算到了几点?
杨植麟:还好吧,计算过程倒不用很久。
但算完我也不能跟太多人说。说了也没有人觉得这事可以做。
技术师承“把自己从无限雕花中解放出来”
腾讯新闻《潜望》:创投行业提到你会说,“创始人很聪明,有技术号召力,团队里也有很多技术明星”。所以,聊大模型创业之前,想先聊聊你的学术背景。
你本科是清华计算机系,博士是卡耐基梅隆计算机学院,方向一直是AI吗?
杨植麟:我是92年出生,11级本科,大二到现在十多年一直在这个方向。一开始偏发散的探索,到处看看,跟图或多模态都做过一些,2017年收敛到语言模型——当时觉得语言模型是比较重要的问题,后来觉得它是唯一重要的问题。
腾讯新闻《潜望》:2017年AI业界对语言模型普遍是怎样的认知,后来如何演进?
杨植麟:它(当时)是用来给语音识别做排序的模型。(笑)当你识别完一段语音,有很多结果,拿语言模型看到底哪个概率更大,输出最有可能的结果,应用非常有限。
但你发现它是根本问题,因为你在对这个世界概率建模。虽然语言局限,它是世界的投映;但理论上你把token space(所有可能的标记组成的空间)做得更大,就可以构建一个通用世界模型。世界上每样东西怎么产生、发展,都能给它分配一个概率。所有问题都可以被归结成怎么对概率估计。
腾讯新闻《潜望》:你学术生涯的导师很有名,博士导师是苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen。他们都既在产业界,又在学界。
杨植麟:产业界和学术界从前几年有更多结合,现在趋势在变化:更多有价值的突破会产生在工业界,这是发展的必然规律。先从探索性研究开始,逐渐转移到更成熟的工业化过程,但不意味着工业化过程中不需要研究,只是纯研究会很难做出有价值的突破。
腾讯新闻《潜望》:从这几位颇有名望的导师身上学到了什么?
杨植麟:我学习到最多是在Google,实习了很长时间。2018年底开始做基于Transformer的语言模型,最大learning是从无限雕花中把自己释放出来,这很关键。
应该看什么是大方向、大梯度。当你眼前有十条路,一般人考虑我走这条路前面有一个行人怎么刹车,是短期细节,但这十条路到底选哪一条最重要。
这个领域在之前有这样的问题。比如,在只有一两百万token(标记)的数据集上,看perplexity(困惑度,衡量模型在预测序列时的不确定性或混乱度)怎么降得更低,loss(损失,模型在训练过程中的误差或损失函数的值)怎么降得更低,怎么提升准确率,你会陷入无限雕花。有人发明很多诡异的architecture(架构),这些是雕花技巧。雕花之后可能在这种数据集上变好,但没看到问题本质。
本质在于,要去分析这个领域缺少的是什么?第一性原理是什么?
Scaling law为什么能成为第一性原理?你只要能找到一个结构,满足两个条件:一是足够通用,二是可规模化。通用是你把所有问题放到这个框架建模,可规模化是只要你投入足够多算力,它就能变好。
这是我在Google学到的思维:如果能被更底层的东西解释,就不应该在上层过度雕花。有一句重要的话我很认同:如果你能用scale解决的问题,就不要用新的算法解决。新算法最大价值是让它怎么更好的scale。当你把自己从雕花的事中释放出来,可以看到更多。
腾讯新闻《潜望》:Google那时也是scaling law的追随者吗?它是怎么贯彻第一性原理的?
杨植麟:已经有很多这样的思想,但Google没有贯彻得非常好。它有这样的思维,但它没办法组织起来,变成一个真正的moonshot(登月计划)。更多是,这有5个人追求我的第一性原理,那有5个人追求他们的第一性原理。没有top-down(自上而下)的东西。
腾讯新闻《潜望》:你读博期间,先后和图灵奖得主Yann LeCun(杨立昆)、Yoshua Bengio合作发表论文,而且你都是一作。学术上这些合作是怎么产生的?——我的意思是,他们是图灵奖得主,又不是你的导师,你靠什么吸引他们?
杨植麟:学术界很open。只要你有好的想法、有意义的问题,这个都还好。两个脑子或n个脑子做出来的,比一个脑子多。这在开发AGI的时候也可以用。AI一个重要策略叫“ensemble”(使用集成方法,用多个不同的模型或方法,将它们的预测或结果结合起来,获得更优性能),本质在做一样的事情,当你有diverse的观点你可以碰撞出很多新东西。合作有很大受益。
腾讯新闻《潜望》:你是先有一个idea,拿去问他们是否感兴趣吗?
杨植麟:差不多是这个过程。
腾讯新闻《潜望》:在学术上搞定学术大佬和在融资中搞定资本大佬哪个更难?相似点是什么?
杨植麟:“搞定”不是一个好的词,背后本质是合作。合作就是能双赢,因为双赢是合作的前提。所以也没什么区别,需要给别人提供独特价值。
腾讯新闻《潜望》:怎么让他们信任?你觉得你的天赋是什么?
杨植麟:也没有什么天赋,就是努力干活。
旧系统不适用了
“AGI需要新的组织方式”
腾讯新闻《潜望》:你刚说“更多有价值的突破会发生在工业界”,包括创业公司、巨头的AI lab?
杨植麟:Lab是历史了。以前Google Brain是产业界最大AI lab,但它是把研究型组织安插在大公司。这种组织能探索新想法,很难产生伟大系统——能产生Transformer,但产生不了ChatGPT。
现在的开发方式会演变成,你是要做一个巨大的系统,需要新的算法,扎实的工程,甚至很多产品和商业化。好比21世纪初,你不可能在实验室研究信息检索,要放在现实世界,有一个巨大的系统,有一个有用户的产品,像Google。所以,科研或教育系统会转变职能,变成培养人才为主。
腾讯新闻《潜望》:你会怎么形容这个新的系统形式?OpenAI是它的雏形?
杨植麟:它是现在最成熟的组织了,还在逐渐演化。
腾讯新闻《潜望》:可以理解,这是为人类宏伟的科学目标而设立的组织?
杨植麟:我想强调,它不是纯科学,它是科学、工程和商业的结合。它得是一个商业化组织,是公司、不是研究院。但这个公司是从零到一建造的,因为AGI需要新的组织方式——一,生产方式跟互联网不一样;二,它会从纯研究变成研究、工程、产品、商业相结合。
核心是,它应该是一个登月计划,有很多自顶向下的规划,但规划中又有创新空间,并不是所有技术都确定。在一个top-down(自上而下)框架下有bottom-up(自下而上)的元素。本来不存在这样的组织,但组织要适配技术,因为技术决定了生产方式,不匹配就没法有效产出。我们相信大概率要重新设计。
腾讯新闻《潜望》:去年OpenAI政变时,Sam Altman有一种选择是加入微软,领导新的微软人工智能团队。这和他在OpenAI做CEO的本质差别是什么?
杨植麟:你需要在旧文化里产生新组织,难度很大。
腾讯新闻《潜望》:你想做“中国的OpenAI”,可以这么说?
杨植麟:不大准确,我们不想做中国的什么东西,也不一定想做OpenAI。
首先,真正AGI肯定是全球化的,不存在由于市场保护机制导致你只能做某个regional market(区域市场)的AGI公司,长期不存在——全球化、AGI和你有一个很大用户量的产品,这三个东西最终是必要条件。
第二,是不是OpenAI?你去看2017年-2018年,OpenAI风评很差,我们圈子的人找工作,一般考虑像Google。很多人跟Ilya Sutskever(OpenAI首席科学家)聊完,觉得这个人疯了,太自以为是了——OpenAI不是疯子就是骗子。但他们从很早开始投入,找到非共识,找到AI现在唯一work的第一性原理:通过next token prediction去scale(通过对下一个标记的预测来进行规模化)。
我认为,会有比OpenAI更伟大的公司存在。一个真正伟大的公司能结合技术理想主义,并让它用一个伟大的产品跟用户共创,AGI最终会是一个跟所有用户co-work(协作)产生的东西。所以,不光是技术,也需要功利主义和现实追求。最终在这两者之间完美结合。
不过我们应该学习OpenAI的技术理想主义。如果所有人都觉得你正常,你的理想是大家都能想到的,它对人类的理想总量没有增量。
登月的第一步是长文本,第二步呢?
“接下来会有两个milestone”
腾讯新闻《潜望》:话题回到你决定创业的时刻,你回国后立马启动了第一轮融资?
杨植麟:(去年)2月在美国就开始了,也有远程的。最后以国内投资人为主。
腾讯新闻《潜望》:第一轮融了1亿美金?
杨植麟:第一轮还没有,后来超过这个数。2023年完成两轮,总共近20亿人民币。
现在是第三轮。融资我们没有正式announce,现在没办法comment。
腾讯新闻《潜望》:有人说,2023年下半年开始,已经没有人愿意投基础大模型公司了,他们说的是错误的?
杨植麟:还是有。确实能看到情绪变化,不是说没人投,至少目前市场上投资意向是蛮多的。
腾讯新闻《潜望》:除了资本和人,你在2023年还做了哪些关键决策?
杨植麟:要做什么事。这是我们这类公司的优势——在最高层面的决策有技术vision(愿景)。
我们做long context(长上下文),需要对未来有判断,你要知道什么是根本的、接下来的方向。还是第一性原理,“去雕花的过程”。如果你专注雕花,只能看OpenAI已经做了什么,我看怎么把它已经做的做出来。
你会发现在Kimi(AI智能助手)里做长文本无损压缩,产品体验独特。读英语文献,它能很好帮你理解。你今天用Claude或GPT-4,不一定做得好,需要提前布局。我们做了半年多。相比我今天看到一个long context风口,赶紧召集两个团队,用最快速度开发,有很大区别。
当然马拉松刚开始,接下来会有更多差异化,这需要你提前预判到底什么是“成立的非共识”。
腾讯新闻《潜望》:做这件事是在几月份决定的?
杨植麟:二三月,公司成立就决定了。
腾讯新闻《潜望》:为什么长文本是登月第一步?
杨植麟:它很本质。它是新的计算机内存。
老的计算机内存,在过去几十年涨了好几个数量级,一样的事会发生在新的计算机上。它能解决很多现在的问题。比如,现在多模态架构还需要tokenizer(标记器),但当你有一个无损压缩的long context就不需要了,可以把原始的放进去。进一步讲,它是把新计算范式变成更通用的基础。
旧的计算机可以0、1表示所有,所有东西可被数字化。但今天新计算机还不行,context不够多,没那么通用。要变成通用的世界模型,是需要long context的。
第二,能够做到个性化。AI最核心的价值是个性化互动,价值落脚点还是个性化,AGI会比上一代推荐引擎更加个性化。
但个性化过程不是通过微调实现,而是它能支持很长的context(上下文)。你跟机器所有的历史都是context��这个context定义了个性化过程,而且无法被复刻,它会是更直接的对话,对话产生信息。
腾讯新闻《潜望》:接下来它有多大可扩展的空间?
杨植麟:非常大。一方面是本身窗口的提升,有很长路要走,会有几个数量级。
另一方面是,你不能只提升窗口,不能只看数字,今天是几百万还是多少亿的窗口没有意义。你要看它在这个窗口下能实现的推理能力、the faithfulness的能力(对原始信息的忠实度)、the instruction following的能力(遵循指令的能力)——不应该只追求单一指标,而是结合指标和能力。
如果这两个维度持续提升,能做非常多事。可能可以follow(执行)一个几万字的instruction(指令),instruction本身会定义很多agent(智能体),高度个性化。
腾讯新闻《潜望》:做长文本和追赶GPT-4技术是可复用的吗?他们是一件事吗?
杨植麟:我觉得不是。更多是升维,是一个新维度,是GPT-4没有的维度。
腾讯新闻《潜望》:很多人说国内这几家大模型公司做的事都差不多——2023年追赶GPT-3.5,2024年追赶GPT-4。你认可这种说法吗?
杨植麟:综合能力提升肯定有关键目标,这个说法一定程度上是对的,你是后发肯定有追赶过程。但同时它是片面的。除了综合能力,在很多空间可以产生独特的能力,能在一些方向做到state of the art(世界领先)。Long context是一个。DALL-E3图片生成效果完败于Midjourney V6。所以要做两方面。
腾讯新闻《潜望》:综合能力和新维度分别耗费的时间及生产资源,占多大比例?
杨植麟:需要结合,新维度不可能脱离综合能力存在,很难直接给出一个比例。但需要足够投入才能把新维度做好。
腾讯新闻《潜望》:这些新维度对于你们,都会承载在Kimi上?
杨植麟:这肯定是我们很重要的产品,也会有一些别的尝试。
腾讯新闻《潜望》:怎么看李广密(拾象创始人)说,中国大模型公司今天的技术辨识度还不算太高?
杨植麟:我觉得还好啊,我们今天只是做出了很多差异化。这跟时间有关系,今年应该能看到更多维度。去年大家是先搭个架子,先跑起来。
腾讯新闻《潜望》:登月的第一步是长文本,第二步是什么?
杨植麟:接下来会有两个大的milestone(里程碑)。一是真正的统一的世界模型,就是它能统一各种不同模态,一个真正的scalable和general的architecture(可扩展、通用的系统结构)。
二是能在没有人类数据输入的情况下,使AI持续进化。
腾讯新闻《潜望》:这两个milestone需要多久达到?
杨植麟:两到三年,有可能更快。
腾讯新闻《潜望》:所以三年后我们已经看到的是和今天完全不一样的世界了。
杨植麟:按照今天的发展速度是这样。现在技术是萌芽,快速发展的阶段。
腾讯新闻《潜望》:能不能畅想一下三年后会出现什么?
杨植麟:会有一定程度的AGI。我们今天在做的很多事AI也能做,甚至它做得更好。但关键看我们怎么用它。
腾讯新闻《潜望》:对于你、对于月之暗面这家公司来说呢?接下来第二步是什么?
杨植麟:我们会去做这两件事。剩下很多问题,都是这两个因素推导出来的。今天谈到reasoning(推理)、agent(智能体),都是这两个问题解决后的产物。要再做一些雕花,但没有fundamental的blocker(根本性阻碍因素)。
腾讯新闻《潜望》:你会all in追赶GPT-4吗?
杨植麟:(GPT-4)是AGI的必经之路。核心是,不能只满足做到GPT-4的效果。一是要想现在真正的非共识是什么,除了GPT-4,下一步是什么?GPT-5和GPT-6应该是什么样?二是看,你在这里面有哪些独特能力,这点更重要。
腾讯新闻《潜望》:其他大模型公司会公布自己的模型能力和排名,你们好像没做这件事?
杨植麟:刷榜意义很小了。最好的榜就是用户,应该让用户投票。很多榜存在问题。
腾讯新闻《潜望》:在中国大模型公司的竞赛中最快达到GPT-4,是你的目标吗?快与慢有区别吗?
杨植麟:肯定有,如果把时间放到足够长周期,最终所有人都能达到。但要看你早晚是多长周期。半年或以上的周期是有意义的,也取决于你能用这个周期做什么事。
腾讯新闻《潜望》:你们预计会在什么时间达到GPT-4?
杨植麟:应该会很快,具体时间还没办法对外说。
腾讯新闻《潜望》:你们会是最快的吗?
杨植麟:这要动态去看,但我们有概率。
腾讯新闻《潜望》:推出Kimi之后,你的北极星指标是什么?
杨植麟:今天是把产品做得更好,有更多升维(即新的维度)。举个例子,不应该只去卷一个搜索场景,搜索在后面只是这个产品有价值的很小一部分,这个产品应该有更大增量。比传统搜索引擎好个10%、20%,没什么太大价值——只有一个颠覆性的东西,才配得上AGI这三个字。
独特价值是你增量的智能。要抓住这个点,智能永远是最核心的增量价值。如果你这个产品最核心价值只有10%-20%来自于AI,就不成立。
我一点也不焦虑落地
“user scaling和model scaling需要同时做”
腾讯新闻《潜望》:2023年中是一个巨大分水岭,市场从狂热迅速转冷。你的感知是怎样的?
杨植麟:这个判断我不完全认同,我们确实在下半年完成了一轮融资。而且,持续有新东西出来。今天的模型能力在去年底无法想象。越来越多AI公司的用户量和revenue(收入)一直在上升。它持续地证明了价值。
腾讯新闻《潜望》:上半年和下半年对于你来说,不同感受是?
杨植麟:没有太大变化,变量肯定存在,但回到第一性原理——怎么给用户提供好产品。最终,我们要满足用户需求,而不是赢得一场比赛。我们不是为了竞争而建立的公司。
腾讯新闻《潜望》:业界认为,2023年上半年和下半年一个显著区别是,关注重心变了。上半年提AGI更多,下半年开始讲怎么落地、怎么商业化。你有没有这么做?
杨植麟:我肯定要做AGI嘛,这是接下来十年唯一有意义的事。但不是说我们不做应用。或者,不应该把它定义成一个“应用”。
“应用”听起来好像你有一个技术,你想把它用在什么地方,有商业化闭环。但“应用”不是准确的词。它跟AGI是相辅相成的。它本身是实现AGI的手段,也是实现AGI的目的。“应用”听起来更像目的:我为了让它有用。你是要combine东西方的哲学,要赚钱,也要有理想。
今天用户帮我们发现了很多从没考虑过的场景。他拿这个筛选简历,这是我们设计产品时没想过的,但它天然work。用户的输入反过来让模型变得更好。Midjourney为什么效果好?它在用户端做了scaling——user scaling和model scaling需要同时做。反过来,你如果只关注应用,不关注模型能力迭代,不关注AGI,贡献也有限。
腾讯新闻《潜望》:朱啸虎(金沙江创投主管合伙人)就只投大模型的应用。他有一个观点:核心最难的是AIGC的PMF——你十个人找不到PMF,你投一百个人也找不到,和人数、和成本没关系,不要砸钱。他说“用LLaMA训练两三个月,至少能做到人类top 30的水平,立马可以取代人”。你怎么看他的观点?
杨植麟:AI不是我在接下来一两年找到什么PMF,而是接下来十到二十年如何改变世界——这是两种不同思维。
我们是坚定的长期主义者。当你实现AGI或更强智能,今天的一切会被改写。PMF固然重要,但如果着急找PMF,你很可能又被降维打击。降维打击发生过太多次。以前很多人做客服、对话系统,做slot filling(槽填充),有些规模不错的公司。但是,全是降维打击了,很难受。
它不是说不成立。假设你今天找到一个场景,用现在的技术能力,且从0到1增量价值巨大,从1到n空间又没那么大,这种场景OK。Midjourney就是,或者做文案生成,相对简单一点的任务,从0到1效果又很明显。这种是只关注应用的机会。但是,最大机会不在这。你的目的假设是商业化,你不可能脱离AGI去思考。我现在只做应用,那好,可能过一年你就被碾压了。
腾讯新闻《潜望》:可以偷偷把底层模型升级啊。
杨植麟:但这个不可能做得比它更大。技术是这个时代唯一新变量,其他变量没变。回到第一性原理,AGI是所有事情的核心。基于这个,我们推导出来:超级应用肯定需要有最强的技术能力。
腾讯新闻《潜望》:可以用开源的模型吗?(最新消息是Google宣布开源模型Gemma)
杨植麟:开源落后于闭源,这也是个事实。
腾讯新闻《潜望》:会不会只是暂时落后?
杨植麟:目前看起来不是。
腾讯新闻《潜望》:为什么开源追不上闭源?
杨植麟:因为开源的开发方式跟以前不一样了,以前是所有人都可以contribute(贡献)到开源,现在开源本身还是中心化的。开源的贡献可能很多都没有经过算力验证。闭源会有人才聚集和资本聚集,最后一定是闭源更好,是一个consolidation(对市场的整合)。
如果我今天有一个领先的模型,开源出来,大概率不合理。反而是落后者可能会这么做,或者开源小模型,搅局嘛,反正不开源也没价值。
腾讯新闻《潜望》:你怎么对抗国内的焦虑情绪?他们会说,大模型公司如果没有快速做出能兑现投资人预期的落地场景和产品,难以融到下一笔钱。
杨植麟:需要有长期和短期的平衡。完全没有用户、没有收入,肯定不行。
可以看到,从GPT-3.5到GPT-4,解锁了很多应用;从GPT-4到GPT-4.5再到GPT-5,大概率会持续解锁更多,甚至是指数型的应用。所谓“场景摩尔定律”,就是你能用的场景数量会随着时间指数级上升。我们需要边提升模型能力,边找更多场景,需要这样的平衡。
它是个螺旋。看你投入多少分配在短期,多少分配在长期。要在你能活下去的情况下,追求长期。长期一定不能没有,否则你会错过整个时代。今天下结论,确实太早了。
腾讯新闻《潜望》:你认可王慧文(美团联合创始人、光年之外创始人)提出的“双轮驱动”吗?
杨植麟:这是个好问题。一定程度上是这个逻辑。但你真正怎么去做,有很大区别。是不是能真的做一些“有概率的非共识”?
腾讯新闻《潜望》:我理解他们说的双轮驱动,也需要快速找到那个新的应用场景,否则不知道技术何以落地。
杨植麟:还是model scaling(模型扩展)和user scaling(用户扩展)之间的区别。
腾讯新闻《潜望》:国内除了你是model scaling的思维,还有谁是?
杨植麟:这个我就不好评价了。
腾讯新闻《潜望》:大多数人可能是user scaling的思维。或者能不能这么说,这是学院派和商业落地派的区别?
杨植麟:我们不是学院派,学院派绝对不work。
腾讯新闻《潜望》:很多大模型公司会通过to B落地(毕竟to B的确定性高),你们做吗?
杨植麟:我们不做。我们从第一天就决定做to C。
看你要什么东西。如果你知道这不是你想要的,你就不会FOMO。因为得到了,也没啥。
腾讯新闻《潜望》:你焦虑吗?过去一年。
杨植麟:更多是兴奋、激动。因为这件事我想了非常久。我们可能是我们最早想去探索月之暗面的人。你今天发现你真的在造一架火箭,每天在讨论往火箭里加什么燃料跑得更快,怎么样不让它炸了。
腾讯新闻《潜望》:总结一下你所做过的“有概率的非共识”决定,除了to C、长文本,还有吗?
杨植麟:更多在过程中,希望尽快跟大家见面。
腾讯新闻《潜望》:中国上一代创业者在应用和场景上吃到甜头,所以他们更看产品、用户、数据飞轮。以你为代表的新一代AI创业者,能代表新的未来吗?
杨植麟:我们也很关注用户,用户是我们最终的目标,但也是共创的过程。最大区别是,这次会更加技术驱动——还是那个马车和汽车的问题——现在属于从马车到汽车的跳跃过程,应该尽可能想怎么给用户提供一辆汽车。
腾讯新闻《潜望》:你会觉得孤独吗?
杨植麟:哈哈哈……你这个问题很有意思。我觉得还好,因为我们还有大几十、100号人一起在战斗。
GPT-4还没赶上,Sora又来了“现在就有点像视频生成的GPT-3.5,是阶跃式提升”
腾讯新闻《潜望》:今年Sora的突然出现,多少在你的意料之中,多少在你的意料之外?
杨植麟:Generative AI(生成式AI)做到这个效果,在意料之内,意外的是时间——比之前预估更早。这也反映了现在AI的发展很快,很多scaling的红利没有被完全吃下来。
腾讯新闻《潜望》:去年业界就判断,2024年大模型一定会卷多模态叙事,视频的生成效果会像2023年文生图一样迅速提升。Sora的技术能力是超出、符合还是低于你的预期?
杨植麟:解决了很多之前比较难的问题。比如,能在一个比较长的时间窗口内保持生成的一致性,这是关键点,是一个巨大的提升。
腾讯新闻《潜望》:它对于全球产业格局来说意义是什么?2024年大模型会有哪些新叙事?
杨植麟:一是短期的应用价值,可以在生产环节进一步提升效率,当然更期待在目前能力基础上,有更多延展。二是和其他模态结合。它本身是对世界建模,有了这个知识,对现有文本是非常好的补充。在这个基础上,不管在agent还是和物理世界的连接方面,有蛮多空间和机会。
腾讯新闻《潜望》:你们总体怎么判断Sora?
杨植麟:我们本来也在筹划类似方向,做了一段时间。方向上,倒没有太大意外,更多是技术细节。
腾讯新闻《潜望》:应该学习的技术细节是?
杨植麟:很多OpenAI也没完全讲清楚。它讲了大致的,会有一些关键细节。这要从它的效果或已有信息再去判断,也结合我们之前的实验。至少对我们来说,在开发过程中会加上更多数据点,有更多数据输入。
腾讯新闻《潜望》:之前视频生成相对文字生成来说,主要瓶颈有哪?这次可以看到OpenAI找到了哪些解决办法?
杨植麟:主要瓶颈,核心还是数据,你怎么去规模化地拟合这个数据?之前没被验证过。特别是,当你的动作比较复杂,生成的效果photo realistic(照片逼真)。在这样的条件下,能够去规模化,它这次解决了这些。
剩下的是它也没有完全解决,比如需要一个统一的architecture(架构)。DiT这个architecture仍然不是非常通用。在单纯对视觉信号的marginal probability(边际概率)去建模,它可以做得非常好,但怎么泛化成一个通用的新计算机?还是需要更unified architecture(统一的架构),这个东西还是有空间。
腾讯新闻《潜望》:你读了OpenAI出的Sora报告没有?——《Video generation models as world simulators》,里面有什么关键点值得划重点?
杨植麟:读了。考虑到当前的竞争情况,最重点它肯定都不会写出来。但还是值得学习,这个东西本来是付费内容,你可能要花钱做很多实验才知道,但现在你知道的有一些东西,不用花钱做实验,就大概有一个认知吧。
腾讯新闻《潜望》:你从里面提取到的关键信号是?
杨植麟:这个东西一定程度上是scalable的。此外,它也给出了比较具体的architecture到底怎么做。但也有可能不同architecture在这个事情上不一定有那么本质的区别。
腾讯新闻《潜望》:你认可它那句话吗?——“扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。”
杨植麟:我非常认同,这两个东西优化的是同一个目标函数,没有太大疑问。
腾讯新闻《潜望》:你怎么看杨立昆又跳出来反对生成式AI?他的观点是:“通过生成像素对世界进行建模是一种浪费,并且注定会失败。生成恰好适用文本,因为文本是离散的具有有限数量的符号。这种情况下,处理预测中的不确定性很容易,处理高纬连续感官输入中的预测不确定性是非常棘手的。”
杨植麟:我现在觉得,你通过对视频的边际概率去建模,本质是在做无损压缩,跟语言模型next token predictions没有本质区别。只要你压缩得足够好,就可以把这个世界可以被解释的东西去进行解释。
但同时也有重要的还没做的事:它怎么跟已有的已经被压缩的能力结合起来?
可以理解成有两种不同压缩。一种是压缩原始世界,这是视频模型在做的。另一种是压缩人类产生的行为,因为人类产生的行为经过了人的大脑,这是世界上唯一能产生智能的东西。你可以认为视频模型在做第一种,文本模型在做第二种,当然视频模型也一定程度包含了第二种,一些人创造出来的视频包含了创作者的智能。
它最终可能会是mix,需要通过这两种方式从不同角度学习,但最终对智能的增长都有帮助。
所以,生成可能不是目的,它只是压缩这个函数。如果你压缩足够好,最后生成的效果就会很好。反过来,如果你这个模型本身没办法生成,是不是也存在可能把它压缩得非常好?这点存疑。有可能生成非常好,是压缩非常好的一个必要条件。
腾讯新闻《潜望》:Sora相对于去年的ChatGPT来说,是两个不一样的milestone,哪个更重大?
杨植麟:都很重要。现在就有点像(视频生成的)GPT-3.5,是阶跃式提升。它的模型也还比较小,可预见的是会有更大的模型,是确定性的效果提升。
腾讯新闻《潜望》:也有人评价说,对于做多模态,Google Gemini突破更重要一些。
杨植麟:Gemini是follow GPT-4V的路线,把这个理解也放进去了。都很重要,只是最终需要把这些东西放在同一个模型,这还没解决。
腾讯新闻《潜望》:为什么放在同一个模型那么难?
杨植麟:大家还不知道怎么做,还不存在一个被验证过的architecture。
腾讯新闻《潜望》:Sora + GPT会产生什么?
杨植麟:Sora马上可以用到视频生产过程中,但如果跟语言模型结合,就有可能打通数字世界和物理世界。另外,你也可以去更加端到端完成任务,因为现在你对这个世界的建模比之前更好,它甚至能用来提升你对多模态输入的理解能力。所以你最后能在不同模态之间做比较多切换。
总结下来,你对世界的理解更好了,你可以在数字世界里做更加端到端的任务,甚至去架起一座桥梁,连接物理世界,完成一些物理世界里的任务。这是起点。比方说,自动驾驶,或者一些家务,理论上都是打通物理世界的一个概念。
所以数字世界的突破是确定的了,但它也还是潜在有通往物理的可能。
腾讯新闻《潜望》:Sora对国产大模型公司意味着什么?有什么应对策略?
杨植麟:没什么区别,这本来就是确定性方向。
腾讯新闻《潜望》:国产大模型GPT-4还没赶上,Sora又来了,你怎么看?两个世界好像差得越来越远,你感觉焦虑吗?
杨植麟:这就是客观的事实嘛。但实际上的差距可能还在缩小,这是技术发展的规律。
腾讯新闻《潜望》:什么意思?就是说,一开始技术曲线很陡峭,接着慢慢放缓。
杨植麟:是的。我倒没有很意外,OpenAI一直在做下一代模型。但客观上差距会持续存在一段时间,甚至在国内不同公司之间的差距也会持续一段时间,现在是技术爆发期。
但再过两三年,有可能中国顶尖的公司可以在这里面去做好更多基础性工作,包括技术的基建、人才的储备和组织文化的沉淀,有这些打磨后,更有可能在某一些方面有领先可能性——但需要一定的耐心。
腾讯新闻《潜望》:中美最终有没有可能形成的是完全不一样的AI科技生态?
杨植麟:生态有可能不一样,如果你是从产品和商业化角度。但从技术角度,通用能力不会是完全不同的技术路线,基础通用能力肯定会差不多。但因为AGI空间很大,在通用能力基础上去有差异化,这个更可能发生。
腾讯新闻《潜望》:硅谷一直有一个争论:one model rules all还是many specialized (smaller) models(一个通用模型来处理各种任务,还是采用许多专门的较小模型来处理特定任务),你怎么看?
杨植麟:我的观点是第一个。
杨植麟:在这一点上,中美会呈现巨大不同吗?
杨植麟:我觉得最终不会。
我接受有失败的概率
“它已经改变了我的生命”
腾讯新闻《潜望》:大模型创业在中国是比较怪异的存在,你们融了这么多钱,但似乎一大笔钱都要花在做科学实验上,这种情况下怎么说服投资人愿意掏钱?
杨植麟:跟在美国没有区别。我们今天拿到的钱还不算特别多。所以,我们还要更多向OpenAI学习。
腾讯新闻《潜望》:我想知道做到GPT-4还需要多少钱?做到Sora还需要多少钱?
杨植麟:GPT-4和Sora都不需要那么多,现在的钱更多是为了下一代甚至下下代模型做储备,做前沿探索。
腾讯新闻《潜望》:中国大模型创业公司虽然拿了巨头的钱,但巨头也在训练自己的模型——你怎么看大模型创业公司和巨头的关系?
杨植麟:这里面有竞争,也有合作。巨头和创业公司第一目标不一样,今天你去看每个大厂的第一目标,跟AGI公司的第一目标不同。第一目标会影响动作、结果,最终在生态里是不同的关系。
腾讯新闻《潜望》:为什么巨头同时对多家大模型公司投入一点钱,而不重注一家公司?
杨植麟:这是阶段问题。下面会有更多的consolidation(资源整合),会有更少的公司。
腾讯新闻《潜望》:有人说大模型公司的终局是被巨头收购,你认可吗?
杨植麟:我觉得不一定,但是他们有可能有很深入合作关系。
腾讯新闻《潜望》:比如说,可以怎么合作?
杨植麟:OpenAI和微软就是典型合作模式,这里面很多可以参考,也有一些可以优化。
腾讯新闻《潜望》:过去一年,在你看来创业中的曲折体现在了哪?
杨植麟:外部变量很多——资本、人才、卡、产品、研发、技术。有高光时刻,也有困难要克服。比如说卡。
中间有很多back and forth(来回)。一段时间很紧张,一段时间供应变好。最夸张的是,有一段时间每天在变,今天一台机器价格260,明天340了,过两天又跌回来,是一个动态变化的过程。要对这件事密切关注。价格一直变,策略也要一直变,到底从什么渠道,买还是租,有很多不同选择。
腾讯新闻《潜望》:这个动态因素是受什么影响?
杨植麟:有geo-political(地缘政治)原因,生产本身有批次,也受市场情绪变化。我们观察到很多公司开始退卡,他们发现自己不一定要训这个模型。市场情绪和大家的决策变化,供求关系跟着变化。好消息是,最近整个市场供应好了非常多。我个人判断至少在接下来一到两年,卡不会成为很大瓶颈。
腾讯新闻《潜望》:你似乎一直在思考组织,在团队构建上是怎么做的?
杨植麟:招人思路发生过一些变化。世界上AGI人才非常有限,有经验的人很少。我们最早期的画像是,专注找对口的genius(天才)。这个证明非常成功。之前有对模型动手术的能力,有训练超大规模模型直接的经验,就可以很快做出来。包括Kimi发布,资本效率和组织效率其实很高。
腾讯新闻《潜望》:花了多少钱?
杨植麟:一个挺小的数,相比很多其他花费,是花小钱办大事。我们很长一段时间是30-40人的状态。现在80人。我们追求人才密度。
人才画像后来发生了变化。最早期招genius,认为他的上限高,公司上限是由人的上限决定的。但后面我们补齐了更多维度的人——产品运营侧的人,leader型的人,能把事情做到极致的人。现在是一个更完整、有韧性、能打仗的团队。
腾讯新闻《潜望》:在中国大模型创业一年,怎么评价现在取得的阶段性成果?
杨植麟:造了一个火箭的原型,现在点火试飞。积累了一个团队,弄清楚了一些燃料的配方,多多少少还能看到一个PMF的雏形。
可以说,登月走了第一步。
腾讯新闻《潜望》:你怎么看杨立昆说,他不看好现有技术路线,认为自监督的语言模型没办法习得真正世界的知识,随着模型规模的扩大出现谬误,也就是机器幻觉的几率会越来越高。他提出了“世界模型”的观点。
杨植麟:没有本质瓶颈。当token space足够大,变成一个新型计算机解决通用性问题就OK了,它就是一个通用世界模型。
(他这么说)很重要一点在于,大家都能看到现在的局限性。但解决方式并不一定需要全新框架。AI唯一work就是next token prediction + scaling law,只要token足够完整,都是可以做的。当然今天他指出的问题存在,但这些问题就是你把token space变得很通用,就可以了。
腾讯新闻《潜望》:他是放大了局限性。
杨植麟:我觉得是。但底层第一性原理没什么问题,只是说现在有些小技术问题没解决。
腾讯新闻《潜望》:你怎么看Geoffrey Hinton(深度学习之父)一而再、再而三呼吁AI Safety的问题?
杨植麟:Safety反而表明了,他对接下来技术能力的提升有极大信心。他们是相反的。
腾讯新闻《潜望》:幻觉的问题怎么解决?
杨植麟:还是scaling law,就是scale的是不一样的东西。
腾讯新闻《潜望》:有多大概率scaling law走到最后发现根本走不通?
杨植麟:可能约等于0。
腾讯新闻《潜望》:怎么看你的CMU校友陆奇的观点:OpenAI未来肯定比Google大,只不过是大一倍、五倍还是十倍的问题?
杨植麟:未来最成功的AGI公司肯定是会比现在所有公司都大。这点没有疑问,它最终可能是double、triple GPT的事。它不一定是OpenAI,有可能是别的公司,但肯定有这样的公司。
腾讯新闻《潜望》:如果你恰巧成了这家AI帝国的CEO,你会做什么用以保护人类吗?
杨植麟:现在想这个问题还缺少一些前提条件。但我们肯定愿意跟社会不同角色去合作和提升,包括在模型上有更多安全措施。
腾讯新闻《潜望》:你2024年的目标是什么?
杨植麟:第一是技术突破,我们现在应该能做出比2023年好得多的模型。第二是用户和产品,希望有更多成规模的用户和黏性。
腾讯新闻《潜望》:2024年对于全球大模型产业有哪些预测?
杨植麟:今年还会有更多capability出现,但格局不会跟今天有太大差别,top这几个还是会领先。在能力上应该今年下半年会有一些比较大的突破,很多会来自OpenAI,它肯定还有下一代模型——有可能是4.5,也有可能是5,感觉是大概率事件。视频的生成模型肯定还能继续scale。
腾讯新闻《潜望》:2024年对于国产大模型产业有哪些预测?
杨植麟:一是可以看到新的独特能力产生。你会看到国产模型,因为前期的投入,有合适的团队,做出世界领先的某一些维度的能力。二是会出现更多用户量级更大的产品,这是大概率的。三是会有进一步的consolidation和路线选择的分化。
腾讯新闻《潜望》:创业你最害怕的一件事情是什么?
杨植麟:还好,就是要无所(畏惧)往前冲啊。
腾讯新闻《潜望》:想对同行说什么?
杨植麟:一起努力。
腾讯新闻《潜望》:说一个你对于大模型行业现在还不知道但最想知道的问题。
杨植麟:我不知道AGI的上限是什么样的,它会产生一个什么样的公司,这个公司能产生出来什么样的产品。这是我现在最想知道的事。
腾讯新闻《潜望》:AGI这么发展下去,你最不想看到的一件事是什么?
杨植麟:我对这个比较乐观,它可以让人类文明往下一个阶段去发展。
腾讯新闻《潜望》:有没有人评价你,太过于理想主义?
杨植麟:我们也是很脚踏实地的,我们真的也做了一些事,不是只是在说嘛。
腾讯新闻《潜望》:如果你今天拿到的钱是最后一笔钱,你会怎么花这笔钱?
杨植麟:我希望这个永远不会发生,因为我们未来还需要很多钱。
腾讯新闻《潜望》:如果你没有做成什么,会觉得自己失败了?
杨植麟:关系不是那么大,我接受有失败的概率。
这个事情它已经完全改变了我的生命,我是充满感激的。
——————End——————
0 notes
readonline · 2 months
Link
0 notes
readonline · 2 months
Link
0 notes
readonline · 2 months
Link
Tumblr media
0 notes
readonline · 3 months
Link
0 notes
readonline · 3 months
Link
0 notes
readonline · 3 months
Link
0 notes
readonline · 3 months
Link
0 notes
readonline · 3 months
Link
0 notes
readonline · 3 months
Link
在当代美国华裔作家中,李翊云是不可忽视的存在。2003年登入文坛以来,李翊云的作品连连获奖——首部短篇小说集《千年祈愿》获得2005年弗兰克·奥康纳国际短篇小说奖,上榜《纽约客》“最值得期待的年轻作家”,2012年获美国“麦克阿瑟天才奖”,2013年担任英国布克奖评委.......2023年11月,《我该走了吗》在中国出版,这是李翊云首部被译成中文出版的小说。
李翊云的写作和她的人生一样难以捉摸,不可归类。她拒绝陈词滥调,反抗美国写作坊教授的金科玉律,反对“技法”。她的人生也是对陈词滥调的拒绝:30岁,她放弃医学博士的学位,开始写作,再读一年她就能拿到学位;她用英语写作,并一直拒绝将小说翻译成中文;2012年,她患上了抑郁症,有几年不能再写小说;2017年她出版回忆录《亲爱的朋友》,讲述自己的抑郁经历,几个月后,她的长子文森特自杀身亡。
面对命运的痛苦和不可知,李翊云一以贯之地给予反击,她对“简单的出路”不感兴趣,认为“安宁就是陈词滥调”。她说:“我不和解。”
华裔作家的中国经验
李翊云于1972年出生于北京一个知识分子家庭。她父亲是核物理学家,母亲是小学语文老师。和同代人一样,她生长在阅读资源稀缺的环境里,读任何可以得到的文字,包括鱼贩不要了的旧报纸,连环画的高尔基自传三部曲,托尔斯泰《复活》的报刊连载,图书馆借来的屠格涅夫的《散文诗》。早在十岁时,她便表现出文学野心,下定决心要背诵所有著名李姓诗人的诗作。
1996年,李翊云前往美国,在爱荷华大学攻读免疫学博士学位。作为科学家的人生轨道一望可见尽头:拿到学位,读几年博后,在学界或生化行业找到一份稳定的工作,买房生子,养一只狗。这种确定性让她产生了动摇。
爱荷华大学所在的小镇是一个文学之都,“几乎人人都在写小说”。读博第四年,李翊云在闲暇时间参加了面向社区的写作课,在《纽约客》上读到爱尔兰小说家威廉·特雷弗的短篇《传统》(Traditions)。读完后,她从图书馆借出特雷弗的短篇集《山区光棍》,沿着它又找到他的其它作品。特雷弗的写作为她打开一个前所未有的空间,她渴望能像他一样创作出属于自己的文学世界。
几周后,她决定离开科研,尝试英文写作。她的高中同学打来电话,“我不相信你能写成,你在中国长大,你怎么去写美国的上层和主流社会?”她的丈夫提醒她,比起科研,写作对她的索取会更多,所谓“不疯魔,不成活”。李翊云没有退却。她告诉丈夫,给自己三年时间——如果三年结束,写作还没进展,她就去读MBA,或法学院。时限未满,她的短篇《不朽》(Immortality)被《巴黎评论》编辑在自由来稿里选中,在杂志2003年秋季刊上发表。不久后,她被爱荷华知名的创意写作项目录取。同年12月,她的短篇小说《多余的人》(Extra)在《纽约客》上发表。
《多余的人》描述的世界不能离“美国的上层和主流社会”更远。故事主角林奶奶在市场经济到来之际被工厂“光荣退休”,几经波折,她来到北京郊区一所高级寄宿小学就职,结识一个小男孩,两人相互依靠。小男孩有偷袜癖,林奶奶善意庇护,最终事发,被学校解雇。这个短篇收录于李翊云2005年出版的首部短篇集《千年祈愿》(A Thousand Years of Good Prayers),捕捉了九十年代中国的脉搏。这部短篇集摘获了五项大奖,包括美国笔会小说奖和《卫报》首部小说奖。继《千年祈愿》后,李翊云接连出版了长篇小说《漂泊者》(The Vagrants)、短篇小说集《金童玉女》(Gold Boy, Emerald Girl),并于2010年被《纽约客》评为“20位40岁以下最值得关注的小说家”之一,她是名单上唯一一个华裔作家。
李翊云,2006年,加州,摄影师:Randi Lynn Beach
从《千年祈愿》到2012年出版的长篇《比孤独更仁慈》(Kinder than Solitude),李翊云这一阶段的作品大多发生于中国,或以中国人为主要人物。对如今的中国读者来说,书中描绘的中国经验未必符合他们的期待。以《千年祈愿》为例,书中人物在对话时频繁引用中国格言,这一写法继亚裔作家汤亭亭的《女勇士》、覃恩美的《喜福会》以来已成为常规写法之一,而在强调少数族群主体性、抵抗英语霸权的今天,这样的呈现方式有将人物“他者化”、刻意营造异国情调之嫌。
中国在过去二十年间发生的巨变,也让当时书中描写的日常,变成了今日的文化刻板印象。这样的作品引起部分读者揣测,作者是否意在搭建一种中国奇观,以迎合西方读者对中国的狭隘想象而取得最快捷的成功。
李翊云对此的回应很简单:她在写作时从不考虑读者,只为自己而写。谈起《不朽》的写作契机,她说在她成长过程中,太监是个司空见惯的存在,直到后来她才意识到这是多么非同寻常,而她在写作时总被“不太对劲”的事物所吸引,仅此而已。
《巴黎评论》的前编辑布丽吉特·休斯回忆了她第一次读到《不朽》时的情形。和许多老牌英文文学杂志一样,《巴黎评论》由实习生阅读自由来稿,从中筛选出优秀稿件,推荐给编辑。休斯至今记得,当时实习生拿着《不朽》来到桌前,说,“我认为你应该读一读这个故事。”她读了第一句话——“他的故事,和我们所有人的故事一样,在出生很久之前就开始了”——便被它所吸引。在休斯看来,李翊云或许的确为英文世界注入了宝贵的中国经验,但更重要的是她不同于其他作家的特质:“对时间的持久兴趣,对将自己视为独立个体的追求,一种拒绝服从任何期待的执拗,无论这期待来自他人还是她自己。”
从二十世纪三四十年代向西方解释中国的林语堂,到五六十年代力图将西方滤镜下的封建中国祛魅的张爱玲,再到九十年代凭借《池塘》、《等待》等小说在美国文坛立足的哈金,用英语写作的中国作家虽然不多,但已有谱系可循。和这些作家不同的是,李翊云在书写中国经验时,无意如实再现外在的社会现实,而是着眼如何捕捉人物的内心图景。
在她的早期作品里,两种人物反复出现:不受社会关系束缚的年长女性和在血缘或情感上缺乏家庭依靠的孤儿。二者常常结伴出现,比如《多余的人》中的终身未婚的林奶奶和被父亲流放到寄宿学校的小男孩,《金童玉女》中丧夫独居的戴教授和她大龄未嫁的女学生,《善意》中独居的单教授和她郁郁寡欢的女学生莫言。年长女性和孤儿之间从来不是母子关系,他们的权力动态更接近于平等的爱情或友谊,双方对边界进行试探,每一次逾越和角力都在深思熟虑后进行。在《善意》中,单教授未经莫言养父母允许,向女孩透露了她的身世,长大后,莫言不再拜访自己的启蒙老师,以缺席确认了自己的力量。
通过联结没有孩子的女人和没有母亲的孩子,李翊云创造了一种新的世情契约。某种程度上,正是这种脱离了传统东亚情感框架的契约,让她的作品游离于读者熟悉的中国经验之外,获得了超越国界的力量。然而这并不意味着西方的凝视不存在。一方面,作者只能写自己想写的故事;另一方面,出版作为商业行为,注定要经历市场精明的评估与筛选。
《千年祈愿》出版17年后,李翊云在《鹅之书》(The Book of Goose)里,借主角法比安(Fabienne)的故事回望了自己早年的出版经历。法比安生长于二战后的法国农村,年少时,她和朋友以自己的所见所闻,合著并出版了一本短篇集,被媒体誉为神童。李翊云的编辑米兹·安吉(Mitzi Angel)敏锐地指出,这或许是李翊云最具自传性的小说。
和李翊云一样,法比安与她的朋友是为了自己而写作,但她们在作品中呈现的奇情奇景却引起了外界强烈的好奇与争议。与其说是写作者为了一己私利将现实扭曲,不如说是外界的凝视将作品和写作者曲解。李翊云的真实想法可从法比安的自述中窥见一斑:“媒体说我们的书每一页都诚实到残忍,说我是战后生活的记录者,年轻而野蛮,被病态的现实所吸引。我野蛮?我病态?这就像说我的鸡是强盗团伙一样。……《快乐的孩子们》出版后,媒体激烈讨论是什么让我这样一个农村女孩选择写一本书。有人说,是野心。有人说,是必要。……野心和必要,这二者我都从未真切感受过。”
《鹅之书》,摄影:钟娜
质疑和非难从一开始就伴随李翊云的写作。李翊云将她在爱荷华写作坊的经历形容为“非正常的”,因为“有一半的时间我都没在听。”为什么?“因为我觉得他们说的话没有意义,”她说。在作家玛丽莲·罗宾逊的写作课上,李翊云的美国同学认为她提交的作品没有“故事”;在他们熟悉的西方叙事里,故事要有情节,冲突,人物弧光。另一位美国教授在入学后不久的一堂课上朗读了《多余的人》里的一句话,说:“这句话很好,但你不知道它有多好。”李翊云在心里说:“我知道它究竟有多好!”
她知道自己作品的价值,并会毫不犹豫地捍卫它们。在修改首部长篇《漂泊者》(The Vagrants)时,李翊云的编辑凯特·梅迪纳劝她去掉一个年轻女性角色脸上的胎记。她拒绝了。此后她不再接受梅迪纳的建议。梅迪纳是兰登书屋的资深编辑,合作过众多作者,包括南希·里根。她后来对别人说:“翊云不好管。”
离开家——母亲、祖国、母语
你或许会认为这种自信来自一个坚实的自我,但李翊云却写道:“我有信心‘扮演’我的‘存在’。然而这种信心是拿一个空洞来替代‘我’。一旦‘我’走入我的叙事,我的信心就分崩离析。”当你纵身跃入李翊云的写作,你会发现它处处闪烁着类似的自我矛盾。
比如,尽管她书写了一群独一无二的人物,却坚称自己从未“创作”他们,而仅仅只是“发现”。她反感陈词滥调,却花了超乎常人的时间引用、解析、反转它们,也从它们的平庸中获取慰藉。她被煽情的情节剧(melodrama)吸引,为它创作了我所读到的最为深刻新颖的剖析与辩护,但当我问她认为自己哪部小说的情节剧含量最高时,她想了想,用近乎耳语的声音说:“我不认为我的作品很情节剧。”
“《比孤独更仁慈》(Kinder than Solitude)呢?”
她想了想。“那本或许有一点。”
《比孤独更仁慈》出版于2013年,故事始于90年代的北京大院,四个少年少女相逢,其中一人临时起意下毒同伴,受害者在十数年后去世,其余三人的命运被这场谋杀捆绑在一起,无论选择留在原地,还是远走美国,都无法摆脱过去的强大引力。小说世界被死亡的巨大阴影笼罩,爱和善意像灰色天空中落下的零星雪花,转瞬即逝。“这部小说唤出我内心对他人的恶意和对自己的无情,”李翊云写道。
《比孤独更仁慈》,图源:网络
写作期间,她的心理健康出现严重问题,产生自杀倾向,最终被诊断患有抑郁症。她频繁地前往欧洲、美国各地参加文学活动,因为这好过住进医院,好过在原地待着。她随身携带笔记本,记下与自己的辩论,一个声音冷静理性,另一个激烈叛逆,如同“乔治·艾略特与陀思妥耶夫斯基的对峙”。
2012年,在纽约参加文学活动时,李翊云再次出现自杀倾向,最终入院。在医院,她结识了其他病友,会和她们坐在走廊沙发上聊天,倾听她们的故事。病友知道她爱吃橘子,便从餐厅偷来,藏进她的抽屉。朋友前来探望,带来她要的托尔斯泰的小说和蒙田的随笔集,她与它们形影不离,引来病友善意的戏弄。她告诉她们,你们可以嘲笑我,但不能嘲笑我的书。前所未有地,她感到时间的牢笼,它仿佛只为别人流逝,却在自己这里停滞;如何从这一天过到下一天,这一刻过到下一刻,变得无比艰难。生活围绕医生诊断、药物治疗和院方管理展开。有许多问题需要回答:每天的目标是什么,今天为什么哭了,以及,为什么要自杀?
现代医学对抑郁症的成因有一套简单明了的解释。比如睡眠不足对身心健康带来的直接影响——多年来,李翊云的时间被工作和母职瓜分,只有在午夜到凌晨四点之间写作。遗传基因也是一大因素:李翊云的外婆有精神病史,最终在精神病院离世。
科学难以度量的是一个人的过去对她的影响。李翊云生长于一个不快乐的家庭,“我母亲的不快乐是尖利的,我父亲的是沉默的,我姐姐的是苦涩的。”她的母亲在外是一名优秀的老师,受一代代学生与家长尊敬,在家中却是一个暴君,“冷酷和脆弱都来得猝不及防。”与姐姐相比,李翊云受到母亲明显的偏爱,当母亲暴怒时,总被派去“抚平她的情绪,平息她的怒火,让她重新回到孩童般的快乐,这样我们才有呼吸的余地。”早在李翊云能用语言表达感受之前,她就知道,“我们家唯一的孩子是我母亲。比起她的狂怒,我更害怕她的眼泪。”
隐私是不存在的概念,母亲将钟爱的女儿视作自己的延申。为了抵抗母亲翻看自己的日记,李翊云发明了自己的加密法:如果她要写看到的一只鸟,就去写树,写云,写天,唯独不写自己真正想记录的东西。中文于是成为一种密文,真实的自我被藏匿在沉默的空白中。
12岁时,李翊云第一次翻开英语课本,“那是我最美好的记忆之一”。她的母亲不会英文,这门外语于是成为一道屏障,将母亲的凝视挡在外面。李翊云获得了自由:“写作时,我经常忘记别人也会使用英语。英语是我的私人语言。每一个字都要经过深思熟虑才能变成我的文字。我毫不怀疑……我和自己进行的对话,无论语法上多么不完美,都是我一直以来想要进行的对话,每一个字都如我所想。”
直到长篇小说《我该走了吗》(Must I Go)的中译本出版前,她拒绝授权让自己的作品被译回中文。“我人生中唯一脱离母亲的讲述的部分就是我的写作……我完全可以想象我人生的其它部分出现在她的叙事里:我的婚姻,我的孩子,我的过去。她要求进入我的叙事,我要求离开她的。”
李翊云,2010年,加州,摄影师:Ye Rin Mok
对李翊云而言,离开家——母亲、祖国、母语——不只是对另一种可能性的探索,更是一种自我保护的机制,一种重新建立边界的必要,去确认何处他人结束而自我开始。很长一段时间里,她致力于消泯自我。她拒绝“自传性”写作,“英文中,我最讨厌用的词是‘我’。”她选择学习免疫学,也是因为免疫系统的运行机制吸引了她。“它的工作就是监测和攻击非我 ……它的记忆可能会选择性出错,甚至还会敌我不分,导致系统将自身误认为需要消除的异物。”转向写作后,她从小说人物对她的漠不关心中获得了慰藉。“他们没有兴趣干涉我的生活;他们既没时间也没兴趣问我问题;他们不会把我保存在他们记忆的琥珀里。这种自由——一种接近不存在的自由,除了这个我从别人那里还有什么想要的呢?”
在获得自由的同时,她也付出了代价:当一个人常年用第二语言阅读、写作、思考,她也赋予了它篡改记忆的权力。李翊云发现,哪怕在梦里,当她回到儿时的北京,里面出现的熟悉面孔也说着英语;她记得美国教授打来的长途电话,却不记得和姐姐在某个新年前夜在电话上聊了什么。第二语言的中立甚至漠然,让她成为了自己的异乡人。小说家加斯·格林威尔如是评价李翊云的写作,“她对人物的关注好似我们想象中上帝对我们的关注:一种泯灭自我、不带丝毫感伤的爱,一种残暴的关注(brutal attention)。”
患上抑郁症后,李翊云意识到,否认自我的机制失效了。“我背离了自己的直觉,对一些人、一个职业、一门第二语言产生了依恋,但我尚未学会如何与他们共处。”
如何重塑自我,并学会与之共处?李翊云选择了阅读和写作。阅读是她允许自己进行的为数不多的越界行为之一,它让她得以深入他人的思想、情感和记忆,却无需在他们的生活中占据一席之地。在与抑郁症对峙的两年里,她读了多位作家的信件、日记、传记和作品,包括约翰·麦加恩、斯蒂芬·茨威格、伊万·屠格涅夫、安东·契诃夫、伊丽莎白·鲍恩、菲利普·拉金、玛丽安·摩尔、詹姆斯·艾伦·麦克弗森、托马斯·哈代、凯瑟琳·曼斯菲尔德。他们有的与故乡亲密无间,有的受困于不幸的家庭关系,有的被病痛和琐事缠身,但时间一视同仁地从他们的生命中流逝,这比什么都让她感到慰藉。她一面读,一面想起那些她拒绝讲述的故事。写作对她而言是一个悖论:要想隐藏自我,沉默是最有效的方式,然而自我唯有在表达中才能显形。李翊云最终选择直面自我,“开口即会犯错,但我仍愿尝试”。自此,她成为了一名新的作家。
通过抵抗,完成创造
这天,李翊云在普林斯顿大学的办公室阳光灿烂。我们就情节进行了友好的辩论。对她来说,真正好的短篇小说就是“无事发生”。她告诉学生,你一开始讲“故事的弧线”——情节交代、起始行动、高潮、下降行动、冲突解开——“你就错了。”“因为故事没有弧线,”她说。“这是个人为的概念。你不是靠弧线来生活的。你不是靠情节来生活的。人生没有情节。生活会自行发生。”
“写作坊还有一个陈词滥调的说法——你觉得人物应该有目的吗?”
“哦不!”
当下我正处在对情节兴趣盎然的阶段。情节,一系列精心搭建的因果关系,它暗示着搭建者的信心和乐观主义,认为我们的所作所为会产生后果。爱尔兰裔英国作家艾丽斯·默多克是我今年最惊喜的发现之一,这位哲学家和小说家乐于编织情节,哪怕它们有时近于荒诞。她的作品跌宕起伏,富于娱乐性,却探讨着最为严肃的课题。
“我刚刚重读了很多艾丽斯·默多克的作品,”李翊云说。“我不喜欢她……我时不时会读她的书,就为了提醒自己我不喜欢她。我觉得她是个道德家(moralist)。”
李翊云的父亲是一名宿命论者。在他的影响下,李翊云从十二岁到二十三岁期间熟读佛经,从佛教对“空”的阐释中获得了许多慰藉。情节和道德,这两个概念几乎可说是宿命论的反义词。天地不仁,以万物为刍狗。和命运讨论情节是否合理、是否合乎道德,是没有意义的。
写作能不能教?自创意写作教育被引入国内以来,围绕它的争议便从未停止。在李翊云看来,写作不能教,但阅读可以;老师不必向学生指出哪条路可以走,但可以教他们避开哪些弯路。当年在爱荷华写作坊上,李翊云孤身一人面对美国同学代表的西方叙事;如今她在普林斯顿大学教授创意写作,并于2022年接任美籍印度裔作家裘帕·拉希莉成为创意写作系主任。她的教学理念和她的写作风格一脉相承:通过抵抗,完成创造。
华裔作家艾达·张(Ada Zhang)就读爱荷华创意写作专业时,曾参加过一场李翊云的体验写作坊。在课堂上,李翊云将她的短篇“大卸八块”,但“不是恶狠狠地(把它拆解),而是带着决断和智慧。”她用三个关键词形容李翊云的作品:颠覆性的、敢于冒险的、好玩的。美国写作坊的金科玉律是“呈现而非讲述”(show don't tell),“而翊云喜欢说,去讲述,除非你不得不呈现……她已经超越了技法,某种意义上,她是‘反技法’的。”
继《亲爱的朋友》之后,李翊云的写作发生了变化。自2019年起,她出版了长篇《理性终结之处》(Where Reasons End)、《我该走了吗》(Must I Go)、《鹅之书》和最新的短篇集《星期三的孩子》(Wednesday’s Child),在这些作品中,她的人物依然沉默、内敛、坚韧——他们接受生活的本来面目,忍受时间和关系的磨损,不对世界怀抱过高期待,也甚少将自我意志强加于人,不同的是,他们如今不再戒备他人的善意,也不再害怕暴露脆弱,暴露自我。
李翊云出版的小说,摄影:钟娜
这种“打开”,或许和这些人物大多都做过母亲有关。在孩子面前,母亲注定是脆弱的。抑郁症逐渐康复后,李翊云开始创作长篇《我该走了吗》。莉利亚是一位耄耋之年的美国女性,住在死气沉沉的老年护理中心,生活中最大的乐趣来自阅读一个叫罗兰·鲍利的男人死后出版的日记选集。罗兰和莉利亚有过一段露水情缘,但他不知道自己和莉利亚生有一个女儿,名叫露西,更不知道在莉利亚四十四岁那年,二十七岁的露西结束了自己的生命。多年来,性格强悍的莉利亚拒绝和任何人谈论女儿之死。为了给露西的女儿留下一份记录,她开始为罗兰的日记撰写注脚。回忆松动,莉利亚的声音开始动摇。在某一刻,她承认,“所有的母亲都是失败的。”
《我该走了吗》中文版,图源:网络
有一些问题将永远无法得到解答
2017年9月,在创作《我该走了吗》的过程中,李翊云十六岁的大儿子自杀了。这年她四十四岁,正忙着从加州举家搬到新泽西州。儿子死讯传来的四小时前,她和丈夫刚刚交付普林斯顿新家的定金。“在小说里,我决不会让这两件事发生在同一天。”她写道。“写小说时,作家会避免这样的巧合,因为它的戏剧性流于牵强,伤痛流于粗糙,隐喻过于讨巧,场面过于俗套。然而,生活并不会遵循小说家的原则。我猜想,小说常比生活平淡。”
谈起大儿子时,李翊云用的词不是人们常用的“去世”,“不在了”,“走了”,而是“死了”。和其它形容相比,“死了”更钝更重,没有修饰掩藏,最接近事实本质。这个词响起时,我愣了一秒;面前的李翊云脸微微涨红,但目光没有退缩。
这个瞬间虽短,却能代表李翊云的态度。应该如何面对一位丧子的母亲?一部分人,出于好奇或恶意,会选择追问;另一部分人,出于同情或无措,会选择沉默。李翊云对这两种反应都选择抵抗。一方面,她温和而坚决地拒绝谈起她的孩子和丈夫。“我尊重他人的隐私。我可以谈论我的感受,但我不会告诉你我丈夫或(我儿子)的感受。我不会告诉你他们的事,因为那是他们的生活。无论我说什么,都远远不够。”另一方面,她也拒绝躲在沉默背后,向外界假装这件事从未发生。曾经,她致力于将自己和生活藏在小说里,现在她意识到,躲藏没有意义。她决定以最直接的方式面对儿子之死。于是就有了2019年出版的《理性终结之处》(Where Reasons End)。
《理性终结之处》,图源:网络
《理性终结之处》是一部虚构作品,但和普通小说不同。在书里,李翊云和儿子以最接近他们现实生活中的面貌出现:失去儿子的母亲来自中国,用英文写作,出版多部作品,其中一部名《千年祈愿》。选择自杀的儿子尼古拉十六岁,敏感早慧,身姿轻盈如鹿,喜欢阅读、音乐、烘培、编织,能轻易地用他的蛋糕、鲜花、音乐和活力占满整个空间。母亲想知道,这样一个富有活力的少年,为什么会选择结束生命?死亡究竟意味着什么?母亲是否能够拯救自己的孩子?死去的人还会痛苦吗?
换作另一个作家,比如琼·狄迪恩或安妮·埃尔诺,会冷静地记录亲人死亡的过程,剖析自己哀恸的历程,回忆与他们共享的过去。李翊云也这么做了,但她采取的路径更具颠覆性,异想天开。死亡是有去无回的未知国度,是时间终结之处,是彻底的沉默,而她选择打破以上所有认知——动用小说家的想象,她怀着去爱与理解的愿望,将死者召回,在昨天与明天的缝隙里,与儿子进行了一场不可能的对话。
这是一段与众不同的母子关系,他们相处的方式是争辩。尼古拉极富语言天赋,尤其喜读诗歌,拥有傲人的词汇量。母子经常不知疲倦地进行文字游戏,把旧词拆解,在颠转腾挪中将它们赋予新意。如果有noon(中午)和afternoon(下午),有math(数学)和aftermath(后果),那为什么不能有time(时间)和aftertime(后时间)?两人就形容词和名词的辩论贯穿全书,母亲认为形容词惯于评判、固执己见,儿子则抱怨名词枯燥乏味,不够轻盈。借着这些看似不着边际的对话,母亲和尼古拉其实是在交换彼此对人生的看法。孩子渴望挣脱生活的种种束缚,获得轻盈;而母亲希望孩子脚踏实地,接受某种朴素框架的庇护。
有一些问题将永远无法得到解答。在尼古拉自杀当天,从母亲送他去学校到得知孩子死讯之间,经过了八个小时。这八个小时里,尼古拉做了什么、想了什么,将永远成为一个谜。尼古拉生前留下了一个电子文档,母亲在和丈夫商量后,选择不打开它。“无法知道答案想必最接近人们所说的伤口,”李翊云写道,“一个人可以携着如此性命攸关的不确定性活下去吗?”临近书的结尾,她用反问的方式给出了答案,“深渊是不是可以变成一个人自然栖居的地方?我们是不是可以像接受头发或眼睛的颜色一样,接受痛苦?”
小说家加斯·格林威尔(Garth Greenwell)是李翊云的校友、朋友,读过《理性终结之处》不下十次。在一堂以“文学如何肯定生命”为主题的大师课上,他以《理性终结之处》为例,解读何为“消极感受力”(negative capacity)。这个概念最早由英国诗人约翰·济慈提出,指代作家接受“不确定性、神秘、疑惑,不去急躁地追求事实和原因”的能力。书中的母亲选择不打开尼古拉生前创建的文档。在格林威尔看来,这个决定体现了她的消极感受力,她对儿子自杀之谜的承认和接受。他说,“这本书要想能令人信服地肯定生命,就必须规避一厢情愿的自我欺骗。这是一种需要穿过否定才能抵达的肯定。”他认为,尽管李翊云并不信教,但她所热爱的许多爱尔兰作家都有天主教背景,而天主教中提倡以消泯自我而抵达上帝的否定神学(Apophatic Theology),或许通过爱尔兰文学间接对她产生了影响。
李翊云,2016年,意大利佛罗伦萨,摄影师:Basso Cannarsa/Agence Opale
我问李翊云是否对成为母亲有过挣扎。与雷切尔·卡斯克、希拉·海蒂、玛吉·尼尔森等女性同行不同,李翊云从未直接写过自己成为母亲的决定、过程,或抚育孩子和照料家庭的痛苦。
“我没有挣扎过。有些人知道自己要什么。我觉得人们有不同的倾向。”她补充道,“我甚至不觉得自己是一名女作家。”
“过去二十年里,女性一直在写是要生孩子还是不生,好像这些是最重要的决定。它们不是。它们不是!我不这么认为。”她说。
“那什么是呢?”
“我认为你只需要做出决定,然后承担它的后果。”
她的回答如此云淡风轻,让我不禁问出下一个问题:“你怕痛吗,生理上的或者精神上的?”
“生理上的疼痛我还是有点怕的。”她俏皮地笑道, “我以前不怕。”
“我觉得你非常坚忍(stoic)。”
“没错。也许我唯一能笃定断言的,就是我很stoic。塞内卡,他的书信,都是关于斯多葛主义(Stoicism)的。而我确实很喜欢塞内卡。”
“Stoic”这个词如今多用于描述个体忍受痛苦、鲜少流露感情的特质,这个定义已经大大偏离它的起源,即斯多葛派哲学。这个学派上可追溯到苏格拉底,其理念在代表人物塞内卡的书信集中得到了全面的阐述。塞内卡是活跃于罗马帝国早期的哲学家、政治家,他在生命最后两年写给朋友卢西利乌斯的书信涉及广泛的主题,包括人为何要了解自我,如何明智地把握时间,为什么我们需要友谊、自然、朴素的生活方式,以及如何面对失去和死���。他鼓励朋友(以及读者)接受自身无法掌控的事,通过严格的自省抵达心智的平和。在关于如何哀悼逝去的朋友的信里,他写道:“你想知道我们为什么会悲形于色、泪流不止吗?因为我们在通过眼泪寻找丧亲之痛的证据,我们不是在屈服于悲伤,而是在炫耀它。” 他总结到,“我们可以流泪,但不能号哭。”
“我不会那么轻易地放过我自己”
2017年11月,儿子去世两个月后,李翊云和家人搬入新家。房子后院里,大半植物的叶片已被秋雨打落,难以辨认种类。整个冬天,她读不进小说,转而阅读莎士比亚的戏剧和华莱士·斯蒂文森的诗,还有休斯赠给她的两本作家写园艺的文集和书信集。时间推移,春天准时的到来,玫瑰确凿的存在,自然的无情与客观,都带给她安慰。同年冬天,她订购了二十五颗风信子。去年秋天,她种下了八百颗。在外界看来,这似乎象征着某种缓慢的愈合。但李翊云不这么认为。
“我认为生活是不可知的,”她说。“人是不可知的。”
“那你如何与这个事实和解(make peace)呢?”
“我不‘和解’。有意思的是,我从没用过‘与某事和解’这个表达,因为我不会这样做。我拒绝和解,但我接受现实。我认为这是两件不同的事。我听过一个说法——‘全然接受’(radical acceptance)。对我来说,它意味着,‘我接受事情会永远这样下去。’”
她继续道,“人们总是在寻找简单的出路。我不喜欢那样。我不会那么轻易地放过我自己,我也不会轻易地放过别人!我抗拒任何陈词滥调。安宁(peace)对我来说就是陈词滥调。”
李翊云,2018年,新泽西州普林斯顿,摄影师:Denise Applewhite
距离2017年的冬天已过去六年,眼前的李翊云短发中透出几缕银丝。她裹在一件及膝的深灰茧形毛线开衫里,结实的运动鞋不太牢靠地踩在办公桌底层抽屉的把手上,桌前的墙上装饰着家人的照片。她看起来很平静,甚至是安宁,但你能感觉到她内心的宇宙,那里充满了独属于她的记忆、思绪和感受,它们在一道看不见的边界背后涌动,你几乎能感觉到那道边界。为了捍卫这道边界,她用自己选择的语言、自己认可的方式书写了自己的人生。就像她早年研究的免疫细胞一样,她通过一次次拒绝“非我”的入侵,完成了对自我的重塑。
她说:“定义一个人的不应是他人和世界对她做了什么,而是她对自己做了什么。”   
0 notes
readonline · 4 months
Link
0 notes
readonline · 4 months
Link
0 notes
readonline · 4 months
Link
0 notes