首页资讯

对话Genspark、Lovart、Simular.AI创始人:OpenAI入场是大利好,ARR绝非唯一重要的事|硅谷活动

时间:2025-07-27 15:33 作者:上江君

对话Genspark、Lovart、Simular.AI创始人:OpenAI入场是大利好,ARR绝非唯一重要的事|硅谷活动


作者 | PRO
邮箱 | pro@pingwest.com

The Agent Takeover is Here!

2025年7月17日,在GenAI Assembling 第五期硅谷Meetup上,最近火热的明星AI Agent 公司Genspark、Lovart、和Simular.ai的创始人,以及新一代基础设施公司SambaNova的Agent技术负责人,一起讨论了他们在今天AI Agent发展第一线所观察和感受到的一切。


以下为这场对话的实录。

Thomas Luo: 大家好,我是GenAI Assembling的创始人,也是本次panel的主持人。首先请各位简单介绍下自己。

Pushkar:大家好,我来自SambaNova Systems。我们提供从云端一直到自研芯片的一整套解决方案,并且为所有开源的LLM(大型语言模型)构建了完整的基础设施。

Ang Li: 大家好,我是Simular的联合创始人兼CEO。Simular主打自治计算机(autonomous computer)的理念,我们正在构建一款通用型agent(通用智能体),可以控制您的电脑(鼠标和键盘)来替您执行任务。

Elena Leung: 大家好,我是Elena Leung,Lovart的联合创始人兼COO。Lovart是首款设计领域的agent,用于创建社交媒体帖子、海报、视频、3D等内容。我们几个月前推出了测试版。很高兴来到这里。

Lenjoy Lin: 大家好,我是Lenjoy Lin,Genspark的联合创始人。


OpenAI来了,Agent初创公司们怕不怕它

Thomas Luo:我想先从OpenAI的agent(智能体)入手来提问,开启今天的讨论。OpenAI最近推出了自己的agent。请在座每位简要评论一下OpenAI的agent战略,以及这对你们自身的产品设计战略有何影响。这件事意味着什么?意义重大还是无足轻重?

Lenjoy Lin我认为OpenAI的模型非常出色。他们推出agent这一举动释放了一个强烈信号:智能体在应用层非常重要,而且一个更大的市场空间正在打开。未来会有越来越多人开发智能体,这很正常。想一想:如果我们要解决更大的问题,就需要更多智能体来帮助人们完成更有意义的事情。所以我想说,不要过于关注当前眼前的一切。展望未来,我们将能够完成许多我们的前辈曾经想做却做不到的事情。
从战略角度看,我们与很多伙伴有合作,OpenAI的模型也是我们集成的模型之一。业务发展很重要。我希望OpenAI能构建出能够真正赋能开发者、用于实际应用的东西。最终,一切归结为消费者的选择。举例来说,在Genspark,我们只是想让每个人的工作变得更出色。我认为在任何特定领域,每个人都可以为用户做出贡献。

Elena Leung我觉得这是好事,因为它有助于向市场科普什么是智能体。对我们Lovart来说,我们是设计领域的垂直智能体,我反而有点兴奋,因为在这个细分领域我们不必直接面对与OpenAI的竞争。这给了我们更多时间来打磨产品。

Ang Li首先,OpenAI的agent可以说是又一个“元”平台。当这种“meta”平台出现时,就预示着竞争的到来。今天的局面就是这种反映。我一直在想的另一点是,人类本身就是一个agent。如果考虑最终形态,每家公司最终都会走向同一个方向,因为大家都在追求AGI(通用人工智能)。作为一家公司,我必须考虑这一点——每个人类其实都是一个AGI系统。最终,我们可能会拥有十亿甚至百亿个完全相同的AI系统。
那么每家公司还能靠什么来区分自己呢?就像我们人类一样,每个人都有不同的专长。最终,AI也将如此。这个世界总是在递归地前进。所以即使大家最后都在做同样的事,他们依然会有所不同,朝着不同方向发展。竞争并不是我们需要过度担忧的事情。我们应该高兴有更多公司在为同一个目标努力。

Pushkar Nandkar我个人并不直接构建智能体,但我感觉随着我们迈向一个万物皆智能体的世界,这对我们是好事,因为我们为这种生态提供推理服务。人人都在使用智能体意味着LLM(大型语言模型)的使用量会大增,从而需要更高的能效。所以这是一个积极的发展,它将推动我们在智能体驱动的世界中探索如何实现更高的能效。

ThomasLuo确认一下,SambaNova目前主要支持的是开源模型,而非闭源模型,对吗?

Pushkar Nandkar是的,没错。


从"Vibe Working"到"人即 Agent"

Thomas Luo:好的,谢谢。接下来我们来说说“vibe working ”。现在听起来这词有点流行,是不是只是炒作?请用20到30秒解释一下,为什么vibe working真正重要。

Lenjoy Lin这意味着能极大提升你的工作效率,让你的生活更美好。vibe工作不只是工作本身;它是一种积极的反馈循环。你会看到自己的工作效率和质量提高,生活状态也随之改善,进一步提升工作效率。关键在于如何让它成为一个有用的工具,在实际工作中成为你真正的伙伴。(不同的工作有不同的流程,这也是我们正在做一个大项目来适应这些差异的原因。)

Thomas Luo: 现在是2025年。1925年——一百年前——美国开始推行八小时工作制。如今一百年过去了,你对未来的工作有什么预测或期望?或许不用说到2125年那样遥远,就到2035年吧,在“vibe工作”模式或智能体辅助下,人们每天将工作多少小时?

Lenjoy Lin: 我认为这会分阶段发生。比如大约30年前我们每周工作六天,后来改为五天。以后可能会是四天,再往后是三天。我大胆猜测,也许五年内我们就能实现每周三天工作制。

再往后,工作的本质都会发生变化。公司的架构和商业模式都会改变,因为目前这些是建立在固定工作时间这一制度上的。当AI智能体能完成大量工作时,供应链会变得不同,我们销售产品的方式会不同,人们互动的方式也会不同 —— 也许那时候就是智能体和智能体在对话了。这将带来完全不同的公司结构。所以我的预测是,我们最终会迎来每周三天工作制,而再之后,工作和生活的界限可能就不那么清晰了。

Thomas Luo: Elena,Lovart能够把一个简短的提示词变成完整的设计作品。我自己经常用,真的很有意思。但有件事让我很好奇:在不经过大量反复询问的情况下,你们是如何捕捉客户的想法和风格的?用其他工具时,我们经常需要不断细化提示词。但在Lovart上,一个非常简单的提示就能得到一个完善的结果。这个工作流程背后的秘诀或策略是什么?


Elena Leung: 感谢你使用Lovart!在Lovart背后,我们有一个主导的agent负责调度,还有多个agent负责不同类型的任务。我们采用多智能体系统来拆解复杂任务。举例来说,如果你想生成一套品牌视觉形象,我们会用不同智能体把它拆解成更小的任务,比如制定品牌指南或配色方案。

另外,系统会从用户的行为中学习。我们希望智能体能够更好地理解用户需求。当你与这个设计智能体交互时,它会记住你对风格、颜色、布局的偏好,最终能够预测你想要什么。我们在智能体中融入了大量的设计知识,因此它们可以像真正的设计师那样思考,理解你的要求并完成相应作品。

Thomas Luo: Lovart团队里有多少设计师?

Elena Leung: 在我们的创始团队中,我认为所有产品经理都必须是设计师,因为我们是在为设计师打造智能体。我们有5位设计师。

Thomas Luo: Ang,现在轮到你阐释一下“human as an agent”(人即智能体)意味着什么,以及你们的智能体的工作流程与Anthropic那种用于操作计算机的agent有何不同。我记得我们首次讨论你们的方法是在去年的9月底,那时Anthropic的计算机使用模型还没发布。现在我们看到OpenAI的agent也运行在虚拟环境中,看起来几乎一样,那么区别在哪里呢?

Ang Li: 好。首先,从技术角度讲,我们与他们不同。我想先声明,虚拟浏览器并非正确的道路。各种方法我们都试过,包括浏览器。浏览器的好处是有大量现成支持,比如Playwright和Puppeteer这样的库。不过这反而让通用的计算机操作更难了,因为并没有类似的标准库来控制鼠标。然而,浏览器有一层“玻璃天花板”——有些操作在浏览器里根本无法实现。许多传统行业的应用需要的不只是浏览器。

虚拟浏览器的另一个问题是,一家公司开发的agent往往无法访问竞争对手的服务。竞争是人之常情,这种情况可能永远存在。这就是个问题,所以一些客户才会来找我们。他们尝试过基于浏览器的方案,但由于太容易被检测为机器人,任务无法完成。最终他们采用了我们的方案——让一个运行在他们自己电脑上的agent直接控制电脑。从外观上看,它和人操作没区别,没办法识别它是智能体。在这种情况下,智能体就真正和人一样了——这其实也是我们对AGI(通用人工智能)的定义:你无法区分人和智能体。

从技术角度来说还有一点:我们的方法从研究到工程再到产品,都很朴素——先让人来完成任务,然后看看能否用AI自动化人的操作。我们用LLM(大型语言模型)和各种神经网络来自动化整个人工工作流程,这就变成了对人类行为的模拟。在我们的技术管线中,每个组件都是可替换的:你可以用人来替换某个AI组件,或者用AI agent替换某个人工环节。AI正越来越接近成为我们世界中人类的平等伙伴,你可以即插即用地部署它们,从而优化运营成本。


Context、延迟与算力成本的三重博弈

Thomas Luo: 谈到智能体,人们想到的一个词就是“上下文窗口(context window)”。使用更多上下文意味着需要更多算力,会使系统变慢。那么从基础设施角度看,目前构建一个流畅高效的AI智能体时,最大的拖累因素是什么?是超大的模型规模,还是内存限制?

Pushkar Nandkar: 你问是什么让智能体变慢。这其中有很多方面的原因。智能体并非单一实体;它在执行多重计算,其中很多是在CPU上完成的。就基础设施而言,多个客户的多个智能体会调用同一个云服务,这就引入了排队延迟等问题。你还需要对这些请求进行负载均衡,并有一个高效的路由。

接着,当涉及到在芯片上进行推理时,你需要使用批处理将请求集中起来一起处理。所有这些阶段都会带来延迟,影响到“首个token输出时间”(time-to-first-token),也就是用户或智能体所感受到的响应延迟。这正是Dataflow(数据流)架构发挥作用的地方。在SambaNova,我们专注于确保为所有客户提供尽可能快的每秒生成token数量(tokens-per-second)。

Thomas Luo: 我们再谈谈效率与用户体验的取舍。如果要在三件事之间平衡,你会如何排序它们的重要性:

将任务准确率提高5%;将任务完成速度提高5倍;和让用户使用智能体时感到惊艳并由衷喊出“哇”。

Ang Li: 我们公司是一家智能体公司,我们的文化可以用一个词概括:“agency”(自主智能代理)。Agency的定义是一个独立的系统,能够通过与环境交互和学习,像人类一样完成任务。因此按照我们的文化,提高任务准确率5%是最重要的,因为这关系到智能体独立完成任务的能力。如果这不是最优先,那这个智能体更像是一个协作助手(copilot)或助理。第二重要的是加快速度,因为此时仍然有人在流程中。第三是让人惊叹的“哇”体验——不过有时为了市场营销我们可能会把这一点临时放在前面。

Lenjoy Lin: 这让我想起之前在公司花很多时间定义绩效指标。(如果把智能体当作你的队友,用类似于绩效评估的框架来看待也未尝不可:比如影响力、能力和软技能。完成任务就像对初级工程师的期望,而更资深的人应当能端到端推动新的项目。对智能体也是一样。)

任务完成当然重要,但准确性、速度或体验三者谁优先取决于任务本身。比如涉及合规或安全的任务,准确性就是唯一重要的。而对于错误容忍度高的项目来说,用户体验可能更为重要——因为只要有一方面出彩,整体效果就会出彩。

Elena Leung: 我认为这三方面都很重要。但如果一定要排序,我会把让用户惊艳的体验放在第一位,因为我们是设计类智能体,应该像一个能激发你灵感的创意伙伴。(当你给出一个简单的提示而它产出的结果非常惊艳时,会给予你更多灵感。)第二是提高速度,我们需要帮助设计师和创作者从繁杂重复的任务中解放出来,激发他们的创造力。最后才是准确性。


Pushkar Nandkar: 从SambaNova的视角,在过去七年里我们经历了几个阶段。最初训练模型时,准确率是最优先的。现在进入推理服务阶段,我们提供的模型已经相当准确。所以当模型足够准确后,关注点就转向了速度——如何在芯片上优化映射以提升速度。我们采用张量并行(tensor parallelism)、数据并行(data parallelism)和流水线并行(pipeline parallelism)等策略来提高速度。对我们来说,“哇”的因素在于我们能够以出色的准确率、惊人的速度提供服务,同时还能保持极高的能效。

Thomas Luo: 对于一家早期智能体创业公司来说,成本依然关键。每月的云服务账单达到什么程度时,为模型增加额外上下文对年轻的初创公司来说就太昂贵了?

Ang Li: 我的看法是:如果需要更多资金,我们就去融资。这就是风投的玩法——关键在于如何使用资金。只在需要的时候融资。如果我们能证明有途径训练出一个颠覆性的智能体模型,我们就可以先做出原型,然后再融更多钱全力投入那个方向。所以我的回答是,没有上限。

Elena Leung: 我同意。我认为与其关注账单金额,不如看你花的钱是不是值得。对我们来说,我们在使用foundation model(基础模型)的 API 上花费了很多钱,现在正致力于技术方案来降低这部分成本。我相信未来基础设施成本会下降。因此我们专注于为智能体打造合理的工作流程。

Lenjoy Lin: 是的,现金流很重要。不管资金来自VC还是会员收入都无所谓,如果现金流长期大幅为负,我觉得是很危险的。

Thomas Luo: Pushkar,就你的观察来看,那些垂直领域的智能体公司担心什么?SambaNova如何帮助它们以更具成本效益的方式运行基础设施?

Pushkar Nandkar: 随着越来越多智能体公司出现,成本重心正从人力转向基础设施。我们的客户始终关心如何降低成本,所以我们与他们紧密合作。如果他们有自有的模型或checkpoint(检查点),我们会将其接入并微调,确保我们以非常高的能效为其服务。

凭借我们的多层次内存结构,我们有足够空间为同一模型保存成千上万的checkpoint,并可以在HBM(高带宽内存)和DDR(双倍数据速率内存)之间切换。(由于我们的切换延迟极低,客户并不会感觉首个token输出变慢。)我们通过让多位客户共享同一台机器来优化成本和盈利,客户则能以更低成本获得更高的每秒token生成速率。(通过与客户合作找到合适的价格点,我们创造了双赢的协同效应。)

重新定义增长:Agent产品的成功,不靠 ARR 靠什么?

Thomas Luo: 对于一家正在成长的智能体初创公司来说,追踪什么指标更能体现健康增长?是ARR(年度经常性收入),还是传统的日活/月活用户数(DAU/MAU)?在硅谷,许多人都在谈ARR,有时创始人甚至会互相购买服务来把数字做漂亮以获得融资。哪个指标更重要?

Ang Li: 我们公司是一家技术导向公司,所以内部并不怎么跟踪收入。我们关注的是“明天”,什么意思呢?就是关注任务成功率。成功率是我们的头号指标。我们每天都会跟踪当天的成功率,并着眼于如何明天做得更好。我们有一张图表描绘智能体能力的成长轨迹。就像人一样,你希望明天成为比今天更好的自己;我们也希望智能体明天比今天更出色。这不在于某一个静态数字,而在于曲线的上升势头。只要明天比今天哪怕好一点,就算成功。

Lenjoy Lin: 对我来说,活跃用户意味着人们在用我们的产品,并且激励我们做得更好。这让我们感觉被认可,从而能创造更多。既然我们还处于早期阶段,我认为不需要过分拘泥于某一个数字。我们希望保持大胆,专注于广泛的创新,去创造真正的价值,钱自然会跟上来。真正驱动我们的是用户体验。

Elena Leung: 对我们来说,有两件事比ARR或MAU更重要。第一是“revision”(用户对产品的依赖程度)。这个指标衡量用户有多依赖你的产品。我们不希望我们的智能体只是个玩具,用户只拿它来生成几张搞笑图片而已;我们希望它能真正帮助用户提高效率。第二是基准测试。我们把Lovart的所有输出都拿来跑模型评测,以确保我们的交付质量是市场最优的。如果把这两点做好,ARR自然就上去了。还有一个重要指标是使用Lovart的创作者和设计师的数量——目前那条增长曲线呈现出指数级上升。

2026年,AI Agent主导的世界会变成啥样?

Thomas Luo: 现在是2025年7月。一年后的2026年7月,你希望在《经济学人》或《纽约时报》等大众媒体上看到关于AI智能体的什么标题?

Elena Leung: 到2026年7月,我觉得AGI(通用人工智能)或许已经出现了。也许我们都将去休一个长达一年的长假呢!AI技术的进步以及其上的产品将让全世界惊叹。来自不同垂直领域的我们这些创始人会为各行各业打造出运转模式。所以,那时的新闻标题会描绘这样一个世界:不同的智能体从各个角度赋能整个社会和各种产业。对于Lovart来说,标题可能会是:“人人都成了创意艺术家”。

Thomas Luo: 不会是“Lovart 摧毁了广告代理公司”这样的标题吗?

Elena Leung: 不,不。我认为我们的产品会帮助他们激发创意。

Ang Li:我想到的标题是:“AI已能以人类水准使用计算机。”因为有据可循:2024年1月,OS-World基准上的最佳成功率只有5%。2024年10月我们发布了首个开源智能体,成功率达到20%。一周后Anthropic发布了他们的智能体,达到15%。今年4月,我们发布了第二代智能体,达到了41.4%。而在人类在该基准上的水平是72%。照这个趋势,再过一年AI就能达到人类水准。在这场竞赛中,主要的玩家是OpenAI,可能还有Google DeepMind,以及我们Simular。

Lenjoy Lin: 我会准备两个版本的标题。第一个常规版本类似:“AI队友来了” —— 会伴随一些人类与AI协作成功的故事。第二个更劲爆的版本是,当更多AI智能体融入人们生活后,可能会出现关于“壳中幽灵成真”的新闻。

Pushkar Nandkar: 照现在技术的发展趋势,我们看到硬件和软件的融合更加紧密。一年内,会有更多初创公司专注于“芯片上的智能体”。我想现在已经有一些创业公司在研究这些想法,到时候我们会了解更多。这是硬件基础设施发展的一个方向。另一个是在手表等可穿戴设备上出现“微型智能体” —— 也就是在芯片上运行的非常专用的智能体。


Thomas Luo: 最后一个问题。请用一句话给当前正投身智能体开发的人一些建议。

Pushkar Nandkar: 天空才是极限(The sky is the limit)。你越富有创造力,就能做出越多产品、赚到越多钱。外面有很多工具可用,尽管去尝试吧。

Ang Li: 我想说:用Simular吧。我们有位客户用Simular构建公司,刚刚在种子轮融了500万美元。我期待会有另外十家这样的公司用Simular再各融到500万。

Elena Leung: 简而言之,速度就是一切。

Lenjoy Lin: 我有两点建议。首先,在基础架构层面,要用AI的思维重新设计架构——过去的编程范式会被改变。其次,我鼓励大家在日常工作和生活中多尝试AI产品。我希望Genspark能成为你的选择之一,帮助你实现更有意义的工作。

Elena Leung: (受到Ang的启发,我也想再补充一点。)你不需要再雇设计师或找设计公司了,Lovart就能帮到你。

Thomas Luo: 好的。感谢大家。非常精彩的讨论。

点个爱心,再走 吧

Top

1、“容嬷嬷”年轻时竟是校花?本以为是开玩笑,看到照片后被惊艳了

2、山姆·奥特曼:用户与ChatGPT的对话目前不具有法律保密性,山姆有绝招

3、美股正经历前所未有的变化,美股历程

小编推荐

当前文章:http://www.share.cycgw.cn/LRU/detail/pncpto.html

相关阅读

网友评论

我要评论

发表
取消

上江君