对话实在智能孙林君：从SaaS淘汰赛和AI卡位赛中拿到双赢

一家RPA企业走向Agent的“蜕变”史

作者|思航

出品|产业家

“Adept做的这件事，我感觉你们能做得更好”。

Adept是海外一家成立仅一年时间估值便突破10亿美元的AI Agent（智能体）独角兽公司，甚至在此期间，还获得了英伟达、微软和包括特斯拉自动驾驶负责人Andrej Karpathy在内的行业大佬，以及不少知名风投的站台。这家公司的使命便是，“创建能够像人类一样使用各种电脑软件完成工作的AI智能体”。

接到西湖大学科学家蓝振忠博士这通电话后，早已对Agent有所感知的孙林君发现，这与自己正在做的事不谋而合。

在大数据智能领域有着近20年经验的孙林君，先后任职于摩托罗拉和阿里巴巴的资深算法专家。2018年，就在大模型进入顶峰期的前几年，孙林君离开阿里，创立了实在智能。

彼时他所瞄准的赛道是数字员工，只不过在当时，数字员工还停留在RPA阶段，在孙林君看来，“Agent将会是是数字员工的终极形式”。

RPA做了一年后，孙林君便意识到RPA自身带有局限性，于是在2019年开始尝试RPA+AI融合的方式，即IPA来突破局限性，但这种融合终归还是“做加法”，想要彻底突破局限性，需要重构底层架构。

直到ChatGPT的发布，让这个有着阿里系和谷歌系的创始团队嗅到了属于他们的机会，用孙林君的原话说，“数字员工的终极愿景可能很快就要到来了”。

半年时间，这个有着强AI基因的团队便将行业首款Agent形式的产品发布出来。与此同时，实在智能也进入到关键一年。2023年，是实在智能完成转型的一年，也是国内Agent元年。

从比尔盖茨到李飞飞、吴恩达，无一不表达出对AI Agent的极大兴趣，甚至比尔盖茨还公开发文表示Agent智能体对未来工作的颠覆作用。据统计，过去一年，硅谷至少有100个项目有关Agent商业化，而国内也有700多亿人民币进入到Agent赛道。

而对于踩中风口的实在智能而言，Agent是他们终于等到的机会，也是实现自我突破的关键分水岭。

一、蜕变：看见数字员工的终极愿景

自大模型出现以后，一个最常听到的说法便是，大模型引领新的工业革命，甚至夸张一点，还有的把大模型比做蒸汽机。在科技圈内，一度出现两派观点，一方认为大模型早晚会取代人类工作；另一方认为大模型只能代替人类完成简单、重复性工作。

但如果严谨地说，大模型本身无法代替任何人类工作。由于其本身并不存在于真实世界中，因此大模型无异于“缸中之脑”，即它的逻辑链不能触及物理世界，永远无法与现实产生连接。

真正能代替人类工作的，并非大模型本身；而是让大模型长出“手和脚”的智能体Agent。

一个在财务场景真实发生的例子是，企业下载资金流水，需要登录到银行，选中对应时期，查询再进行下载。其实这样一套简单、重复性的操作完全可以用机器完成。

在过去，它依靠机器人半自动化的方式，但在这背后软件交付工程师需要将这一套流程的代码打出来，或者企业内部用拖拉拽的方式在独立的机器人上才能够完成；而如今在智能体上，一句自然语言口令便可以轻松搞定。

这种演进，也正是实在智能从过去RPA走向如今Agent的发展路线。

RPA做了一年后，孙林君发现RPA本身存在很强的局限性。局限之一在于有些工作纯通过RPA完不成，比如文字识别，这其中就涉及到通过自然语言处理来提取摘要或找关键词；再比如，在控制能力上，RPA的底层操作系统已经很难满足复杂环境要求，对此，实在智能的做法是将AI和计算机视觉（CV）融合进来。

自此，实在智能也正式从RPA阶段跨越至RPA+AI，即IPA阶段。在孙林君看来，“推出IPA的同时，也意味着实在智能从跟随走向引领”。

具体来看，从2022年末，实在智能发布智能屏幕语义理解技术ISSUT；到2023年中旬，发布自研垂直“塔斯（TARS）大语言模型”；紧接着，国内首个基于大模型的Agent智能体产品“实在Agent——你说PC做”在实在智能诞生。2023年末，实在智能获近2亿元C轮融资，与此同时，也标志着Agent的商业化。

从上述一系列产品发布的节点可以看出，从ISSUT到TARS，再到Agent发布，实际上，实在智能在过去一年时间里已然完成了对Agent底层架构的颠覆。“从RPA过渡到Agent，底层架构的确发生了深刻的变化”，孙林君告诉产业家。

对此，实在智能还做了一个形象生动的比喻，在Agent智能体当中，TARS大模型就相当于“脑”，而ISSUT则相当于“眼”，IPA则是“手和脚”。

而在问到“为什么选择自研大模型”的时候，孙林君给出的答案是，“因为市面上的模型无法满足实在智能的需求”。从RPA本身性质出发，它需要与各种软件进行打通，比如实在智能目前已经与市面上1000多款常见软件进行打通。

而对此，实在智能并非选择用API接口的方式，而是通过ISSUT这个“眼睛”的作用，可以自动识别任何软件的UI界面，再利用大模型的自主学习来完成一系列操作。

在这过程中，它所需要的是，底层的大模型要具备多模态能力。然而，在2023年8月，Agent发布之际，国内还并没有任何一家大模型有类似能力。

可以说，从底层架构的重塑，到自研大模型，种种信号仿佛都在表明，实在智能对AI有着极强的“掌控力”。一份成绩单同样也是最好的证明——过去六年时间里，实在智能已获超70项实授发明专利，其中就包括CV、ISSUT等等。

二、跃进：智能体的想象力有多大？

数据飞轮，是被大模型带火的一个词。

要知道大模型的三大要素便是算力、算法和数据。几乎所有大模型企业都非常看重数据资产。

一个最明显的例子便是，OpenAI于2024上半年宣布向用户免费提供GPT-4和4o模型，与此同时，也标注了通过用户对话数据训练模型，用户可以自行选择是否允许。

除了OpenAI，包括火山引擎在内的不少大模型厂商也都在提数据飞轮。而在大模型时代下，数据带给企业的作用就更加明显了。

对于为B端场景提供服务的企业而言，数据飞轮会帮助企业更快地“转起来”。比如在特定的金融、客服等场景下，在数据飞轮的作用下，流程操作会变得更加标准化，从而反哺给Agent企业。

图注：AWS数据飞轮，来源：AWS

“在软件上积累的大量数据都会让任务完成的更丝滑、顺畅。如果把世界想象成一个元宇宙，那么未来连键盘和鼠标都可能消失，就像星际穿越里的塔斯，只需要和他讲话可以完成很多的事情。”

这是孙林君赋予数字员工的终极愿景，而谈到这，它也是实在智能自研大模型TARS（塔斯）的命名由来。

“目前，智能体离这样的畅想还有一段距离。”孙林君坦率地讲到。然而，从星际穿越跳回到现实世界，智能体的想象力还能有多大？

年初，颠覆人机交互模式的AI电脑来了。2024年3月，英特尔的AI PC高调亮相，而AI PC所在的工作正是前文中提到的代替人类工作，对此，比尔盖茨也在公开信中表达了对AI PC小助手的美好畅想。

让AI PC真正照进现实的正是这家从RPA蜕变过来的实在智能。而在英特尔的发布会上，这款AI PC还是面向大量企业客户，尤其是政企客户。

值得一提的是，实在智能在政企客户也有长期积累。在其服务的超2000家客户中，有上百家都是国央企及世界500强企业。

另外，在最近刚落幕的世界人工智能大会上，实在智能还参与了“昇腾原生开发合作签约仪式”，基于华为昇腾开发，从而帮助更好地服务政企客户。

而现如今，实在智能的想象力则从B端走到了C端。

按常理讲，在B端深耕多年贸然转向to C，无论是从产品形态、组织架构，还管理理念和商业模式，思维上都有巨大的差异。然而不同的是，实在智能的使命是数字员工，从现阶段讲就是为员工打造一个“数字分身”。那么，实际上，实在智能的面向人群则是KP（Key Person），本质上依旧是C端。

而从产品的逻辑来讲，B端产品与C端产品最大的不同则在于，后者更注重用户体验。以实在智能为例，很多人不会写代码，需要上网查询。而对于实在智能而言，它能感知到的是大量用户的需求，因此这也很容易演变为商业化产品。

不仅如此，“数字员工”的愿景甚至从国内传到了世界各地。2024年是在实在智能完成Agent转型的关键一年，与此同时，数字员工也正在走向日本、新加坡、东南亚、北美以及欧洲等地。

从星际穿越到服务政企客户，从C端的想象力再到海外客户的认可，可以看到实在智能正在将数字员工的终极远景照进现实。也许，“人人都可以有属于自己的Agent”，就在不远的将来。

三、曙光：如何在SaaS淘汰赛和AI卡位赛中，实现双赢？

从2023年Agent元年，到2024年Agent商业化元年，近两年在这条赛道上发力的有互联网大厂，有大模型公司，有初创企业，也有从其他赛道上转行而来的企业。

似乎对于Agent这件事，大家的理解都各不相同。对于既有算力也有数据的云厂商而言，他们做Agent的思路是基于大模型构建智能体，相当于大模型的“子集”，让他扮演你想要的角色。

第二种则是像用友、金蝶等服务商为企业构建的企业级AI应用平台；第三种则是像钉钉、飞书这种将大模型能力集成在本身的协同办公软件上，而上述这些都可以称之为Agent智能体。

然而，对实在智能而言，Agent智能体的定义还有些不一样。正如前文所说，实在智能的使命在于打造数字员工，因此其所打造的Agent也是针对特定场景的智能体，比如在政务、银行、电商、保险、运营商等等场景，打造更为标准化的智能体。

与过去RPA相同的点在于，都是基于特定场景下的服务，只是用自然语言口令更为便捷；而不同点在于，基于底层架构上的重构，Agent智能体需要企业与客户共同构建RAG，从而保证更个性化地满足客户需求。

实际上，近两年，在Agent这条赛道上，有不少企业之前都是和实在智能并肩作战的RPA企业，比如壹沓科技；再比如从弘玑RPA离职创业的澜码科技，他们都带着些许的Agent基因。

那么，一个问题是，如果Agent是RPA的终极方向，那么这条赛道上，未来又将会呈现怎样的竞争格局？

如果站在Agent这条让AI创业者前仆后继想要涌入的赛道上而言，基于大家对于Agent的不同理解，短期来看未必会呈现出“竞争”关系，而是“强强联手”。

比如年初，实在智能就与同样是作为“AI超级助理”的钉钉达成合作，目前实在智能Agent应用已上架钉钉AI助理市场。

但与此同时，实在智能又不仅仅是新生代Agent企业，它更是从RPA进化而来的企业。

从这一角度来看，实在智能可以说既属于SaaS企业，又属于新时代的AI企业。然而，同样摆在实在智能面前的还有双重竞争，一边是SaaS企业的末位淘汰赛，另一边是AI公司的卡位赛。

有人说，大模型加速了国内数字化的转型，所以对于SaaS企业而言，AI是机会，但同时它也是挑战。

机会在于，用AI将SaaS重构一遍，势必会加速国内数字化转型，也会加速企业的数字化进程，而过去“大家对SaaS付费意愿不强”类似的问题也将不复存在；

但挑战也正在于SaaS企业自身的基因，是在SaaS的基础上加AI，还是用AI用重构一遍，将成为新时代背景下，SaaS企业的“末位淘汰赛”。

那么，AI对SaaS企业究竟意味着什么？在孙林君看来，“如果对于AI有一定掌控力或者有积累的企业，那么这个时代则正是构建护城河的最佳时机。”

与此同时，在AI这个新赛道，还会出现更多的竞争者。可以说，对于国内已经发展了十年的SaaS行业而言，目前已经有不少企业走向IPO，行业know-how的积淀也足够深，如果在此基础上加上AI能力，则足以构建起属于SaaS企业自身的护城河。

从目前的市场格局看，大部分已上市的SaaS企业和SaaS独角兽都已经在做SaaS+AI这件事，只是目前都处于试水阶段，还未有一家有显露出行业壁垒，现在能看到的都是“想象力”。

但对于这个在Agent赛道上屡屡先发制人的实在智能而言，从创始团队的AI基因，到其六年来所积累的行业经验，都在散发着一种独有的强者风范。

对话实在智能孙林君：从SaaS淘汰赛和AI卡位赛中拿到双赢

千锋教育“大庆”1024程序员节，盘点80、90、00三代码农众生相

不务正业干环保，是康佳改变“中年油腻”的救命稻草吗？

短租民宿哪家强？四大主流短租APP深度测评

过期汉堡、黑心毛巾，2020年315晚会曝光全名单在此！

阿里与腾讯的泛娱乐逻辑待考：前者重社交，后者看分发

今天口罩去哪买？每天本人无偿整理应急物资渠道，亲测有效