2023年,名副其实的AI年。
年初,ChatGPT风靡全球,只用两个月便收割一亿月活用户。随后,大模型这种过去鲜少有人踏足的“无人区”,成为全球众多科技大佬的主攻方向。
在国内,百川智能、月之暗面、零一万物、光年之外等大佬光环加身的创企在半年内接连成立。
而在国外,Anthropic、Runway、LangChain等公司更是接连拿下知名风投的巨额投资。接下来,各行各业开始探索行业应用,关注AI在产业内的落地。
但在表面火热背后,大模型也带来不少疑惑。
首先在产业端,即便探索AI原生应用成为行业共识,但什么才是真正的AI Native产品,成为最新的未解命题。
而在生态圈内,当大模型可以帮助程序员写代码,GPTs能让普通人构建自己的智能体,更多人也开始思考,AI时代究竟需要什么样的人才。
这些问题,和大模型时代的每个个体都息息相关。
于是,在2023年底这一特殊时刻,百度搜索联合清华大学副教授眭亚楠、Zilliz 合伙人兼产品总监郭人通、 前36氪内容总监/「风口来了」主理人石亚琼 、BV百度风投 投资副总裁温永腾、百度搜索平台首席架构师辜斯缪、百度搜索生态负责人/灵境矩阵平台负责人张瑞星,在《连麦》栏目中发起《2023,问AI未来》系列直播,探讨AI人才、AI产品中的关键议题。
在AI人才议题中,石亚琼和郭人通、辜斯缪一起重点讨论大模型对开发者的影响和机遇。
郭人通认为,产品开发的主要工作围绕产品定位、产品设计、产品实现展开。目前来看,聚焦产品实现能力的开发者可能会受到较大冲击,但如果研发的能力在产品定位和产品设计上,还会保持优势。
谈及大模型时代的产品经理应该如何工作,辜斯缪认为,产品经理需具备三个关键要素,第一是对于需求的理解,第二是思维模式,第三是执行能力。在大模型的浪潮下,产品经理对于需求的理解是不会变的,但是思维模式要变化。
比如,原先很多产品设计建立在交互设计界面上的。AI时代下,模式改变了,产品需要考虑数据怎么形成反馈。所以,产品经理要解决这个问题,就要去升级思维模式。关于执行能力,产品经理需要拥抱这些AI能力和工具链,快速落地产品。
在AI产品议题中,Agent的开发应用、人形机器人、具身智能等产品是被关注的重点。
对此,清华大学副教授眭亚楠认为,人形机器人是今年非常活跃的领域。他觉得,大模型的进步推动机器人更进一步。
而针对如今备受瞩目的Agent/智能体领域,百度「灵境矩阵」平台负责人张瑞星觉得,好的Agent开发平台,首先要以领先的大模型能力为基础,第二要持续帮助开发者降低成本,第三是为开发者提供流量,完成商业闭环。而灵境矩阵作为基于百度文心大模型的智能体平台,已经跑通这条路径,产生出不少Showcase。
最后,作为长期关注AI的投资人,温永腾回顾了自己看过AI产品类型,并表示比较关注「AI如何改变分发」——这其中既包括商品的分发,也包括信息的分发和应用的分发。他认为,2024年创造新型分发形式的产品会越来越多。
以下是直播内容节选,请读者参考(完整内容请关注「百度灵境矩阵平台」公众号):
未来AI人才:人人都是开发者?
石亚琼:未来已来,AI时代给开发者的工作带来哪些改变?
辜斯缪:这两年,我们整体上的一个大判断是,AI对搜索会产生巨大的变革。因为搜索的本质,就是帮人解决问题。到现在,大家觉得这个趋势是确定的,没有任何分歧。具体到对实际研发工作的影响,可以拿算法工程师来说,一种叫研发AI的人,一种叫用AI研发的人。以前,研发AI的人主要是做模型,现在已经不需要再研发模型了,因为再怎么研究也比不过一个成熟的大模型。用AI来开发的人,很多都可以借助Copilot来交互,完成代码工作、查询文档等工作。
郭人通:作为创业型公司,尤其是做国际化生意的创业型公司,我这边也有比较深刻的感受。AI对于我们来说,解决的最大一个问题就是信息产生和信息传递效率。举个例子,让研发同学用文档在用户面前阐述清楚技术实现,是一件非常困难的事。借助AGI工具后,大家可以很快完成这样的一些任务。
不同于传统的业务,我们主要做标准化SaaS产品。面对大体量的用户,我们需要借助生成式AI工具,去高效追踪关键用户信息。AI大模型的这种能力,对于我们来说非常重要。
石亚琼:未来的开发者到底会是什么样子?一个观点认为,AI时代的开发者生存空间变小了。另一个观点认为,AI的时代人人都是开发者。
郭人通:产品开发主要做几件事,产品定位、产品设计、产品实现。因为现在的这些AGI工具,主要还是生产力工具,可以帮研发写一些代码,而且写得更快。随着自动化程度提高,聚焦产品实现能力的开发者可能会受到比较大的冲击。如果说研发的能力在产品定位和产品设计,构建一个从用户到反馈迭代的闭环,还是有强项优势的。
辜斯缪:我觉得这两种观点都有它的道理。
所谓的空间变小,是因为原来有很多的事情现在不需要做了,原来有价值的事情,现在变成没有价值了。另一方面,可能很多事情原来别人做不了的,现在更多人能做了。这种事情历史上不是没有发生过,九几年的时候微软推出GUI开发框架。很多原先程序员引以为傲的开发模式、开发能力不重要了。Python出现的时候,不再需要去考虑什么内存管理。大家会觉得开发者的价值好像在变小,但从整体来看的话,生产力就是在提升,大的趋势上一定是在向好。
石亚琼:AI时代下,传统的产品经理未必能做出来好的产品。产品经理如何应对大模型时代带来的变化?
郭人通:我自己觉得这个观点恰恰相反,恰恰是那些传统行业的传统产品经理才能做出AI应用,商业落地、创造价值。当我们说AI应用行业落地的时候,传统行业的产品经理更了解这个行业。
他知道问题在哪、真正的价值在哪。当然不是说我们前面的探索就不重要。AI能力要分两部分,一部分是语言能力相关的,还有一部分是reasoning能力。现在这个阶段更合适拿业务本身的理解力去支撑大模型。
辜斯缪:我是觉得,产品经理有三个关键要素。第一个是对于需求的理解,第二个就是思维模式,第三个就执行能力。AI大模型变化下,产品经理首先对于需求的理解是不会变的,但是思维模式要变化。很多旧的思维模式可能在新的产品里是不成立或者不合适的。
举个例子,原先很多产品设计包括价值也好或者能力也好,可能是建立在交互设计界面上的。AI时代下,产品需要考虑的是数据怎么形成反馈,这个可能是一个很难的事情。以前搜索的逻辑是,用户喜欢就点击内容,用户不喜欢就跳过内容,这个数据反馈是一个非常好反馈。
但是在未来,整个内容是通过一个文本生成出来的,里面有视频也有图片。那用户到底是喜欢看这个视频还是喜欢看这个图片,是觉得这个文字过长了还是过短了。我们就很难去获取到这个反馈。产品经理要解决这个问题,需要去升级思维模式。关于执行能力,产品经理需要拥抱这些AI能力和工具链,快速实现产品。我认为这也是影响最终产品成不成功的一个关键要素。
相关配图
石亚琼:AI时代开发人员需要什么样的素养和技能?
辜斯缪:这个时代本质上是一个智能时代,我们拥有很多类似于免费的智能体。之前有一个假设,我们把现在的AGI用IQ来测的话,现在他可能还处于一个大概智商在110左右,而且可能偶尔还有点喝醉了的状态。但从技术角度看,很可能在三年内就是IQ 140的一个人,同时他的知识约等于一个很大规模人群的知识并集,这是一个非常强能力的智能体。那么不管是开发也好,还是产品也好,其实要去完成你的工作,你就需要学会怎么去跟这么聪明的个体来配合,但是完成你自己工作。
石亚琼:我们也找了一些开发者提前沟通,有些人没有立即投入AI 大模型技术,是因为也会有些顾虑。从你们的角度,这波AI大模型的技术上限是什么?
辜斯缪:我对这个问题是非常非常乐观的。我觉得甚至这个不是我个人的判断,现在有很多的共识都是,这一波的技术革新可能是人类历史上跟几次工业革命并驾齐驱的一个革新!而且从目前的资本流转和投入上来看,基本上也都是这个判断。
我讲一个小故事,对于技术上限的问题,其实今年年初的时候我有一度对AI应用是有一点悲观的,因为我感觉没有人做出来这个东西。当我跟别人聊完之后,有一种豁然开朗的感觉。行业现在就是在做重建人脑,而且大家都觉得确定性很高,这个是5年起步的一件事情,现阶段就是一个重投入的事情。既然是确定性很高,而且是重要的一个技术革命,那么对于个人来说,投入的时间越早越好。我觉得,这个是没有必要纠结的。
郭人通:我之前听过一个比喻,特别喜欢。它说现在这个模型就是一个黑盒子,接通了两根线。一根线是电线,一根线是数据线,然后这个盒子里面就有一些Magic发生。现在我们所有的工作都在这个阶段。后面还有个阶段就是只需要通个电线,黑盒子就可以自己越越来越强。大家都想希望说AGI到达这个阶段,现在看还是有一些门槛。
我觉得现阶段的AGI还能再拆分两部分,一个就是大模型的自然语言能力,这个我觉得已经到很高程度了。还有一个就是,业务模型真正有的价值内核。我觉得现在其实每一个头部玩家都在做尝试,包括说可能在Agent里面加一些知识库,或者加一些工具,甚至是加一些Prompt。短期看,它能够起到更好效果。但其实我更多关注那些把业务模型或者是更宽泛一点世界模型去给用户赋能的尝试。
石亚琼:Al时代,开发者平台应该提供哪些支持和帮助?
辜斯缪:我觉得AI浪潮就是一个大漩涡,所有的开发者都被卷在漩涡里。在漩涡里需要三件东西,第一个是一艘船,第二个是一个桨,最后还需要一个指南针。
这艘船其实就是信息。你只有真正了解AI在发生的所有事情,才能在漩涡中安全待住,而不是被卷到什么地方。这个所谓的桨是,一整套的开发工具链,以及各种各样能让业务落地的东西。第三个指南针或者地图,根本上是你知道别人是怎么做的,可以了解和借鉴别人的一些成功经验。百度的灵境矩阵平台,依托百度资源为开发者提供了从芯片到最终解决方案的各种基础设施,我觉得未来可以给大家提供更多的帮助。
未来AI 产品:智能体、人形机器人、AI时代的产品长什么样?
石亚琼:今年是当之无愧的AI大年,大家有没有看到哪些非常惊艳的产品?
张瑞星:今年上半年的时候,我非常关注几个产品。第一个就是Midjourney,它是一个非常典型的AI Native产品。它的出现改变了这个时代生产图片的底层交互逻辑。我关注的第二个产品Discord。它本身是一个游戏起家的社区,但通过AI技术的赋能很多开发者在平台上孵化出自己的产品。
温永腾:我们内部把AI应用分为两种,第一种是做生成的,比如说Midjourney、Runway、Microsoft Copilot。我们觉得这些都是非常好的工具类产品。
最近,我们比较关注和一直探讨的是「AI如何改变分发」,比如AI如何去改变商品的分发,改变信息的分发,改变应用的分发。这里面我举一个例子,大家可能都了解Character.AI,它其实是在创造一种新的内容形式并且在分发这种新的内容形式。我们相信,2024年的时候,这样的产品会越来越多。
睢亚楠:我们在学校会更关注形成未来产品的底层技术上的一些演进。随着大模型的发展,今年我们也看到了它和机器人技术相结合的机会。这使得机器人的一些顶层规划能够往前走一大步,同时呢,相关模型在我们比较关注的人体健康方面会有一些技术性的进展。
石亚琼:具身智能和人形机器人的关系是什么?
睢亚楠:人形机器人是今年非常非常活跃的一个产业增长点。技术上来讲,这也是非常有意思、非常有挑战性的研究领域。我们会认为,人形机器人和具身智能有一个很大的交集。具身智能本身可能会包括像人形的具身,来和环境、和其他人进行交互,也包括其他的一些更广义的能够和环境、能够和人来进行交互的现实世界的机器人系统。
张瑞星:我们做软件的,其实也会关注这些,但肯定不如亚楠教授了解得深入。对于大模型来说,它本身具备自己思考、理解、记忆、规划的能力,但是它在连接真实世界方面的能力是缺失的。
这就是为什么需要百度灵境这样的平台,来帮助大模型构建各种外延,帮助大模型具备能够触达真实世界的能力。大模型想要触达真实世界,一方面需要具身智能这种本身跟真实世界连接的建模技术积累,同时又需要把这种技术跟软件层面的大模型应用之间发生一个匹配。
如果我们把人形机器人比作相对智能化的Agent,它本身如何跟真实世界发生交互?一方面需要真实世界的建模,然后去跟机器之间的建模做一个映射或者说对照,甚至是一个修正。这两者的融合之下,可能才能让Agent具备触达真实世界的能力。可能未来才能说,机器人可以解决真实世界中的具体问题。
温永腾:我补充一些自己的想法。人形也好或者说其他的机器也好,其实是具身智能的一个载体。我们可以理解为它是一个物理世界的Agent。从算法本身来看,具身这个概念相比传统的LLM概念的优势是,它其实是一个多模态的输入再加上一个多模态输出的过程。
真实世界的模态信息其实非常的丰富,有深度的信息,有图像的信息,有连续帧的视频信息,然后它的输出也是比较丰富的,它可能除了一些指令的输出之外,还要输出一些动作或者输出位置。
石亚琼:怎么看AI Pin的大额融资,这种AI硬件会是这一波具身智能的载体吗?
温永腾:我觉得有可能,像这样的硬件创新非常值得被鼓励。
我们认为,以AI作为原生思维可以去开发软件产品,也应该可以开发相应的硬件产品。以前我们以图形为界面的GUI交互界面,其实对应的是类似于像手机这样的超级硬件。未来以Language UI,就是语言为核心交互的模式会诞生新的硬件形态,它有可能是像AI Pin这样的形式,也有可能是类似于耳机或者说是AR硬件等等。但具体这个硬件形态的演化,可能还需要有一段时间的探索和使用体验的反馈来打磨。
我们在思考AI硬件的时候,也应该是AI原生思维,不受旧有硬件形态束缚。
石亚琼:刚刚我们聊了AI时代的硬件,再看看软件。大家怎么看最值得关注的Agent?
张瑞星:其实,行业对Agent的定义也并不是很清楚。我自己觉得Agent概念本身还是一个大模型的解决方案。
随着整个技术或者说大模型的发展,Agent经历了几个阶段。第一个阶段,更多的就是tools,是一个工具,绝大多数的应用都处在这个阶段。第二个阶段,随着大模型能力发展会出现类似Chat Bot的这种形态。比如说早期OpenAI的ChatGPT,其实是从一个工具渐渐进化成了一个能给你提供建议和反馈的东西。第三个阶段,是结合了前两者的能力,进化到Copilot。不管是微软的Copilot,还是说Character.AI、Midjourney,其实它都是一种Copilot。当我们去给它设定一些目标,设定一些任务的时候,它可以自动按照我们的要求去完成并且执行好这个任务。在这个基础之上,我们判断是说大模型能力包括开发范式已经进化到了Agent。除了执行的基础,它还能够自主地去给自己设定目标,外界只需给它资源、给方向,Agent就会自动地去执行,理解你的意图并且执行这个任务。
下一个阶段就是Intelligence,具备了一些独立的意识,到达AGI的一个状态。我是觉得这个阶段可能还需要一段时间,但当前我们的判断就是Agent应该是AGI之前的一个很长时间的过渡阶段。
温永腾:Agent其实就是具备memory和planning,并且能够调用工具、执行任务的基于AI算法的一个智能体。新的开发范式代表了新的应用平台的出现,比如百度灵境平台在做的事。另外一点就是,新的开发范式会给很多创业公司带来新机会。
未来,Agent会变成一个非常普遍的存在。原先的互联网其实是基于人与人的关系,当Agent充满了整个世界,人与Agent、Agent与Agent之间会产生更多的关系,有网络也会有交易。作为一个投资者来说,我们还是很兴奋的。
石亚琼:Agent开发平台应该具备什么样的能力?
张瑞星:这个问题其实还挺难回答的,原因就是随着新范式的出现,这种Agent开发平台在国内或者说国际上还是非常少的。我们自己也在摸着石头过河,但这个过程中,我认为还是有几个基础性的必备条件。
第一就是,Agent平台本身是要基于大模型的,大模型的能力一定要领先。在这一点上,百度灵境平台基于文心大模型,这给我们建立了一个很好的基础。
在新的开发范式下,当前开发者的开发成本还是很高的。他们面临着很高的成本压力,同时也面临着对于新范式的学习认知成本,以及包括人才成本。所以第二点就是,Agent平台能不能真正地服务新范式的开发者,为他们实现降低开发成本,减轻他们在创业初期的成本,促使创意变成现实。这跟百度灵境平台的Slogan「想象级现实」密切相关。
第三点就是,现在国内有很多人在卷大模型或者说在卷大模型的创新应用,但如果想长久地发展下去,里面会涉及自己完整的商业模式,有没有比较好的获客跟流量渠道。在这一点上,百度通过全域流量的赋能,特别是搜索流量的加持,真正帮助开发者去打通创业初期最重要的环节。
石亚琼:大家看到哪些AI应用更容易落地?
温永腾:我们现在看到,最有价值的还是生产效率方面的落地。我聊一个比较熟悉的行业,就是视频制作。以前整个视频的制作流程是非常复杂的,一般来说需要有脚本、导演、演员、拍摄,是这样的一个复杂工作流。AI技术的出现把这个工作流打乱了,像Pika或者Runway这样的产品可能就不需要有演员、脚本,就可以产生创意视频。我们已经在网上看到有很多这样的视频。
张瑞星:我本身的职责会包括两部分,搜索的生态还有灵境矩阵平台。大模型跟搜索之间其实是一个天作之合,不管是国际上Google SGE的解决方案,还是说微软Bing的解决方案,还有今年百度AI伙伴搜索。其实都给搜索这个工具型产品,带来了一个巨大的变革跟提升。生成式技术和搜索的结合,极致满足了用户需求。举个例子,原来搜索里面找简历模版,你只能找到这个简历模板,下载它,再去填写自己的内容。通过生成式的技术,用户完全可以用自然语言的方式,表达需求,快速地通过插件(未来可能是Agent)直接生成一个简历。
第二类就是,通过灵境平台我们也看到国内很多的开发者做了很多创新的应用,不管视频也好,图片也好,PPT创作,文档创作等等。从创作类的角度上,平台已经涌现出很多优秀的开发者,而且开发者的优秀产品已经能够跟百度搜索之间有一个比较好的结合,服务更广大的用户,也能给开发者带来对应的收益。
石亚琼:移动互联网时代的APP Store跟AI时代的GPT Store会有什么不一样?
张瑞星:我对这件事情的看法是,APP Store跟新时代的GPT Store在底层逻辑上是不一样的。未来GPT Store会不会定位成面向C端的,取决于OpenAI的想法。目前我们的判断是,它有可能并不是为了C端生态而存在的,更多的可能是为了激发自己的开发者生态而存在。即便它未来是定位成像APP Store一样的C端产品,最终在流量场景的分发以及对于价值捕获层面的逻辑应该也是非常不一样的。换句话说,背后的商业模式应该会有比较大的区别。
温永腾:从用户的角度,两者其实是有非常大的不同的。在传统的APP Store时代,我们会在某一个APP里面去满足我们的场景需求。比如说,我们想到外卖,会去外卖的APP。但在Agent Store这个世界下,我觉得流量的分发逻辑会非常的不一样。很有是以用户的一个需求或者现在的状态为核心,平台去调用各种不同的Agent来满足用户的需求,甚至用户都不用知道具体调用了哪一个Agent。
睢亚楠:会不会有APP Store这样的形态存在?还是它可能就作为一个随身可穿戴的设备?或者我们已经不再需要任何APP Store,而是通过线性的相当于时间轴这样的一个接口,通过语言或者通过其他的操作指令,自动把这些要做的事情解决了,不需要以并行的方式存在于控制界面上。我可能会更往前展望一下。
本文来自微信公众号“互联网怪盗团”(ID:TMTphantom),作者:怪盗团团长裴培,36氪经授权发布。