智能体大爆发,腾讯引领前行!

2025-05-23 1 0

5月21日,在北京一家五星级酒店的宴会厅内,腾讯云AI产业应用峰会盛大举行。会场入口处,混元大模型和智能体的互动展示前,参观者络绎不绝。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生身着深灰色西装、浅蓝色衬衫,自信地站在会场中央的演讲台上,沉稳有力地阐述着腾讯对AI的全面战略布局。

汤道生开门见山地指出:“AI持续落地,每个企业正在成为AI公司,每个人也将成为AI加持的’超级个体’。”腾讯在加大AI投入力度上可谓果敢激进,打通了各业务条线与AI之间的壁垒,以极大的权限向各业务开放AI能力。

“全面拥抱AI”,不仅是本场峰会的主题,更是贯穿腾讯2025年全年的重要战略,深刻影响着这家科技大厂的方方面面。汤道生在演讲中提出了大模型、智能体、知识库和基础设施”四个加速”的战略,其中智能体是极为关键的一种呈现形式,代表着大模型在国内发展三年后应用范式的迭代。

然而,智能体的定义在行业里还不够清晰。

在大多数人眼中,智能体十分实用。当你想订机票、查找整理信息或统计excel表时,无需打开不同软件app手动操作,只需告诉智能助手,它就能自动完成,轻松帮你订好机票。就像在媒体群访间,腾讯云副总裁吴运声幽默地说:“我现在就特别希望有一个智能体来替我回答你们的问题。”

从这个角度看,智能体的概念并不难理解。但目前概念模糊,是因为行业内存在诸多问题。

市面上的智能体,能力范围、交互方式甚至底层架构都可能大相径庭,这导致用户对智能体的期望与实际能力存在巨大差距。有些智能体仅具备自然语言交互能力,有些甚至只是简单的自动化工具,与过去的SaaS软件唯一的区别可能只是象征性地加了AI,并未真正具备自主思考能力来改变用户与软件应用的交互方式,而这恰恰是智能体的核心。吴运声在现场明确表示:“真正的智能体需要有思考、规划和执行的能力。”

目前智能体最大的问题不是会不会思考,而是能力边界。虽然部分智能体已经具备思考能力,但要真正突破能力边界,还有很长的路要走。

用户往往期望智能体能像人类助手一样全能,但实际上智能体的能力边界受到权限、API接口、数据孤岛等多方面因素的限制。比如让智能体帮你订机票,它需要访问日历、联系人、支付系统,还需与航空公司的系统对接,任何一个环节出现问题,整个任务都无法完成。不过,这并非只是AI时代才有的问题,从这个维度来看,真正能做到全能的智能体几乎为零。

在本次腾讯云AI峰会的会场上,智能体成为了大家热议的焦点。此前,无论是Manus,还是国内一众巨头和模型厂商推出的类Manus产品,都将智能体推向了风口浪尖。

以下是在腾讯云AI产业应用峰会现场与腾讯云副总裁、腾讯云智能负责人吴运声的精彩对话内容:

Q:今天腾讯云推出了智能体开发平台,在这背后腾讯云有着怎样的深刻思考?

吴运声:作为从业者,我深切感受到最近几年AI发展迅猛,从技术到产品形态,从客户需求到技术与需求的结合,都发生了巨大变化。

我们始终秉持AI要真正服务客户需求的理念,无论是做技术还是产品,都致力于服务客户实际场景,为客户创造价值,这是我们坚定不移的宗旨。

过去我们提出知识引擎,是因为观察到在大模型出现后,企业知识的使用和知识库能力对企业构建至关重要。我们在知识挖掘方面积累了丰富的能力,比如能在大Excel表格里挖掘答案,这在过去是难以想象的。

Q:智能体与传统SaaS的本质差异究竟在哪里?

吴运声:我认为关键区别有两点:

一、智能体具备自主思考和决策能力。传统的软件开发范式(包括SaaS)通常是开发者事先设计好流程,即便有分支逻辑,也是开发者预先定义的。而智能体面对自然语言交互,用户输入开放,不可能穷举所有分支,这就需要智能体能够自主理解、规划、执行任务,而非依赖固定流程。

二、智能体能融合确定性工作流与自主规划机制。我们的智能体平台支持工作流组件的融合,用户可以构建确定性流程处理特定任务,同时允许智能体在其中进行自主规划,实现了灵活性与确定性的完美结合,能更好地满足复杂多样的企业应用场景。

Q:最近一两个月,腾讯在视觉模型和多模态模型方面的发布节奏明显加快。作为优图实验室的负责人,您能否从腾讯自身的行业观察和客户需求出发,谈谈为什么我们现在会加快这一块的技术发布和开源?背后有哪些战略或行业层面的考量?

吴运声:我们加快发布节奏,本质是客户需求在驱动我们不断优化技术堆栈。视觉、多模态、文本和智能体技术并非孤立发展,而是相互协同,共同支撑整个企业AI应用的落地。

以我们早期的重要产品——媒体AI中台为例,其服务对象包括电视台、广告公司、内容平台等。很多客户有海量的媒资内容,尤其是视频内容,常见需求有:

•快速检索视频中的某一段内容,例如1990年春晚中冯巩的小品;

•将长视频进行自动切分、分类、打标签;

•对视频内容生成摘要,便于理解和传播。

过去用传统AI技术实现这些能力效果不佳。比如抽取关键词、生成摘要这类任务,对语言理解能力要求很高,传统模型对“第十一届三中全会”或“2008年北京奥运会”这种长实体的识别非常依赖词典或规则,扩展性很差。

但现在有了大模型,特别是多模态大模型,在语义理解、上下文建模、内容切分、标签生成等方面都有显著提升。比如:

•大模型可以将不同语言表达的相似语义映射到同一个语义空间,从而实现更强的语义检索与比对;

•视频理解不再单纯依赖视觉模型,而是视觉+文本多模态协同;

•通过引入Agent+工作流机制,可以将整个内容理解与加工流程高度自动化、模块化地重构。

所以你会看到我们在视觉模型、多模态模型上的开源和产品化节奏明显加快。这不是单点能力的简单堆积,而是以客户需求为中心,将能力整合成“系统性解决方案”的过程。

总结来说,技术节奏的加快是被真实业务需求推动的。我们过去多年的能力积累,借助大模型、Agent等最新范式重新激活,以更智能、更高效的方式解决问题。

Q:从腾讯的角度看,在推动智能体落地过程中有哪些强大的能力储备?又面临着哪些挑战?

吴运声:我们并非“为了智能体而智能体”,智能体背后有深厚的基础能力作为支撑。

•第一是知识管理能力:这是构建企业智能体的核心基础,企业的智能体最终要用企业自己的知识体系来提供服务。

•第二是工作流的能力:尽管现在强调Agent的自主规划能力,但现实场景中,很多任务还是需要明确的业务流程。我们将传统的工作流能力和Agent能力融合起来,提出了一个极具代表性的创新——在工作流中引入“全局视野”的智能体节点。

传统的工作流是串行执行、节点独立,而我们现在让每一个节点在执行时,都可以和一个拥有全局上下文理解能力的智能体交互,从而在保持流程确定性的同时,也兼顾了智能体的灵活性。

至于挑战,主要有两个方面:

1.技术层面:目前的Agent框架仍在快速演进,尤其是在自主规划(planning)这个环节上,底层模型还不能100%把复杂任务完全准确地拆解并执行。这是模型和框架协同进化的问题。

2.客户认知层面:很多客户还停留在对“Agent”作为一个新概念的理解阶段。但真正要用好Agent,需要掌握它的使用方式、搭建方法和运行机制。这中间存在一个不小的“认知与使用”的鸿沟,需要我们通过产品体验优化、培训、服务等多种方式不断去弥合。

我们坚信,随着模型能力增强、平台工具完善、企业认知提升,智能体将在更多行业场景中充分发挥价值。

Q:您如何看待当前AI应用的发展趋势?是否认为智能体是最有前途的方向?因为现在大家似乎都在做智能体。

吴运声:说智能体是AI应用里最有前途的,这种说法比较模糊。AI在很多领域都有广泛应用,智能体确实发展迅速,且智能体技术本身基于大模型。

很多企业使用的大模型技术,与智能体的界限并不分明。智能体和大模型是相互促进的关系,智能体依赖于大模型的发展,特别是在模型理解任务、自主规划和调用工具等能力上的进步。

所以我认为AI的发展是全方位的,不仅包括大语言模型、多模态模型,还有语音模型、视觉模型等一系列模型的进步。智能体是其中一个非常重要的方向。

Q:在腾讯整体的AI生态里,智能体开发平台处于什么样的重要位置?它如何与腾讯其他AI产品联动?

吴运声:智能体开发平台的定位是为客户搭建更强大、更复杂的智能体应用。我们在打造这个平台时,自然会整合腾讯过去积累的各类AI能力,比如端到端的语音识别和交互能力。以刚才演示的寄快递场景为例,语音通话能力贯穿始终,这正是我们过去积累的优势。

相关文章

集体爆发!燃气板块迎来强势拐点
哇!刘强东又去新战场探险啦
青岛银行第一大股东或易主!青岛国资拟斥资超15亿最高增持5%股权
本周A股市场欢乐涨跌榜:稀土永磁闪耀领涨,创新药与IP经济嗨翻全场
孩子王16.5亿‘勇敢冲冲冲’养发:母婴巨头要搞大事情啦?
日本低利率政策对日债市场的影响:历史教训与现实启示

发布评论