在科技的浪潮中,5月22日,昆仑万维以无畏的勇气和坚定的决心,面向全球市场重磅发布了天工超级智能体(Skywork Super Agents)。这是一场科技的革命,是昆仑万维在人工智能领域的又一次重大突破!该产品采用先进的AI agent架构和deep research技术,宛如一把利剑,为用户开辟了一站式生成文档、PPT、表格(excel)、网页、播客和音视频等多模态内容的全新道路。昆仑万维凭借强大的技术实力,其deep research能力在GAIA基准测试中脱颖而出,在GAIA榜单上勇夺全球第一,将OpenAI Deep Research和Manus远远甩在身后。
昆仑万维以开放的姿态宣布,该产品即日起向海内外用户开放注册,无需邀请码。这是对全球用户的诚挚邀请,是要让每一个人都能感受到天工超级智能体的强大魅力!
1. 5种模态,一键生成,用8分钟完成8小时的工作
与那些功能广泛却缺乏专业深度的AI智能体不同,天工超级智能体如同一支精锐之师,包含一个由「5个专家智能体」与「1个通用智能体」组成的强大系统,它以专业的姿态,为用户提供高质量的内容生成服务。
5个专家智能体,就像5位技艺精湛的工匠,分别负责专业文档(doc)、PPT、表格(excel)、播客和网页的生成。文档、PPT、表格作为常见的办公应用,是工作中的得力助手。
昆仑万维以创新为驱动,文档、PPT、表格三个智能体集成了deep research能力,如同为它们注入了智慧的灵魂,能够提供专业内容生成。网页和播客智能体则面向新媒体内容模态,紧跟时代的步伐,为用户在新媒体领域开辟了新的天地。这些专家智能体是针对办公和学习场景精心设计的,它们带着使命而来,要为用户提供高质量的内容。
1个通用智能体,接入了数十个MCP(模型能力提供者),仿佛是一个超级能量站,用于处理多模态创意任务,能够生成图片、音乐、视频等多种媒体内容。它的存在,让创意不再受到限制,让每一个想法都能变成现实。
2. Deep Research技术赋能核心办公应用
此次发布的核心,是天工超级智能体的「文档」、「PPT」和「表格」三大智能体。它们就像三把利刃,将在办公领域披荆斩棘。
在「文档」智能体方面,针对行业研究、学术论文、商业计划等专业写作需求,天工集成了deep research能力。这是一种强大的能力,它如同一位知识渊博的学者,能够深入思考和推理,提升信息检索的广度、宽度与效率,并通过强化学习增强搜索泛化性,为内容生成提供高质量信息源。据称,该能力在性能上接近OpenAI Deep Research,同时成本只有openAI的40%。这是昆仑万维在技术上的巨大优势,是对用户的真诚回馈。
天工的deep research agent框架在Meta和Huggingface联合推出的GAIA的评测集上取得了82.42的高分,超越了OpenAI Deep Research和Manus,位居第一(2025年5月10日数据)。这是一份荣耀,是昆仑万维技术实力的有力证明。
在OpenAI的SimpleQA评测任务中,Skywork获得94.5分,超过了此前该任务的SOTA(State-of-the-Art)水平。这是一次超越,是昆仑万维在技术创新道路上的又一个里程碑。
相比OpenAI的Deep Research,天工「文档」智能体生成的报告包含多种数据图表,如条形图、折线图、饼状图等,以增强内容的可视化呈现。这是一种创新,是让数据说话,让内容更加生动形象。
天工的「PPT」智能体同样集成了deep research技术,它就像一位专业的演示大师,通过深度搜索和研究,为用户生成演示文稿内容。据介绍,生成的演示文稿内容支持事实与数据溯源,并包含动态效果。PPT功能支持在线编辑及导出为pptx、pdf格式。这是为用户提供的全方位服务,让演示文稿的制作变得轻松简单。
天工的「表格」智能体也支持deep research技术。该智能体可基于用户上传的数据表进行描述性或推论性统计,并生成统计图表,同时支持生成模板型及汇总型表格。生成的表格支持在线浏览和导出为xls格式。这是对数据处理的高效解决方案,让表格的制作不再繁琐。
昆仑万维以开放的胸怀,将其deep research agent框架已在GitHub上开源,供开发者下载。同时,天工的文档、PPT、表格生成能力也已封装成MCP(模型能力提供者),供开发者调用。这是对开发者的鼓励和支持,是要让更多的人参与到科技的创新中来。
3.拓展至网页、播客及音视频等多媒体内容生成
除办公应用外,天工超级智能体以开拓的精神,将其能力拓展至网页、播客与音视频领域,为用户提供一站式内容创作支持。这是一场内容创作的革命,是要让每一个人都能成为内容创作的大师。
天工的「网页」智能体支持依据用户需求生成网页,可用于创建电商页面、个人博客、信息展示及功能型网站等。它就像一位专业的网页设计师,降低了网页创建的技术门槛,让每一个人都能拥有自己的网站。
天工的「播客」智能体可根据用户输入的需求生成脚本,并基于脚本通过语音合成技术制作音频。目前该功能支持生成英文播客,计划后续支持中文及其他语言。这是对内容创作的又一次拓展,是要让声音传递更多的信息。
由于目前尚不支持中文内容生成,国内版本(tiangong.cn)暂未上线「播客」智能体。但我们相信,这只是暂时的,昆仑万维一定会不断努力,让中文播客也能早日与用户见面。
此外,天工的「通用」智能体集成了数十个MCP,覆盖图像、视频、音乐、语音生成等能力。它就像一个创意工厂,可将文字转化为视频,并支持自动匹配背景音乐与特效,适用于生成宣传视频、教学课件、创意短片、有声书、绘本等多种内容。