一直与微软Office掰手腕的金山办公, 能否靠AI领先?
- 2025-07-31 02:52:29
- 620
WPS灵犀=Gemini+Chrome+微软Office。
文|徐鑫 周路平
编|任晓渔
办公提效是AI大模型出现后应用最广、也是效果最显著的场景。在今年5月美国机构开展的一次大规模调研中,写作辅助和PPT制作都是排在前列的应用。而WPS作为国内最老牌的办公套件,其在AI办公上的进展一直备受外界关注。
7月27日,金山办公发布了原生Office办公智能体“WPS灵犀”,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,全程无需复杂操作和外部跳转,而且可以在右侧的对话框中,与AI边聊边改。
同时,它还能保证PPT生成的效果,顺畅完成二次修改编排,贴合现实使用场景的体验,令不少用户感到惊喜。“不再是辅助的工具,而是正在变成了一个可控的智能助理。”有人如此形容灵犀的体验。
基于用户现实的需求,将AI能力与文档办公组件深度融合,灵犀也引领办公领域走向智能体时代。
01
办公智能体的“Aha moment”
内容创作已经是AI最基础的功能,不管是AI办公软件,还是各类通用的AI应用都具备创作生成的能力,不过此次WPS灵犀的发布,却在强调“边聊边改”,更符合真实办公场景体验。
到底实际效果如何,我们也做了上手体验。
首先演示文稿生成场景。我给灵犀下了一个指示:以深度学习技术的发展历程为主题,制作一份演讲时长30分钟左右的演讲稿,里面要有行业内的前沿动态和案例。
AI智能体在接收指令后快速对任务进行了拆解。可以先看一下它的深度思考拆解过程。
它给出的大纲条理清晰,内容丰富,完整地呈现了深度学习技术的发展阶段。而且开头、结尾以及段落之间的衔接,有很多口语化的表达,符合演讲者的身份,自然鲜活。
既然它说可以边聊边改,我也挑了一下它的毛病,要求它优化致谢部分的表达方式。
WPS灵犀理解了我的需求,并且精准定位到了致谢的位置。它还给出了修改的说明,认为可以补充相关数据,增加严谨性。
提出了这些修改意见后,在目录下方有一个挑选PPT模板选项,WPS内置了丰富且精美的模版库。
两分钟后,WPS灵犀就生成了数十页的PPT,效果令人惊喜。这份PPT不仅风格统一、排版精美,而且还插入了各种图标和图片,甚至这些图片都是根据演讲内容生成,并非是毫无关联的配图。
生成好了PPT之后,作为一个挑剔的合作者,我再次提出要求。能否跳回大纲部分,补充人机协同系统构建案例。WPS灵犀非常有耐心,它首先回溯了一遍任务,然后上网搜寻了信息,之后再次回到大纲修改了大纲内容。
大纲修改完成后点击就能生成PPT。到具体的PPT页面里,如果有不满意需要调整的地方,侧边栏的AI智能体又能出马帮忙。
比如,在某一页里无论是内容、条目数量还是格式等有问题,都能动态调整。
甚至,WPS灵犀还可以根据生成好的PPT,提供演讲脚本的生成,并配上演讲者的声音和动画,将其制作成演讲视频。
生成的文稿有两种模式。一种是可以嵌入到演示文稿的备注中,在演讲者模式里直接可以成为演讲时的提示词。也可以导出为文档,直接对着文稿介绍。
除了AI生成演示文稿和PPT,WPS灵犀在合同文书场景里的能力也令人印象深刻。
我最近租房,需要一份租房合同。在使用WPS灵犀之前,我发现市面上有很多AI助手虽然可以生成合同,但大部分都不能直接生成word,需要自己复制粘贴到word。体验割裂不说,合同本身需要有排版格式,复制到word里格式往往一团糟,很难上手即用。
而WPS灵犀直接给了我一份带格式的合同,调格式的烦恼直接没有了。
这波体验下来最直观的感受是,用起来更有确定性和更可控。其亮点如下:第一,它用聊天对话的方式就把内容定了。第二,它不追求一锤子端到端搞一个看起来酷炫的东西,而是务实地认为,办公场景需要通过多轮自然语言对话,逐步让AI给用户交付一个更符合用户需求的东西。第三,它也不只是生成内容,还能交付有确定性的格式和呈现效果。
“现实生活中我们就是这么工作的。当你有一个真正的助理,最高效的沟通方式一定是你一边对着文档,一边告诉他你需要什么。”WPS助理总裁田然在WAIC演讲中说。
02
“边聊边改”,技术实现起来并不容易
相比外界的一句话生成文本或者演示文稿,WPS灵犀的新颖之处是边聊边改,实时同步结果。这个差异能看到WPS在产品理念层面,选择向贴近用户使用场景,更务实的方向演进。
“一句话生成一个完整内容,这件事并不符合日常用户的交互和使用习惯。人的创作过程,本质也是一个非线性的逐步成形,螺旋逼近成品的过程。”WPS AI PPT产品负责人陆炜俊说。
而除了产品理念贴合用户需求之外,数智前线与WPS产品技术团队的交流同时得知,颇刷大众好感的“边聊边改”实现起来并不如看起来那么容易。
资深人士介绍,市面上此前一键生成PPT的模式,本质上是把非结构的内容变成结构化的大纲,后面的动作就是套模版。
而WPS灵犀通过与用户的多轮对话来理解用户,在大纲环节确保符合用户需求。同时,这个环节相比其他一键生成模式,技术突变点在于让大脑能够行动的脚手架上,有了脚手架让大纲可以做增删改查。
这里面,大模型推理能力的升级非常关键。基模能力如果不强,没有那么强的指令遵从能力,泛化时可能就会出现幻觉,模型就容易乱编格式,编完再渲染回文档或者演示文件,效果会很糟糕。
而随着智能中枢大脑的推理能力变强,给能理解更复杂语义的大脑中枢提供一个可以增删改查的手脚,生成大纲这一步就多了一个控制节点。WPS产品团队认为,大纲编辑器是他们给行业提供的一个基建。
“它看起来像一个文档,但它不是文档,也不完全是markdown,而是我们人为定义的正文节点的一个编辑器。我们让大模型认识了这个大纲编辑器,围绕着大纲的这个增删改查的脚手架才能调动成功。”陆炜俊说。
在体验中,我们也发现,围绕着大纲内容的调整,WPS灵犀已经有非常精准的定位能力。比如我想要它调整致谢相关表达时,大模型能理解整个大纲里哪个部分是致谢,其他部分的大纲就不发生变化。
而整个PPT制作过程有三层,在内容之外,还有排版和样式。目前排版样式需要在生成的PPT文件内调整。这些调整过程目前也用到了AI能力,比如三个信息点增加成四点,点击一个按钮版式上会自动变成能容纳四层信息的样式,用户无需自己排版对齐美化。
但当下它还不是在灵犀里用聊的方式完成的。“现在还没法在全篇文档里来改细节格式,围绕着格式版式有1万个API,排列组合下来它是一个天文数字。”
WPS产品团队介绍,这是他们接下来努力的方向。要往这方向发展,有不小的难度。
这里面不止是要把组件的各种格式能力打碎,能被原子化地调度。更重要的是要让AI调用API的时候既能发挥AI的创造性,又能严谨遵循格式要求。田然认为,组件有那么多的API,尤其是表格,复杂度极其高,以什么样子的方式又得让AI能用到,同时又不会把AI去用废了。两边的都需要大量的工程工作。
据了解,目前WPS产品团队已经构建了一套新的更适合AI原生的API,它作为一种中间协议,在模型和编辑器中双向沟通,发挥模型的创造性,同时也确保产出结果在格式等层面的可控性。
不过WPS认为,他们来做这件事也有固有的优势。与市面上的其他产品相比,WPS拥有海量的用户,也围绕着Office做了几十年的技术积累。今年年初,金山办公披露,WPS Office PC版的日活设备数已经过亿。这不仅能让他们更熟悉用户的需求,也能从产品层面更好地满足需求。
“能够用好AI,还能够理解office,这就是我们跟别人不一样的地方。office有1万个API,我们接下来怎么把这1万个API能够封装为让AI能调度,这是我们幸福的烦恼。”陆炜俊说。
03
从与微软掰手腕到引领半个身位
WPS最早诞生于1988年,比微软Office先开启中文文字处理时代。双方多年来一直在交锋。不过,微软Office早年凭借兼用协议和系统捆绑销售的方式抢占了绝大部分市场,也因此通过Office办公三件套定义了文档的格式、成为了行业标准。
而这些年,WPS通过布局移动端,持续在兼容性和生态上下功夫,也逐渐夺回了本土市场。2025年一季报的数据显示,WPS Office全球月活设备数达到6.47亿。
进入AI时代,新的竞争格局仍在持续变化。在WPS AI 1.0时代,外界依稀还能看到微软的影子。但随着WPS AI 3.0的原生Office智能体灵犀的发布,金山办公在PPT生成和文档生成等方面的体验已经走在了前列,成为AI办公领域的先锋者。
在金山办公助理总裁田然看来,微软Copilot的产品形态,属于是WPS AI 3.0之前的版本。
一位金山办公内部人士告诉数智前线,金山办公WPS与微软Office在AI上做的事情有相似之处,都是给用户提供更加智能化的操作,但两者的整体技术路线其实不完全相同,微软现有的产品更偏向基于现有功能,然后加上AI能力。
而金山办公会从更加底层,把程序最底层的API暴露给模型,然后模型用代码的方式去生成,这更能保证AI生成的准确性和覆盖度,“但这样的技术难度曲线就会比较陡峭”。
在田然看来,WPS灵犀做的事情和Cursor的逻辑非常相似,“只不过Cursor是给程序员做,我们是给所有的文档工作者做。”
程序员写代码需要在IDE的环境中实现,而Cursor做的最核心的事情是把大模型的能力与vscode编辑器的能力做了深度融合。这种能在真正的编译运行环境实际使用的代码与早期AI生成的代码是两回事。
WPS灵犀则是在Word或者PPT的编辑器里面来实现交互过程,尝试推动AI和办公软件的深度融合,“不是把软件的10000个API教给AI,而是针对场景做AI和软件的双向改造,软件为AI设计专有能力,同时教会AI跟软件深度交流,最终依靠用户、软件、AI之间多轮交流,输出真正可用的内容。”
田然将WPS灵犀形容为融合了Gemini、Chrome和微软的能力,做到了把用户真正想要的文档形式跟AI之间的交互,“这个市场上今天仅此一家”。
除了技术路线上的不同,WPS之所以能在AI体验上做出惊喜,也跟金山办公一直以用户需求为中心的务实心态有很大关系。
金山办公反复强调的一点是,不会去发布看起来酷炫但落不了地的功能,而是基于海量用户的反馈去解决已经存在的痛点和需求。相反,市面上很多企业做产品的思路是先做一个酷炫的Demo,推向市场,进而拿到融资。
这种务实也体现在金山办公对自身的定位上。金山办公从一开始就明确不做基础大模型,而是基于业内最优秀的大模型,集中精力放在AI的应用落地。
今年初,金山办公首次发布了五年战略,金山办公决定将适当放宽对WPS Office的收入增长目标,转而把用户体验置于更优先的位置,同时将“WPS AI做成办公领域的AI引领者”。而WPS灵犀也在刚刚结束的2025世界人工智能大会上,获评为“镇馆之宝”。
回顾金山办公的37年发展历程,它仿佛一场穿越重重困难的长征。但愿意花笨功夫,愿意根据用户真实需求去踏踏实实做产品的金山办公最终生存下来,且一步步走向壮大。WPS这一次推出原生Office智能体灵犀,是WPS在AI的大时代,成为AI办公先锋者的关键。
- 上一篇:三毛赵丽颖裙子
- 下一篇:王安宇请立刻离开广东