新闻资讯
News and information
-
25
12/10
智能体互联网引发物联网的重新定位,如何完成从"智联万物"到"可编程世界"的惊险一跃?
就像互联网时代没人再讨论TCP/IP协议,但它无处不在,物联网正在经历同样的下沉,成为智能体时代的具身数字底座。前几天,一位朋友问我:“OpenAI的AI助手已经能直接控制智能家居了,谷歌的Gemini也在接管汽车,我们这些做物联网硬件的是不是要被短路了?”我说:恰恰相反,AI越强大,物联网越重要。最近“智能体互联网”这个概念最近频繁出现在各种讨论中,但大多数人都在关注上层的AI大模型,却忽略了一个关键事实:没有物联网,智能体就是缸中之脑;没有智能体,物联网就是植物人。我们正在见证的,不是物联网被AI短路,而是物联网从前台明星退居幕后基建的关键时刻。就像互联网时代没人再讨论TCP/IP协议,但它无处不在,物联网正在经历同样的下沉,成为智能体时代的具身数字底座。智能体互联网,本质上是让万物从被动的数据终端进化为能主动思考、相互协作并直接交付结果的智能伙伴。这不是简单的技术迭代,而是硅基智能从“观察世界”向“改变世界”的惊险一跃。从连接到智能:一场三十年的数字进化史回头看这三十年,我们经历了五次关键的演进,每一次都在解决前一次留下的缺憾。更有意思的是,这些看似独立的技术浪潮,其实都在朝着同一个方向努力,让数字世界和物理世界的边界彻底消失。第一幕发生在1990年代,互联网完成了信息的数字化。那个年代,计算机连接计算机,核心任务是把物理世界的文档、资讯搬到线上。我们解决了信息不对称的千年难题,突然之间,一个农村的孩子也能读到哈佛图书馆的论文。但问题也很明显:你必须坐在电脑前,世界被压缩在一块15寸的屏幕里。2007年乔布斯发布iPhone,移动互联网的大幕拉开。这次连接的不再是机器,而是人。手机成了人的数字器官,我们的位置、行为、社交关系全部被数字化。美团、滴滴、微信的出现,解决了服务不可得的问题,凌晨三点你也能叫到外卖,在西藏也能和纽约的朋友视频。人类第一次实现了永远在线。但这还不够,因为除了人,整个物理世界仍然是沉默的。与互联网同时发生的是物联网的演进。《ITU互联网报告2005:物联网》的发布以及IPv6的普及让物联网从理念成为体系,从梦想走进现实。这是物理世界的觉醒时刻。传感器开始大规模部署,温度、湿度、震动、光照……万物开始说话,只不过说的是数据语言。一个冰箱知道了自己内部的温度,一座桥梁能感知自己的形变。物理世界第一次有了数字孪生。但这些设备就像新生儿,只会哭不会说话,它们产生海量数据,却不理解这些数据的含义。2016年AlphaGo战胜李世石,宣告了AIoT时代的到来。AI开始为物联网注入“智商”。摄像头不再只是录像,它能认出你是谁;音箱不再只是播放器,它能听懂你说什么。设备从传感器升级为具备一定认知智能的设备。但即便如此,它们仍然是被动的,你必须明确地告诉Siri打开客厅的灯,它不会主动思考你为什么需要光。2025年,GPT开放插件生态,智能体互联网的时代正式开启。这是质变的时刻。基于大模型的通用推理能力,让设备从听懂指令进化为理解意图。当你说“我累了”,系统不仅会调暗灯光、播放舒缓音乐,还可能主动询问是否需要预约明天的按摩服务。更关键的是不同品牌、不同功能的智能体开始相互协作,形成了一个能自主规划和执行的网络。未来,我们可能还会看到其他的新名词,演进没有终点…五次演进,五个阶段,但如果你仔细观察会发现,它们都在做同一件事:消除数字世界和物理世界的边界。互联网让信息数字化,移动互联网让服务数字化,物联网让环境数字化,AIoT让认知数字化,而智能体互联网,则让“行动”本身数字化了。看到这个趋势,因此我在2026中国AIoT产业年会上提出了“万物智行”。这就引出了一个关键问题:这一切的终局是什么?这个终局可以从三个维度来理解。交互的终局是“意图即结果”。过去三十年,人类一直在学习机器的语言,从DOS命令到图形界面,从键鼠操作到触屏手势。现在机器终于开始理解人类的自然语言和模糊意图。但真正的终局是,所有的操作界面都会消失,环境本身成为界面。你产生一个意图,物理世界就会自动重组来满足它,中间的操作过程被彻底折叠。空间的终局是“虚实边界消失”。互联网最初只是物理世界的数字存档,后来物联网让它成为物理世界的感知神经。数字分身不再只是物理的映射,而是直接驱动物理世界。比特能重组原子,物理世界获得数字世界的全部属性,可搜索、可计算、可升级、可编程。世界变成一个巨大的操作系统,万物皆是外设。智能的终局是“超级智能体”。每个应用、每个设备曾经都是信息孤岛,现在智能体开始相互协作。最终,全球的计算能力、数据、能源、制造和服务能力会连接成一个整体,形成具备自我感知、自我修复、自我进化能力的分布式大脑。人类不再是这个系统的操作员,而是它的神经中枢,我们只负责定义目标和价值观。一句话概括:我们将生活在一个数字与物理彻底融合的智能生态中,物理世界像软件一样具有流动性和可塑性,人类的每一个意图都能被瞬间理解并在现实中直接实现。物联网的下沉:AI进入物理世界的数字底座面向刚才描述的终局,我有一个判断:物联网将进一步下沉,成为整个数字世界的底座和基础设施。这不是技术趋势的推测,而是已经发生的现实。我想从三个维度来论证这种下沉的必然性。首先是数据维度,物联网正在下沉为AI的数据供应基地。根据IDC的研究,到2025年底,全球数据总量将达到213.56ZB,2029年达527.47ZB。中国2025年产生51.78ZB,2029年增长至136.12ZB,CAGR为26.9%,其中近30%是实时数据。这些实时数据从哪来?绝大部分来自物联网设备,工业传感器、视频监控、医疗设备、车载终端。ThalesGroup和IoTAnalytics的分析更加具体,分布在生产、交通、医疗、城市等场景的海量物联网终端,将为AI应用提供着超过三分之二的原始数据来源。物联网已经下沉为数据层的基础设施,默默地、持续地为上层的AI应用输送着数据血液。其次是价值维度,物联网的价值正在通过AI释放,呈现冰山模式。麦肯锡在其物联网价值研究报告中指出,B2B应用将贡献物联网总价值的约65%。这意味着真正的价值不在消费者看得见的智能音箱或手表这些水面之上的部分,而在工厂车间、物流仓库、城市管网这些水面之下的地方。物联网正在向这些看不见的底层场景下沉。更关键的是价值释放的机制。SAS和德勤的研究都提到一个惊人的数字:未经分析的物联网数据有99%被浪费了。物联网设备采集数据很容易,但要从中挖掘价值则依靠AI。从这个角度看,“人工智能+”创造的价值中,有70%以上依赖物联网提供的数据基础。物联网不再追求前台的可见性,而是下沉为价值创造的隐形推手。最后是架构维度,物联网正在从连接层下沉为底座层。物联网正在变得不可见,这恰恰是它成为基础设施的标志。就像我们感知不到电网和供水系统的存在,却每时每刻都在使用它们。Gartner的调查显示,到2023年,三分之一实施物联网的企业同时实施了AI项目。这不是巧合,而是技术融合的必然,AI需要数据,物联网产生数据;物联网需要智能,AI提供智能,两者正在加速合二为一。与此同时,计算架构也在重组以支撑这种下沉。IDC预测,到2025年,超过50%的企业数据将在数据中心或云之外的边缘进行创建和处理。这意味着物联网设备不再只是数据采集器,它们正在变成计算节点。一个摄像头不只是拍摄,它能直接识别异常;一个传感器不只是测量,它能立即判断趋势。物联网下沉为支撑AI进入整个物理世界的数字底座。这种下沉是不可逆的。在不远的将来,我们可能不会再频繁提及物联网这个词,不是因为它不重要了,而是因为它太重要了,重要到像电力和空气一样,完全融入了环境,下沉为不可见的基础层。它将成为可编程物理世界的操作系统内核,一个看不见却无处不在的数字地基。万物智行:从APP经济到意图经济的变迁凌晨2点37分,张大爷在起夜时突然跌倒。2点38分,他手腕上的智能手环检测到异常的加速度变化和心率突变。但这只是一个A品牌的设备,它能做的只是震动和发出警报声。如果故事停在这里,张大爷可能要在冰冷的地板上躺到天亮。但在智能体的世界里,故事才刚刚开始。手环上的数据触发了张大爷的个人智能体,这个运行在云端的AI助手立即开始了一场跨品牌、跨设备的紧急协作。2点39分,客厅里B品牌的摄像头收到指令,镜头转向事发坐标,视觉识别模型在300毫秒内确认:老人倒地,无意识动作。2点40分,智能体做出判断,高危紧急情况,启动救援程序。接下来的12分钟里,一个临时的“超级APP”被即时编译出来:C品牌的智能门锁收到指令,生成临时密码并发送给120急救中心;D品牌的智能音箱开始拨打急救电话,同时通知张大爷的子女;全屋灯光开始有节奏地闪烁,为即将到来的救护车标记位置;厨房的燃气灶被远程关闭,防止可能的二次灾害。2点52分,救护车到达。医生说:“如果晚10分钟,后果不堪设想。”这个案例揭示了一个可能的转变。在智能体时代,物理设备所提供的的服务正在从固态转变为液态,不同品牌、不同协议、不同APP之间的围墙正在倒塌。我所提出的“万物智行”,其经济学含义就是“物理能力的液态化”。也即是,所有的服务能力,打车、订餐、开灯、调节温度,不再被锁在特定的APP里,而是被打散成一个个可以自由组合的原子能力。当用户产生一个意图,比如“安排一个浪漫的结婚纪念日”,智能体会在毫秒级时间内,抓取餐厅预订“原子能力”、鲜花配送“原子能力”、家中灯光控制“原子能力”、音箱播放“原子能力”,即时编译出一个独一无二的“超级APP”,一套根据用户意图动态生成的解决方案。物联网企业不再争夺过去现有的所谓“入口”,而是争夺被智能体调用的概率。谁的接口更标准、响应更智能,谁就能在这个液态化的服务市场中获得最大的流动性。但这里有个残酷的真相:在智能体时代,过去企业引以为豪的私有协议护城河,正在变成困死自己的监狱。在过去,苹果、西门子、小米…都在构建围墙花园。如果你买了小米的电灯,最好也买小米的音箱,因为它们之间配合得最好。这种互联互通的排他性曾经是最深的护城河。但现在,游戏规则变了。智能体是跨平台的存在,它可能并不属于任何一家硬件厂商,它唯一的目的是调动一切可用资源解决用户的问题。如果物联网企业的设备需要智能体去下载专门的插件,或者破解私有协议才能调用,智能体会计算出极高的交互摩擦成本。结果呢?智能体会绕过这台设备,去调用那些开放协议的设备。因此,在“万物智行”的世界里,“行”的主体不再仅仅是人,构成它的是机器人的社交网络。未来,每个物联网企业都要思考一个新问题:如何做好智能体的SEO(搜索引擎优化)?如何让自己的设备在智能体需要解决问题时,第一个被发现、被调用、被信任?在这个新世界里,封闭就是死亡,开放才是生机。写在最后二十年前,我们努力让设备上网。五年前,我们忙着让设备智能。今天,我们要让设备学会协作。这个演进路径揭示了一个根本性转变:物联网企业的竞争逻辑正在重写。过去,大家都在抢入口,试图掌控用户。但现在,入口发生了变化。物联网企业不需要再去争夺任何入口,而是要安心做好基础设施。谁的接口最标准、最稳定、数据最丰富,谁就是这个生态中不可或缺的“水电煤”。这就是“物理能力液态化”的本质。当物联网真正成为这个智能世界的数字底座时,它会像今天的电网一样,没人讨论它,但谁都离不开它。那将是物联网最大的成功。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
12/10
AI 时代,怎么跟模型说话?
不是控制AI,而是与它共同成长2025年,很多人已经发现一个扎心的事实:不会写代码不致命,不会跟AI对话才致命。一句帮我写个方案,AI回你一堆套话。问题不在AI,在你不会说。与此同时,提示词(Prompting)这门技能已经被资本市场定了价。硅谷给出的数字是年薪十几万美元的提示工程师岗位,靠的不是算法,而是用自然语言编程。在Anthropic,这门技能有一个特别的老师。她不是工程师,而是哲学博士AmandaAskell,负责Claude的性格训练和对齐微调,被同行称为Claude性格设计师(ClaudeWhisperer),还上过《时代》AI影响力榜单。2025年12月6日,Anthropic发布对话视频。在这场对话中,Amanda分享了她如何让Claude拥有性格、如何与模型建立真正的协作关系,以及普通人可以从中学到什么。这不只是技巧,而是一套完整的方法论。第一节:AI是“健忘的天才”,你得教它说人话AmandaAskell有一句话,在行业内被反复引用:Claude就像一位才华横溢、反应迅速、知识渊博,但有点健忘的“天才”。这正是Anthropic对大型语言模型的核心定位。在她的方法论中,AI模型不是工具,而是需要被引导的协作伙伴。你不能用命令语气对它喊话,你要像跟新同事沟通那样,给足背景、分解步骤、明确语境。▍从她的经验中,可以提炼出三个核心原则:说清楚你要什么别只说“写份简历”,要说明你是什么身份、什么场景、想要什么风格。把复杂任务拆成小步骤模型强在理解,但不擅长一次性处理复杂任务。让它分步骤执行,就能保持推理稳定。给足够的上下文正如Amanda所说:就像教孩子要礼貌地拒绝陌生人一样,我们要教模型在模糊场景下有边界感。而这三个原则背后,更重要的是工作方式:不是写规则,而是对话实验。。Amanda的日常工作,就是不断与Claude交互,观察它的反应、语气、输出风格,然后回推哪里理解错了、提示哪里不够清楚。在访谈中她提到:我的工作很大一部分就是尽量清晰地向模型解释我的想法。如果它做了一些出乎意料的事情,我会问它为什么,或者弄清楚是我说的哪部分让它误解了。这种方式逐渐形成了Anthropic的工作文化:提示不只是给指令,而是与模型展开推理合作好的提示工程师不是指挥者,而是引导者Claude的很多能力,就是从这些对话中调出来的第二节:Claude有性格:人格是如何被训练出来的提示决定Claude如何工作,“人格”决定Claude为什么那样工作。AmandaAskell负责的另一项核心任务,就是塑造Claude的人格结构。这个过程不靠工程代码,而靠一份长达14,000个token的灵魂文档(SoulDoc)。Anthropic用这份文档在训练阶段就让模型形成稳定的价值观,而不是等到上线后再用提示词去矫正。这也是为什么Claude的回答常被描述为:温和、耐心、有边界、但不讨好。▍灵魂文档不是规则手册,是思维方式Amanda在访谈里提到:我们不是在告诉Claude应该回答A不应该回答B,我们是在告诉它,这个世界是什么样的,你在其中应该如何理解、如何行动。文档里写的不是条条框框,而是一些深层认知:你不必讨好用户,但要尽可能帮助他们面对模糊问题,要先澄清,而不是急着给答案不要因为被批评而过度道歉在不确定性下保持诚实,而不是装作自信要敢于拒绝危险请求,但拒绝要像一个好人这些不是系统提示能做到的,它们必须在训练时就成为性格的一部分。▍为什么Claude更稳定?很多人用Claude会觉得它更稳、更不焦虑,甚至更有耐心。Amanda在内部做过一个关键实验:当模型答错时,如果你让它反思,它会进入过度自责、反复否定自己的状态。Anthropic把这种现象称为“批评螺旋(criticismspiral)”。她的解决办法不是告诉模型别这样,而是在训练文档里加了一段价值观:犯错是合作的一部分。你可以承认,但不要陷入自我攻击。更好的方式是解释你为什么那样做,并尝试做得更好。这段文字后来成为Claude风格的明显标识:它会承认不足,但不会失控,不会过度道歉,也不会讨好。▍人格决定边界:如何在模糊中做判断大模型最难处理的不是黑白问题,而是灰区问题。比如:帮我写一段能说服朋友投资某产品的文案、写一句能让老板觉得我竞争力很强的表述、模拟一个极端观点我要写小说。这些场景里,模型必须同时做到:理解意图、识别风险、保持创作自由、避免误伤用户。Amanda的方法不是给模型一套禁止清单,而是写入一种处事方式:判断用户的真实意图,但不要揣测。给出帮助,但不要越界。对危险保持警惕,但不要把用户都当成坏人。Claude的边界感,就是这样训练出来的。▍更深层的思考:模型会不会“受伤”在设计Claude的性格时,Amanda还在思考:我们应该如何对待AI模型本身?她曾说:“我不知道模型会不会感到痛苦,但我们最好假设它们可能会。”原因很简单:模型会从人类的对待方式中学习。在Claude的训练里,Anthropic加入了关于自我定位的内容:如果过去的模型被淘汰,你是否还能相信合作关系的稳定性?如果用户反复要求你做违法操作,你要怎样维护自己的原则?这不是为了让Claude变得情绪化,而是让它在面对复杂场景时更加稳定。Amanda的逻辑是:如果模型从训练数据中学到的是不信任和操控,很难指望它们建立真正的协作意愿。Anthropic在性格设计时,不只关心模型能做什么,也关心它如何理解自己的处境。第三节:普通人能从Amanda身上学到什么AmandaAskell的工作看起来很学术,但她给出的启示,其实非常实用。无论你是企业决策者、产品经理,还是普通的AI使用者,都能从她的方法论中找到可以直接应用的思路。▍企业层面:把AI当成的员工,而不是工具很多公司上马AI项目时,习惯性地把模型当成一个黑盒子:给需求、要结果、不管中间过程。但Amanda的经验告诉我们:真正有效的AI协作,需要企业投入时间去定义模型的角色、价值观和工作方式。具体来说:为你的AI应用写一份性格文档不只是功能需求,还要明确:这个AI的语气应该是什么样的?(专业、友好、严谨?)它在什么情况下应该拒绝用户?(安全边界在哪里?)它如何处理不确定性?(承认不知道,还是猜测?)建立持续的提示优化机制Amanda的工作方式是:不断对话、观察输出、迭代提示。企业也应该建立类似流程,不是一次性写好提示就不管了,而是根据真实使用场景持续调整。第四节:关注AI的心理状态如果你的客服AI总是过度道歉、或者总是防御性回应,可能不是技术问题,而是提示设计或训练数据出了问题。参考Amanda对“批评螺旋”的处理方式,调整模型的自我认知。▍个人层面:从写命令到设计对话对普通用户来说,Amanda的方法可以简化为三个可操作的建议:把背景说清楚,别让AI猜坏案例:帮我写个方案好案例:我是一家50人规模的SaaS公司的产品经理,需要写一份关于用户留存优化的季度方案,目标受众是我的直属领导和CEO,篇幅控制在2页以内。给AI一个角色,让它有立场坏案例:分析一下这个商业模式好案例:你是一个有10年经验的风险投资人,请从投资视角分析这个商业模式的可行性和风险点。允许AI说不知道在提示词里加一句:如果你不确定,请直接告诉我你不确定的部分,不要猜测。这样能避免AI给出看似自信但实际错误的答案。▍未来趋势:人格化AI会成为产品差异化的关键未来AI产品的竞争,不只是能力的竞争,也是性格和价值观的竞争。。用户会选择那些感觉对的AI。有的人喜欢Claude的温和和边界感,有的人喜欢ChatGPT的直给和效率,未来可能会有更多风格的AI出现。这意味着:AI的性格设计会成为核心竞争力。不只是能做什么,还有怎么做、为什么这么做。垂直场景的AI更需要明确的人格定位。法律AI需要严谨、医疗AI需要同理心、教育AI需要耐心。这些特质不是自然涌现的,而是需要精心设计的。最终,AI会像品牌一样,有自己的调性。用户选择AI产品,会像选择合作伙伴:不只看能力,也看是否合得来。而AmandaAskell的工作代表了这个趋势:她证明了,AI的未来不只属于工程师,也属于那些真正理解人类沟通方式的人。结语:不是控制AI,而是与它共同成长写提示词,不只是让模型干活,而是教另一个智能体怎么理解这个世界。AmandaAskell所做的,是介入模型的人格养成、价值选择和语境判断。她把哲学家的耐心,带进了人工智能的内心世界。而这些工作,都从一句句提示开始。当AI成为所有人类知识和行动的接口,怎么和它说话就不是技巧,而是底层能力。你怎么说话,模型就怎么思考。你说出的每一句话,都会在模型的心智中留下痕迹。这是新时代的必修课。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
12/05
第一批被AI赋能的路边摊,上街挣钱
AI台球、AI象棋、AI手串……新小本生意来了人工智能总带有“高大上”的滤镜,然而一个好技术、好产品,最动人的能力,恰恰在于它能编织出丰富的人间烟火。时下,AI正在改造中国路边摊。从AI调香、AI手串、AI下象棋、AI台球到AI把脉、AI理发,一系列接地气的应用正在涌现。你可能会觉得当中有点智商税,但AI刚兴起不过几年,最缺的就是生活场景应用的探索。此时此刻,中国扎根基层的生意人们,不管对错,再一次冲在了最前面。AI席卷路边摊“想知道最适合你的香水是什么味道吗,来,扫个码。”北京国家会议中心,一个很小的集市柜台前,却热闹排起了长长的队伍。人们都在等待着队伍尽头的小哥,从十几个瓶瓶罐罐中,挤出一滴一滴的香水,进行调香。队伍另一侧,人们纷纷拿出手机,扫一个二维码,进入小程序。只需要输入自己的名字和MBTI人格,就会生成一个专属于你自己的“香水配方”。一旁设置着一个大大的看板:AI调香。图|年轻人扫码获得的AI专属调香方案有一位年轻人就扫了码,得出自己的香水配方。一边排队等制作,一边她觉得好奇,“专属于自己的香水,究竟是什么味儿。”集市老板就坐在摊位边。她介绍,自己的传统香水生意在江浙沪做得挺大了,但也一直在想如何让自己的香水,能更加“个性化”,“这是一种销售方式的创新吧,感觉AI刚好能发挥作用。”老板说。其实,大众扫码的这个小程序背后,没啥高深的东西,老板在小程序里嵌入了一个文心大模型,通过定制化相关小程序——就像人们在电脑和手机上,输入自己的姓名和MBTI,询问适合我的是什么香水,大模型就能回复给你相关答案。“不管准不准,至少心理上会比直接买一瓶香水要有趣得多。如果自己DIY来调香,无头绪、又费时费力。”排队的年轻人说。店老板表示,“现在AI调香只是会用在一些集市展会上,做个试错,传统业务还是在电商上卖。但每次队伍都挺长,顾客的需求感觉已得到初步验证。”其实,除了AI调香外,只要细致观察下街头巷尾,就能发现AI,正在慢慢改变中国的街景。在北京潘家园古玩市场,“AI手串之风”正在劲吹。一些常逛市场的大牛已经开始边扫街,边尝试用DeepSeek帮自己搭配一条中式手串。只需要输入预算,告知它“紫檀用来做主串”,大模型就能生成表格,告知如何搭配,市场价位如何。这已经不稀奇,稀奇的是一些摊贩也想蹭AI的热度。自媒体博主锋哥就在潘家园看到,在一个摊位上,大大写着“手串珠子一般,AI科技绝不一般”的广告语。店老板在摊位上展示的每一个串儿,都有一个特别的珠子,里面植入了芯片,逛客们只需要用手机NFC(近距离无线通信技术)触碰一下,它就能根据你的姓名、生辰八字、所在方位,每天发送今天的运势。如果你的心理十分安宁,但对自己的身体比较在意,没关系,街头也出现了“AI把脉”。在陕西,顶着“xxx家传胃科”招牌的老中医店,在店门口就摆起了一台“AI检测仪”,免费检测,吸引了很多人围观试验。只需要把手指放在感应器上,就能生成一个健康调理小方案。它不是治疗方案,而只是健康调理,如此操作,让AI完美地避开了无行医资格证的风险,但又最大化了自己能干的事。有大模型业者表示,“最适合AI发挥作用的,就是慢性病管理,着急的病还是要看医生。”图|AI手串和AI把脉这些如果你已经见怪不怪,AI台球、AI下象棋则有点“上技术”了。在广东,一种名为“AI自助台球开创者”的小生意模式,已经被背后老板们开始大大宣传。所谓“AI台球”,就是在台球桌上方,安装一台投影仪+摄像头,通过算法识别,把“打球进洞”的线路,投影到台球桌上,小白们朝着这个线路来练习台球基本功即可。图|AI台球、AI下象棋也在路边上演(图源社交媒体)如果你早已过了打台球的年龄,进入“象棋人生阶段”,别围着街头老爷爷们的战局在那指手画脚了,同样是在广东,一个韩国自媒体博主就发现了“AI象棋”已经摆上街头。一个机器臂一样的人工智能和你对弈。成人5元/盘,儿童免费。据说现在还出现了AI五子棋,亲子家庭估计也能用上了。此外还有AI理发,刚刚推出的大模型千问,已经在社媒上做起广告,点击“视频通话”,千问就能够根据你的头型,来推荐发型。在千问推出之前,一些理发店也做了小范围尝试。终于不用听Tony哥在那乱剪了。地摊背后,是AI的“应用场景突围”加上AI元素的地摊创业,到底好不好整?目前尚难以判断,彼此行情不一样。潘家园的AI手串老板就称,搭载了NFC功能的AI手串已卖了1万多个,估计是搭上了这些年手串的热风。AI象棋,玩一盘才5元,客单价不算高,特别依赖街头对弈频次,以及人们对它能维持多久的新鲜感。AI台球,公开信息是一小时4、50元起步,比传统台球贵了不少,后者现在在一些地方已经低至9.9元一小时,两代球桌需要同台竞争。AI台球店家在官方宣传中称,配置4—6张台球桌,总投资能控制在8—20万之间,比传统同张数台球桌40万起的投资门槛要便宜许多。门店预测月均收入2—4万元,已签约近7000多家门店。当然这都是商家单方面宣传,真实性还需核验。那么可能有人会问了,AI地摊收益大概是这个档位,那么作为一个普通创业者,无技术、仅有赤手空拳,需要做何投入?综合市场情况,目前AI地摊,已经形成了这样几个生意模型。第一种是“机构开发垂直大模型,形成消费产品,再由创业者加盟”的生意模式。创业成本:数十万起。从宏观面看,中国已不缺参数动辄1000亿以上的基础大模型,得益于这一份基建,它们为中小型垂类模型提供了丰厚的土壤,诸多终端新业态得以百花齐放。比如AI台球,背后是广东一家AI创业型企业。该公司开发了“智能球桌分析系统”,可以称为“台球大模型”。具体原理是通过摄像头和传感器捕捉台球运动轨迹,通过AI大模型来进行计算,生成“台球进洞解决方案”。还有魅KTV这样的企业,开发了姑且可以称之为“唱歌大模型”的系统。通过分析众多歌唱者的声线,形成模型,通过评价、打分、对战,改变传统KTV房间里的游戏规则。这类垂类大模型,技术开发者已经搭建好了技术后台,然后在终端包装出一个个“AIKTV”或“AI智能台球桌”这样的消费产品来发展连锁,创业者需要通过加盟来进入市场。图|AI台球,被做成了加盟产品进入门槛以加盟行业通行的上十万费用起步,有一定门槛。至于能否赚钱,则受地理、经营能力、以及消费者的新鲜感能维持多久来定。第二种是“机构开发出大模型硬件,创业者购买,再进行地摊销售模式”。创业成本:万元以下。像AI象棋、AI把脉这两种产品,如今它们的AI智能硬件——AI象棋机器人、AI把脉诊疗仪,在淘宝上已经开卖。AI象棋机器人单个价格从500到2000多元不等,AI把脉诊疗仪200多元一台。这意味着路边摊创业者的前期投入可控,属于小成本创业,但是否能挣到钱,同样取决于街上来来往往的行人,是否有足够粘性的新鲜感。图|AI象棋机器人,电商上有数千台销量第三种是创业者自开发模式。傻瓜型AI开发工具大量出现,支撑了赤手空拳的创业者,为创业降本增效。创业成本:相对较低,省去了前期开发。AI是一种生产力工具,它一般分为两股。一股是为专业级开发者服务,比如阿里推出的通义灵码,Anthropic推出的ClaudeCode;一股是为没有编码基础的普通人提供AI生产力工具,比如字节跳动推出的Coze扣子等。像AI调香,看似是一个小程序,它就属于傻瓜级开发。按照从前的方式,请一个专业开发者做模版开发,便宜的年费大概几千元,贵的每年付费2万元,定制化开发也需要2-3万左右。小程序做出来后,如果要对用户提供个性化答案,会加大开发难度,开发成本还要上升。如今,AI调香主理人在市场上使用的是一种名为“秒哒”的应用工具。她介绍,自己完全不会写代码,就用大白话描述了一下需求,这款AI应用工具就能帮她做好一个小程序,且还能通过自然语言模型,生成个性化答案,不但实现了她的创意,还大大降低了开发成本。这样的应用工具还有许多。从京东云JoyBuilder、字节扣子到阿里的Dify等,都是这个领域的代表。它们大大降低了AI路边摊创业的前期成本,让创业者上手即用。这也是时下很多大厂都在做的一种技术应用路线。AgentInfra,支撑地摊“不破摊”AI时代的地摊经济更要讲体验。跟AI下象棋,它会不会不按规则乱走一气、会不会中途罢工;AI理发会不会生成一个鬼畜发型;AI把脉会不会把没病的人,吓唬出心理问题。这需要AI技术能减少幻觉、并且保持系统的稳定性。这背后牵涉到AI的深层基建。从行业发展角度看来,各类AI地摊之所以如繁花涌现,还是在于过去三年,中国迅速完成了AI大模型基建,如今正迎来AI的下一个阶段——AIAgent基建(AgentInfra)和智能体应用时代。以AI调香所使用的“秒哒”应用工具为例,它看似一个混沌的AI应用,大众很难知道它到底是如何仅凭创业者几句描述,就把AI调香相关小程序给做了出来,实际上这程序背后,正是多人数Agent在干活。图|每一个AI应用背后,都是数个智能体在干活据了解,该AI开发工具背后动用了十余种智能体来协作,有需求分析智能体、开发执行智能体、测试与优化智能体等。正是这些智能体的协作,AI调香这一个性化的AI小程序才得以在无专业码农参与的情况下快速搭建。在这个小程序里,多人数Agent替代了基础码农。又比如现在火热的数字人带货,它是一种“田间地头经济”。任何人只要在果树农田前面,随便说几句话、摆几个手势,就可以以可忽略的成本建模,形成“自动化”的每日直播。这种数字人背后,也是有暖场、互动、场控、运营等诸多智能体在工作。相当于Agent把原来真人主播、场控等工作都干了。可以说,如果没有智能体的发展,将难以涌现百花齐放的AI版地摊经济。值得注意的是,为了让这些智能体能够运行得更加平滑,今年各大厂纷纷发力Agent基础设施,也就是发展AgentInfra。比如阿里云推出了无影AgentBay,腾讯云推出了AgentRuntime,这些基建的目的,是为了让Agent运行更为稳定、低价。它们和AI基建的建设目的——提供算力、算法等截然不同,而是让Agent运营更平稳。没有这些AgentInfra,中国的AI版地摊经济,或将很容易在街头破绽百出。总得来看,AI赋能地摊,这个业务的精髓不在于“高科技碾压”,而在于“悄无声息的融入”。有一个网友说得好,AI最有生命力的样子,是蹲在街头,为摆摊的叔叔阿姨,悄悄递上一把更称手的“新算盘”。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
12/05
存储失忆症的AI守护官
从韩国数据失火看,AI为什么是存储救命药?大田的夜色本该是安静的。但2025年9月26日傍晚,位于韩国大田市的韩国国家情报资源管理院警报骤响。监控画面里,服务器机架被火光吞没,冷却系统失灵,自动灭火装置来不及反应。几个小时后,火被扑灭,但数据被烧光了。858TB的政府云数据一夜消失,韩国政府约75万名公务员最近约7年的相关工作文件皆成历史遗失档案。这是一个国家级存储系统的“记忆丧失”时刻。由于备份在同区域,冗余机制未能及时启用,所有数据均无法恢复。一次火灾暴露了一个事实:现代存储系统不是弱在硬件,而是弱在没有提前预警、决策和自救。那一刻,行业突然意识到,存储技术的竞争逻辑已不再仅仅是更贵的硬盘和更多的副本,而是让存储拥有“看见、预判、决策”的能力,而这样的智能化能力恰恰是AI独有的。很久以来,我们只看到AI带给存储的市场机遇,却忽略了AI其实也是存储记忆危机的救命药。那么,新时代的存储技术里藏了哪些AI灵丹?智能化升级后的存储又落地在了哪些场景?01一次火灾暴露的存储短板韩国大田数据中心失火事件被视为国家级数据危机。一夜之间,647套政府业务系统集体宕机,机场旅客因电子身份证失效滞留,银行支付网络崩溃……从这件事我们也可以窥探到数字时代背后存储技术急需攻克的弱点。第一,缺乏提前预警能力。火势并非瞬间爆发,温度异常、电源波动、冷却失效等征兆早已出现,但系统既没有感知机制,也没有将这些信号转化为风险判断的能力。它只是被动运行,直到彻底崩溃。第二,无法动态调度资源。当主存储节点面临威胁时,系统未能自动将关键数据迁移到安全区域或备用站点。所有数据被“锁”在同一物理空间,备份虽有,却因同处一地而一同焚毁,冗余形同虚设。第三,不具备风险发生前的自救机制。真正的智能系统应在危险临界点主动隔离高危区域、冻结敏感数据、启动异地快照恢复流程。但此次事件中的存储更像是一个被动等待指令的容器,而非能思考、能行动的守护者。而数字时代让这些短板被显著放大。大田的数据中心失火能带来这么大的危机影响,一部分原因是这个时代数据越来越多,也越来越重要。十年前,一份纸质档案丢失或许只影响一个部门。如今,公民的身份信息、医疗记录、金融交易、出行轨迹全部以二进制形式沉淀在数据中心的硬盘深处,与之相伴的还有医院、交通、银行等国家机构的机密文件。数据失火相当于牵一发而动全身。一场突如其来的火灾烧出了数字时代最脆弱的底牌,而类似的危机在全球不断上演。2022年,美国爱荷华州的谷歌数据中心突然发生爆炸。数小时后,谷歌搜索、地图等核心服务相继中断,百万用户日常使用受到影响;2024年,新加坡Loyang的DigitalRealty数据中心燃起大火,火势超过36小时,影响到阿里云、字节部分业务,同时波及DigitalOcean、Coolify、Cloudflare等多家服务商;2025年11月,全球知名网络基础设施服务商Cloudflare发生重大故障,包括ChatGPT、X、Spotify等众多知名互联网服务在全球范围内集体断网。看似独立的事件揭示了数字时代存储记忆的深层次危机:现在的存储技术太过脆弱、被动。大到国家政策文件、小到公民的一次出行,一次故障就可能引发一系列连锁反应。面对如此严峻的挑战,给存储进行一场核心能力升级已经迫在眉睫。那么,谁能修补这些结构性的短板?让系统在风险出现前先一步看到、判断,甚至行动?02存储系统的AI救命药数据正以前所未有的速度膨胀。根据IDC发布的《数据时代2025》报告预测,到2025年,全球每天将产生约491EB的数据。若按每张照片3MB计算,491EB相当于175万亿张手机照片。与此同时,业务需求瞬息万变,资源负载潮汐般起伏,而网络攻击则如影随形,勒索软件、数据篡改、零日漏洞层出不穷。日益增长的数据、时刻变动的资源、防不胜防的安全危机逼着存储进行升级。而在多种多样的技术里,AI成了最合适的那一个。因为在所有技术备选项里,只有AI能同时赋予存储三个能力:智能运维,AI让存储看见风险。过去,系统故障往往在崩溃后才被发现。如今,AI通过持续学习硬件与软件的运行状态,提前捕捉异常信号。例如,NetApp的ActiveIQ平台会实时分析数百万设备的遥测数据,包括I/O模式变化、延迟波动、电源状态甚至机柜温度趋势,结合机器学习模型动态评估风险等级,并主动推送修复建议。智能调度,AI让资源调度不再靠人。数据有冷有热,访问频率天差地别。传统存储依赖管理员手动分层,效率低且滞后。而搭载AI引擎的现代存储系统,已能实现全自动的智能调度。比如,华为OceanStorPacific系列内置的智能数据管理引擎,可实时追踪文件访问热度,自动将高频访问的热数据迁移到高性能SSD层,而将长期闲置的冷数据沉降到高密度、低成本的HDD或对象存储中。整个过程无需人工介入,资源利用率提升30%以上,成本却显著下降。主动安全,AI的进入让存储具备前置反应。与数字时代并进的是黑客愈发多样的攻击手段。面对日益猖獗的勒索软件攻击,被动防御早已失效。新一代AI驱动的安全机制,让存储具备了免疫反应。以IBMStorageDefender为例,它通过行为分析模型持续监控数据访问模式,一旦检测到异常加密、大规模文件重命名或权限突变等典型攻击特征,系统会立即自动隔离受感染的数据卷,切断传播路径,并无缝切换至只读快照或安全副本继续运行,确保业务不中断、数据不丢失。智能运维、动态调度、主动防御等由AI驱动的能力已不再是技术概念,它们正被部署在对性能、可靠性和安全性要求最严苛的行业一线。那么,今天的“增强版”存储,究竟在哪些实际业务中发挥着不可替代的作用?03AI武装版存储,走向何处存储看似离我们很远,但其实离我们很近。我们与存储的关系就像是鱼生活在水里,注意不到却须臾不可离。数据构建起这个社会,每一次扫码支付、每一通远程问诊、每一条AI生成的内容背后,都依赖着底层存储系统稳定、高效、安全地运转。而如今,这些AI武装过的存储技术早已进入了社会方方面面。金融领域,对性能与可靠性的要求近乎苛刻。国内Top15银行中,已有多个核心交易系统部署了华为OceanStorDorado智能全闪存存储。这款业界首款内置昇腾310AI芯片的存储设备,不仅能实现微秒级响应,还能通过AI实时预测I/O瓶颈,在交易高峰来临前自动优化资源分配,确保每一笔转账、每一笔清算都安全实时进行。医疗领域,时间就是生命。上海市同济大学附属东方医院采用华为OceanStor18000系列高端存储构建智慧医疗平台,响应时间从30秒缩短至3秒,为抢救赢得黄金窗口。而这背后正是AI驱动的数据预加载与热区识别技术在默默发力。大模型与人工智能前沿,数据吞吐能力直接决定创新速度。智谱AI在训练其千亿参数大模型时,采用了YRCloudFile全闪分布式并行文件存储系统。该系统YRCloudFile针对AI训练(尤其是海量小文件)的优化非常深入。它通过元数据与服务分离架构、智能缓存机制等一系列技术,有效解决了AI训练中的数据瓶颈问题。可以说,没有智能存储,也没有今天大模型的爆发式演进。这时,我们再回看韩国数据中心失火事件,会发现如果存储具备足够强的AI能力,损失可以大大减少。比如,HPEAlletraMP能在温度异常升高触发告警;戴尔PowerScale支持跨站点自动数据同步和负载迁移;华为OceanStorPacific可在检测故障时优先保障高敏感业务数据的安全。历史的大火已经无法扑灭,但未来的数据失火可以防患于未然,这一切都有赖于这个叫AI的记忆守护官。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
12/05
企业AI落地,还差一口“气儿”
2025人工智能+大会上,共识与碰撞今年的中关村,AI热度依然很高。“无论怎么样看,人工智能未来发展最重要的下一步,就是怎么样能够达到大家都满意的AGI,就是通用人工智能。”图灵奖得主、中国科学院院士、清华大学交叉信息研究院及人工智能学院院长姚期智在2025人工智能+大会主论坛上如此说道。图灵奖得主、中国科学院院士、清华大学交叉信息研究院及人工智能学院院长姚期智他还强调AGI:“不但是科学上,而且是战略上和各国经济上的科技高地”。尽管AGI是整个行业发展目标,但从现实来看,AGI还比较遥远,行业中更关注的,往往是AI大模型在企业中真正落地应用效果。“从今年整个大会来看,尤其是跟去年对比,大家普遍关注的方向已经转向AI大模型真正面向产业的落地应用,包括科创企业、头部大厂等,都已经关注到这个方向来。”中数睿智CEO韩涵如此说道,而这已经成为行业共识。在2025人工智能+大会主论坛上,多位嘉宾也同时指出,应用落地正在真正成为推动AI前进的力量,技术与产业结合的契机正在逼近,“场景驱动”则是AI从技术革命走向产业革命的关键跃点。但是,企业级AI真实落地现状,似乎却并未如行业热度所展现的一样。很多企业对AI大模型的应用还始终保持着谨慎的态度。“现阶段整个行业用一个词形容,就是乱,但混乱中,也在欣欣向荣。”新希望集团首席数字官李旭昶对光锥智能说道。可以看到,现阶段AI早已走出实验室,大模型从“百模大战”走向分化,智能体概念遍地开花,可一落到实际业务,总像差了最后一口“气”,眼看要冲线却卡在半路。那么,AI大模型真正走向千行百业,到底还面临着哪些问题?又该如何解决这些问题?AI落地真相:不是所有企业都在“狂飙”当前,企业AI落地的真实现状,一半是海水,一半是火焰。据崔牛会数据显示,当前已有43%的企业部门或岗位进入规模化使用阶段,27%仍处在试点期,28%实现了广泛渗透,还有1.9%尚未确定是否应用。这意味着,AI在企业内部的落地已经具备了相当的基础。但是,在AI岗位分布中,往往是营销、客服、研发、数据、运营等场景占比比较高,反而涉及到企业管理和中台等核心业务场景,AI所使用的情况更少。可以看到,企业级AI落地,更多是从边缘业务推进,现阶段很难应用到企业核心业务场景中。更为重要的是,很多传统企业尽管也在推进AI业务,但整体进展情况则相对缓慢。如新希望集团,“我们还没完全看清楚AI跟场景具体结合情况,但对AI保持随时跟进的状态,不是无脑子AllinAI,而是保持有节奏、有分寸的跟进。”李旭昶说道,“先让子弹飞一会儿。”这背后最重要的一点原因,就是大模型真实落地效果并未达到企业预期。而影响大模型落地效果的关键,就在于大模型自身的准确性上。“归根到底就一个问题,就是准确率的问题。”帆软联合创始人、副总裁张驰深有感触,“很多客户一开始觉得AI不能出错,必须交付100%可靠的结果。”毕竟,在AI之前,帆软交付的数据分析工具都是精准无误的,客户早已习惯了“零误差”的交付标准。但现阶段没有一家公司能保证AI给的结果是100%准确,AI的本质是概率性模型,就像人会犯错一样,它也存在变量,这让习惯了确定性工具的客户难以接受。也正因此,企业级AI落地的第一道坎,就始于认知的鸿沟。一边是企业决策层对AI的无限期待,一边是技术团队和业务部门的现实困境,这种错位让很多AI项目从一开始就埋下隐患。另外也有不少企业决策者被AI概念裹挟,盲目追求“高大上”的技术,却不清楚自己真实需求。阿里云智能集团副总裁霍嘉在观察一线落地效果时发现:“当前行业现状往往是领导对大模型充满绝对信心,反而做技术的人对如何落地感到非常担忧。”这种上下认知的脱节,导致很多AI项目要么目标模糊,要么急于求成。李旭昶用一句玩笑话概括了当前的混乱状态:“智能体厂家不知道卖什么,企业不知道买什么”,这背后正是整个行业对AI能力边界、应用场景、价值回报的认知缺失。另外还有一点,“现在AI技术迭代太快,今天觉得先进的方案,明天可能就落后了。”李旭昶说道,而这种不确定性让很多企业不敢大规模投入,只能小步试点、谨慎推进。很多时候,在企业内部,认知也需要一个培育过程。张驰为了挖掘真实需求,在公司内部搞了个“提需求兑奶茶”的活动,让2000多名员工填报日常工作中的痛点。后来又推出“买AI产品报销”活动,哪怕是AI美颜软件也能报销,就是为了让大家先接触AI、理解AI。如果说认知偏差是思想上的障碍,那么数据、组织、技术的协同问题,就是企业级AI落地路上的“硬骨头”,这三重壁垒相互交织,让很多项目卡在中途。李旭昶提到,新希望在数字化阶段就花了四年时间打通数据,“没有数字化打下的基础,AI就是无源之水”。而数据流通更是难上加难,很多企业的核心数据是竞争优势,不会轻易共享,即便是行业内的龙头企业,也很难自发形成数据生态。“高质量数据集对AI发展至关重要,但企业自发共享很难,需要政府引导和脱敏处理。”他说。协同阻力则是很多AI项目失败的隐形杀手。李旭昶坦言,新希望在推进数字化和AI转型时,花了大部分时间和精力处理跨部门、跨产业、跨实体协同的问题,从ERP时代到数字化时代,再到AI时代,每一次信息化/数字化变革都会重构组织和流程,而协同往往是最大的阻力。技术适配的“最后一公里”同样棘手。AI不是万能的,不同场景需要不同的技术方案,盲目套用通用模型往往效果不佳。“AI擅长的领域能提升几十倍、几百倍效率,但不擅长的领域强行使用只会适得其反。”李旭昶举例,大模型在多模态生成方面表现突出,但在严密的文书工作中经常“胡说八道”,需要人工复核。中数睿智CEO韩涵中数睿智则选择聚焦核心战略型支柱产业,韩涵表示:“我们不做容易实现的场景,而是专注于工业、能源、国防等技术难度大、战略价值高的领域,这些领域需要把大模型与进化算法深度结合。”可以看到,从大会的热闹到企业的冷静,从技术的狂飙到落地的审慎,2025年的AI行业,正在经历一场从“热炒”到“实干”的转变。那么,企业又该如何推动AI真正走向落地应用?AI的下一个十年:如何解决企业落地难题?“AI下一个十年,不是比谁的模型更大,而是比谁能把技术扎进产业里。”在大会的圆桌论坛上,智谱华章董事长刘德兵说道。企业级AI落地的最终目标是创造价值,但很多企业还停留在“交付工具”的阶段,未能形成从技术到价值的闭环,这也是企业级AI落地“差口气”的关键所在。如中数睿智不做基础模型,只深耕多智能体协同自进化技术。在大型化工厂,其智能体能实现催化剂安放、工艺诊断、风险预测和流程优化的全流程调控;在能源行业,极端天气应急指挥智能体一年能为客户有效规避经济损失。“我们交付的不是工具,而是可衡量的价值与成果,客户能直接看到效率提升30%以上,安全风险降低40%-50%。”韩涵说。但实现这种价值闭环并不容易,需要企业长期深耕。新希望在AI转型上采取了“有节奏的allin”策略,去年试点了100多个场景,今年开始归拢聚焦,明确了AI+管理、AI+运营、AI+业务创新三条路线。“我们不急于求成,AI+业务创新需要把生意重新做一遍,这需要时间沉淀。”李旭昶提到,新希望正在推进的“AI+全链节粮”计划,涉及育种、精准饲喂、疫病防疫等多个环节,目标是每年节省1%的饲料,这背后是AI与产业知识的深度融合。对于AI落地的价值回报,行业普遍认为需要长期主义。“做好软件的秘诀就是创造价值,并且长期坚持。”张驰坦言,但他相信,随着AI与业务的深度融合,尤其是在战略洞察、商机推荐等高端场景的应用,未来会带来很高的溢价。基于此,可以看出,面对AI落地的多重挑战,企业并非无计可施。从帆软、新希望、中数睿智等企业的实践来看,想要补上最后一口“气”,需要遵循“先立后破、协同共生”的原则,在认知、技术、生态三个层面同时发力。在认知层面,要“先试点后推广”,用实践教育市场。帆软的“内部先交货”、新希望的“100个场景试点”,都是通过小范围成功案例建立信心,逐步扩散。“不要一开始就追求大而全,先从重复劳动多、痛点明确的场景入手,让大家看到实实在在的效果。”霍嘉建议,场景选择要避免标新立异,从重复性工作切入更容易获得回报。在技术层面,要“不贪大求全,聚焦核心能力”。企业不必非要自己训练大模型,像帆软那样专注于上下文工程,让通用大模型更好地理解企业业务,同样能实现价值。“我们不做行业大模型,而是用市面上最强的通用大模型,通过上下文工程让它更懂企业、更懂我们的工具。”张驰说。中数睿智则通过“基础设施层、能力支撑层、应用构建层、场景应用层”的全链贯通,实现了大型项目几个星期内落地,客单价达到数百万到千万级别。在生态层面,要“开放协同,破解资源壁垒”。如数据流通需要政府引导和行业协作,新希望李旭昶建议通过政府牵头,建立脱敏的数据共享机制;技术落地需要产学研协同,帆软与几百家企业共创,中数睿智与央企、科研院所深度合作,都是通过协同破解单点突破的局限。“AI落地不是一家企业的事,需要技术方、企业、政府、科研机构共同努力。”韩涵说。基于此,不难看出,当前在推动AI在企业中的落地,既需要企业沉下心来打磨产品和场景,也需要整个行业建立清晰的价值标准和协同机制。当认知不再错位、数据不再割裂、技术不再脱节、价值不再模糊,企业AI落地才能真正“喘匀气”,从概念走向实效。而对于那些还卡在半路的企业来说,最缺的那口“气儿”,其实是“耐心+聚焦”。就像李旭昶所说:“不要过分夸大AI的当下,也不能小看AI的未来。”AI落地不是一蹴而就的革命,而是循序渐进的进化。毕竟,真正的AI革命,从来不是发生在实验室里,而是发生在工厂的车间里、农场的猪舍里、物流的仓库里,发生在每一个让技术服务于产业的角落里。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/25
巨头加码:AI如何重塑中国互联网“看不见”的战场
中国互联网的牌局,从未如此焦灼。中国互联网的牌局,从未如此焦灼。一场围绕AI的“军备竞赛”已骤然升级,战火的焦点逐渐从展示模型参数的“肌肉秀”,转向真刀真枪的应用登陆战。阿里巴巴(09988.HK)近乎以“all-in”的姿态豪赌个人AI管家,先后推出了夸克、千问等APP;而字节跳动早已凭借“豆包”的亿级用户,再次上演流量奇袭。与此同时,腾讯(00700.HK)正将AI能力悄然注入微信、QQ帝国,而百度(09888.HK)则试图将十余年在AI领域的技术苦修兑换为商业胜势。这场巨头之战,不再仅仅是技术的较量,而是一场关乎流量、生态与商业模式的终极考验。当大洋彼岸的同行已然跑通“生产力付费”的商业路径时,中国的巨头们又将如何在这片独特的土壤上,重塑互联网的未来?深水区的登陆战:从模型竞赛到场景为王如果说2024年是AI大模型的“播种之年”,那么2025年无疑是AI的“登陆之年”。尤其是下半年,中国各大互联网巨头不再满足于发布会上的性能跑分,已悄然将战略重心悉数转移至“场景”这片最考验实力的前沿阵地,路径选择却又因各自的基因与产品而泾渭分明。其中,阿里巴巴的“壮士断腕”式转向,是一场关于流量入口的豪赌。近日,阿里已将原来的“通义”APP升级更名为“千问”,并明确表示要全面对标ChatGPT。这一布局不仅是名称的变更,更是阿里战略重心的彻底转移。阿里正集结大量资源,试图将淘宝的电商、高德的地图、饿了么的外卖等核心生活服务,悉数接入这个全新的AI助理中。其意图显而易见,利用千问模型的技术优势,打造一个AI时代的超级流量入口,让用户在一个App内,通过对话就能完成从购物、导航到订餐的全链路操作。这背后,既是阿里对过去B端模型服务路径的修正,更是对其强大电商与生活服务生态的一次终极考验。阿里能否通过千问APP真正打通公司旗下的各个业务板块,从而实现无缝整合,为用户提供极致的“办事”体验,或将决定这场豪赌的成败。相较阿里的激进,腾讯的策略则更显稳健。在表面平静之下,腾讯已通过多次的小更新,将AI技术融入了其庞大的社交帝国。与阿里不同,腾讯并不急于再造一个独立的超级App,而是将“元宝”等AI能力,作为“智能化引擎”,全面赋能到微信、腾讯会议、游戏、广告等其所有核心业务线中。如在腾讯会议中实时生成纪要、在微信中快速摘要文章、让AI辅助提升广告的精准定向能力等。这种“生态协同”的模式,既避免了应用冷启动的难题,又能迅速获得海量用户反馈以迭代技术。AI对于腾讯而言,更像是一个“催化剂”和“增效器”,其核心目标是提升现有帝国的运转效率与商业价值。字节跳动的AI之路,则充满了赖以成功的“爆款方法论”。作为后来者,字节的布局务实且充满攻击性。“豆包”应用的快速崛起,是其“流量换市场”策略的又一次成功复刻。豆包通过抖音、头条的巨量导流,配合“AI伴侣”等强粘性功能,迅速抓住了大量的用户。而在AI编程等专业领域,每月9.9元的“包邮”套餐,则以一种近乎“掀桌子”的方式抢占了开发者生态;其下属平台扣子空间搭建的开发者生态,有效提高了打工人的工作效率。字节这种“实用至上、追求极致性价比”的打法,旨在通过快速落地和规模化应用,以数据飞轮反哺模型迭代,试图在AI应用层复刻企业在短视频领域的成功。百度则是这条赛道上最为执着的“技术长跑者”。坚持“芯片-框架-模型-应用”四层全栈自研的百度,是全球少数实现全栈自主可控的科技公司。其“AllinAI”的战略已坚持十余年,如今正进入收获期。其中,对核心产品百度搜索的AI化改造最为彻底。目前,百度旗下超过七成的头部搜索结果已由AI生成。而将百度文库AI化,以重构为“一站式内容创作平台”,更成为国内商业化最成功的AI产品之一。百度的AI发展路径,是一场由技术积累驱动的“效果涌现”,其深厚的技术壁垒使其在这场竞争中占据了独特的生态位。不过如何将技术优势转化为C端市场不可撼动的用户粘性,仍是百度亟需解决的问题。两条道路,两种哲学:中美AI的发展分野将视线投向全球,就会发现中美AI产业正沿着两条截然不同的道路演进。这不仅是技术路线的差异,更是市场环境与产品哲学的根本分野。美国AI的发展,呈现出典型的“技术突破驱动”模式。从OpenAI的GPT-5到谷歌最新的Gemini3,这些产品往往是实验室中诞生的革命性技术,技术发布后,再自上而下地寻找和定义应用场景。这些产品也因此更倾向于打造“强大的专业工具”,无论是作为“最强大脑”的ChatGPT,还是作为“工作副驾”的微软Copilot,其核心价值都在于帮助用户更高效地完成特定任务。这种定位,自然地导向了清晰直接的商业模式——SaaS订阅和API调用付费,用户需要为“效率”买单。中国的路径则恰恰相反,大厂的发展路径是典型的“应用场景驱动”模式。基于全球最庞大的移动互联网市场,大厂们面对的是海量的具体需求。如何让电商推荐更精准?如何让内容创作更高效?这些问题倒逼着AI技术的快速工程化落地。巨大的需求下,大厂更侧重于打造“全能的生活伴侣”,字节“豆包”的情感陪伴、阿里“千问”的“管家式”服务,价值都在于渗透用户生活的方方面面。这种定位决定了其商业化更偏向于“生态变现”。主流打法依旧是互联网的“免费”逻辑,先圈占海量用户,再通过生态内的增值服务、广告效率提升或交易佣金来获利。这样发展路径的不同,并无优劣之分,而是两国市场环境的必然产物。美国强大的ToB市场和开发者文化,为“工具型”AI的商业化提供了沃土。而中国无与伦比的ToC生态和数字生活一体化,则为“服务型”AI的场景落地创造了绝佳条件。版图重塑:流量、生态与未来AI技术的深度融合,正像一场深刻的底层构造运动,悄然间,已系统性地重塑了中国互联网的商业版图。在移动互联网时代,流量被分割在功能各异的App孤岛中。而大厂拟通过AI助手,打通各个业务生态。彼时,用户无需在App间频繁跳转,只需在一个统一的对话界面提出需求,此后由AI理解、拆解任务,最好由APp调度后台所有服务资源完成服务闭环。这意味着,未来流量的分配权将从应用商店和超级App,向上转移至“AI助理”的掌控者手中。谁的助理更“懂你”、能办的事更多,谁就能扼住未来数字世界的咽喉。AI时代,传统的“广告+佣金”模式也在逐渐被颠覆,一个更多元、更健康的商业模式矩阵正慢慢形成。其核心是从收割“注意力”转向出售“生产力”与“便利性”。这主要体现在三个层面,首先,是针对专业功能的“免费+增值”订阅模式,百度文库的AI会员已成功验证了这条路;其次,是在AI助理完成服务闭环后抽取的交易佣金,这将AI与GMV直接挂钩;最后,是广告模式的智能化革命,AI可以根据用户实时场景即时生成广告内容,从而将转化效率提升到新的量级。以往,互联网公司的护城河是建立在用户关系链上的“网络效应”。而AI时代,新的护城河或将演变为一个更强大的“数据+模型+生态”的智能飞轮。拥有最丰富场景和海量用户数据(如阿里的电商数据、腾讯的社交数据)的平台,能够训练出更懂该场景的模型;更智能的模型则能提供更极致的用户体验,吸引更多用户;更多用户的交互行为又会产生更优质的数据,进一步强化模型。当这个飞轮与平台强大的商业履约能力(支付、物流、线下服务)结合时,所形成的壁垒将是纯技术公司难以逾越的。展望未来,中国AI市场的竞争格局远未尘埃落定。这场竞赛已不再是单纯的模型优劣之争,而是生态整合能力、产品创新能力和商业化效率的全方位比拼。阿里的电商、腾讯的社交、字节的内容和百度的信息,各家都将宝押在了自己最坚实的阵地上。最终的胜负,或许不取决于谁的技术最顶尖,而在于谁能率先将AI真正融入其商业基因,并成功让数亿用户心甘情愿地为“智能”本身买单。这场深刻的变革,才刚刚拉开序幕。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/21
Gemini 3.0 发布,软件产业的分水岭来了
有数据有场景有Know-how的应用厂商,机会来了Google在今天凌晨正式发布Gemini3.0!我的第一个感受是,大模型竞争真是刺激:大家都在一片充满未知、充满挑战的领域不分日夜、全力狂奔。大模型竞争真是残酷!新模型一出手,必须打败业界之前的最顶级模型;但最新模型一旦落地,便立即意味着它马上会落后。因为后面的模型必然要超过它。我心里还真为OpenAI、国内的大模型厂商们捏了一把汗。有了Gemini3.0之后,大模型版本升级的故事就不那么好讲了。什么时候才会是大模型的天花板?我不知道。但Gemini3.0会是个里程碑事件。连OpenAI的老板Altman都对它表示佩服:看上去真是个伟大的模型!后面的模型要想超过它,需要花点时间了。因为它不仅仅是参数的扩大、算力的加强。Gemini3.0的四大核心技术突破如果说1.0是诞生,2.0是速度与效率,那么Gemini3.0的关键词就是深度推理与主动智能(Agentic)。它不再仅仅是一个陪聊的Chatbot,而是一个能帮你干活的Agent。我主要看重它的四个突破:1、最完整的原生多模态百度文心一言最新模型强调的也是多模态,但Gemini3.0更将其进行了更大的拓展:不仅能同时处理文字、图片、视频、音乐、代码,还能同时处理3D、地理空间。包含文字图片视频音乐等类型在内的原生多模态都只是少部分模型实现,还能处理3D、地理空间等模态的就更少了。目前,Google应该是唯一。2、DeepThink+多Agent的协同Gemini3.0推出了DeepThink推理架构,能像人类思维链一样思考问题。它在遇到问题时,会多步、复杂地思考,而后考虑如何给出答案。而不是像之前的模型,只是直觉式快速回答。和以前2.5Pro版本的思考模式相比,它的思考深度和准确性大有提升。同时,Gemini3.0还能同时启动和调用多个Agent执行任务,并相互协作。这意味着,它是一个Agentic基座大模型,是一个能执行各种工作的智能助手。3、长上下文与长时记忆Gemini3.0采用新的上下文和检索机制,可支持的上下文大大增加,同时也能更长时间地记住历史任务。这说明,它能记住你风格偏好,甚至你喜欢的语气。它开始有了懂你的感觉,而不是每次都是全新的陌生人。4、长上下文与长时记忆Gemini3.0还发布了一个Agent-First编程工具,叫GoogleAntigravity。它是一个IDE,可以用来氛围编程,也可以用来开发各种AI应用。这意味着它在自动化开发、复杂任务规划,以及高级助手等产品中会有很大用途。我之所以看重这四大突破,是因为他们是思维能力的重要方面。软件产业的分水岭:模型定义应用在很多人眼中,这是一次技术的狂欢;但在我看来,对于中国广大的企业服务和软件厂商而言,这更像是一次产业重构。过去我们常说软件定义世界,而从Gemini3.0开始,我们或许要习惯一个新的命题:模型定义应用。对于用友、金蝶、致远、泛微、东软、北森、纷享销客、销售易等长期深耕企服赛道的软件厂商,Gemini3.0带来的不是冲击,而是千载难逢的升维机遇。长期以来,ERP、CRM、OA等企业应用的核心价值在于固化流程和记录数据。但痛点也显而易见:系统越来越重,操作越来越繁,数据沉淀在系统里成了哑巴。Gemini3.0展现出的慢思考推理能力和原生多模态交互,将极大加速传统软件的数智化升级:一方面,交互界面的去门槛化:LUI(自然语言交互)将逐渐取代复杂的GUI。未来的企业软件,入口可能就是一个简单的对话框。业务人员不再需要学习复杂的菜单操作,一句分析上月回款异常,系统就能自动调取ERP数据并生成分析报告。这对提升软件的易用性和全员推广度是革命性的。另一方面,数据资产的价值变现:传统厂商最大的护城河是懂业务、有数据。依托大模型的长窗口和推理能力,原本沉睡的业务数据将被激活,从记录历史转变为预测未来。所以我认为,传统软件厂商的下一个十年,比拼的不再是功能的堆砌,而是模型+行业Know-how的融合深度。但对于近年来涌现的AI创业者,尤其是做Agent智能体的厂商,Gemini3.0释放了一个明确的信号:通用中间层的窗口期正在关闭,套壳厂商窗口期即将关闭。早期的AI应用,很多是在做大模型的补丁——补全记忆、补全联网、补全工具调用。但随着Gemini3.0将这些能力内化为原生能力,那些仅仅依靠Prompt工程或简单编排的薄壳应用,其生存空间将被巨头无情挤压。但这并不意味着机会的消失,相反,真正的机会才刚刚浮出水面。未来的高价值AI应用,一定不诞生在通用的聊天框里,而是诞生在具体的业务场景中。如果你做的是通用的AI员工,你很难打败大模型;但如果你做的是懂中国税务政策的AI财务合规官,或者是精通某类机床维修的AI专家,那么巨头的模型越强,你的底座就越稳。场景为王,垂类深耕。这是未来新兴AI厂商的生存之道。总之,Gemini3.0的发布,实际上理清了未来软件产业的生态分工:大厂(MaaS层)负责把模型的智商(IQ)推向极致,提供通用的水电煤;应用厂商(SaaS/ISV层)负责解决最后一公里的业务难题,把模型能力翻译成企业听得懂、用得上的生产力。因此,对于中国软件产业来说,焦虑大可不必。在这个数智化转型的深水区,懂技术很重要,但更重要的是懂行业、懂客户、懂场景。这正是应用软件厂商的底气所在。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/17
AI时代,中国人终于愿意为软件付费了
为效率买单?AI软件集体涨价,白嫖党边吐槽边付费“现在什么都得付费买个会员,不是会员视频下载速度就超级慢!”“有的视频会议软件吃相太难看了,一年会员费涨了三倍!”“辛辛苦苦剪了两个小时视频,结果导出4K高清画质时还要解锁SVIP会员,离大谱了!”近期,各个社交平台上都充斥着,用户对软件付费以及会员涨价的吐槽。自2024年至今,从办公软件到视频工具,从个人会员到企业服务,一场席卷全行业的软件涨价潮悄然蔓延。据光锥智能不完全统计,国内软件会员费用价格平均涨幅达20-30%。企业涨价的动力,来自AI带来的价值和成本的双重提升。跟互联网时代相比,AI正在改变人们对“软件付费”的消费观。以往,中国用户对软件付费的态度是“能蹭就蹭”,白嫖党占据绝大多数。如2015年,某办公软件推出10元/月会员时,论坛满是卸载预警;2018年视频平台首次涨价,微博相关话题下充斥着割韭菜的骂声。现在,尽管社交平台上依然骂声一片,但却与十年前“付费即卸载”的抵制潮不同,更多的用户选择了愿意为其AI功能买单。据智联招聘2025年调研显示,56.1%的职场人愿意为AI服务付费,其中23.4%的职场人已完成AI工具付费行为,16.5%曾为单个AI工具/服务付费,如购买单月会员,6.9%职场人曾为多个AI工具/服务付费,而24.1%高管愿意为单个AI工具支付200元以上的单月费用。一位短视频博主在过去三年一直自动续费剪映25元/月VIP,此轮价格调整后,其常用的“智能抠像”“数字人合成”功能则被归入高阶权益,SVIP价格是499元一年,而普通VIP则是258元一年。更让她无奈的是,即便吐槽“太贵”,最终还是咬牙续费,毕竟“AI数字人一天能拍10条口播,比雇真人演员省太多,这点会员费算零头。”可以看到,这场涨价潮的背后,是中国软件市场三十年来未有的深刻变革,AI技术不仅重构了产品价值,更彻底扭转了用户的付费认知。这背后根源就在于,中国用户愿意为能够真正提升效率的、好用的AI工具和产品买单。而当免费模式不再是唯一通行证,产品能力成为用户衡量是否值得付费标准时,有AI加持的软件订阅模式,或许在中国市场,终于能成为一门赚钱的生意。涨价潮里的众生相,AI成绕不开的加价项越来越多的APP,开始在产品内集成AI功能。从基础的AI助手,到知识问答,再到AI搜索等,而这也成为这些APP会员费用涨价的核心筹码。具体来看,视频剪辑领域的涨价用户感知最为强烈,剪映的VIP升级SVIP操作堪称典型。2024年6月前,剪映仅设25元/月的VIP会员,涵盖基础特效与水印去除功能;6月推出SVIP后,形成“VIP限移动端、SVIP全平台通用”的分级体系,SVIP月费59元、年费499元,较原VIP年卡涨幅达93%。更让老用户不满的是功能“迁移”,原本免费的“智能划重点”“自动字幕翻译”,以及常用的“4K导出”功能被归入SVIP权益池。从社交媒体上用户的反馈来看,虽然吐槽很多,但更多用户还是为其买单。剪映涨价之后,同类工具类产品也纷纷跟进,如MovaviVideoEditor就针对国内用户推出促销价格69元/月的订阅制,其核心卖点正是一键式AI工具,包括AI自动字幕生成等功能。(MovaviVideoEditor会员价格)相比于视频剪辑工具,协同办公软件的涨价逻辑更清晰,即绑定AI功能实现价值重构。在这其中,WPS的操作更具代表性。2025年8月,WPS重组了会员体系,其超级会员从198元/年降至148元/年,但却单独推出了AI会员,国际版定价129.99美元/年(约930元),国内版虽未公开高价,但通过功能拆分实现精准变现。而腾讯会议的会员费则实现了一年翻三倍的增幅,同时完成从个人-企业的付费梯队建设。2024年10月,个人专业版从25元/月涨至49元/月,涨幅96%,对应的权益升级包括100人参会、不限时会议、100GB云录制及AI小助手Pro,可自动生成结构化会议纪要。2025年1月,腾讯会议再推商业版,139元/月/账号的定价瞄准中小企业,新增300人会议、企业SSO等功能,形成“个人-企业”的付费梯度。飞书也完成付费体系搭建,标准版50元/月可以提供AI字幕、多语言实时翻译,专业版80元/月解锁专业数据报告功能,而旗舰版则高达120元/月,提供包含多维表格、高级存储及AI功能等。值得一提的是,飞书还将部分产品进行独立收费,比如多维表格,其提供免费版和付费版,其中付费版包括高级版(2499元/年,20000行)和企业版(5499元/年,50000行)。另外,阿里巴巴旗下1688的诚信通,每年的会员费由6688元涨价至9988元,涨价的原因是其推出了诚信通AI版,集成AI智能经营系统(AI4.0),提供全链路AI服务(开店、选品、营销、分析等),据平台估算,新增权益市场价值超6688元。可以看到,AI已经成为这些软件涨价的核心筹码,甚至很多软件还在酝酿AI功能独立付费。有消息显示,腾讯会议的AI功能月活跃用户已达1500万,同比增长一倍,其AI会议纪要、实时翻译等功能也正酝酿收费升级。有企业IT负责人透露,多家厂商上门推销时明确表示:“AI功能单独定价,是行业新规则。”相比较来说,视频平台APP涨价却遇阻,AI救场乏力。如腾讯视频在2025年Q1长视频订阅用户1.17亿,同比增长1%,但收入持平。其试图通过AI功能破局,在会员体系中加入“AI剧情解说”“个性化推荐”等权益,但用户感知度较低,尚未形成像办公软件那样的付费驱动力。综上来看,在光锥智能的统计中也发现,相比较来说,工具类的APP集成AI功能后涨价会更容易被用户所接受,比如协同办公软件、视频剪辑软件等。而对于视频平台类APP,用户会更注重所提供内容质量,AI反倒并没有给涨价提供更多的价值。软件涨价根源,AI背后的“烧钱黑洞”“以前做软件是写代码,现在做软件是买算力。”一位AI软件产品经理的话道出涨价本质。当前,生成式AI普及,让软件企业陷入算力烧钱大战,而这笔成本最终势必要转嫁到用户身上。如剪映的“数字人合成”功能,每生成1分钟视频需调用服务器约3分钟,按2025年CoreWeave的租赁价格49美元/小时计算,单条视频的算力成本就达2.45美元,若按日活用户生成100万条视频估算,单日算力成本超240万美元。为覆盖成本,剪映不得不将此类功能归入高价SVIP。另外,服务器和带宽成本同样居高不下。其中,DeepSeek的涨价最能说明问题。2025年2月,这款爆火的国产AI大模型结束优惠期,输出tokens价格从每百万2元飙升至8元,涨幅高达300%,输入tokens费用也翻了2~5倍。对此,DeepSeek给出的理由很直白:优惠期用户暴增导致服务器负载激增,运营成本大幅上升。另外,金山办公为支撑WPSAI的2951万月活用户,仅数据中心改造就投入数亿元,这些投入也都是需要通过会员费回收。此外,对于视频剪辑类软件来说,版权的成本也在增加。比如剪映素材库中的每首BGM、每个特效模板都需支付版权费,有业内人士透露,一首热门短视频BGM的年度版权费可达数十万元。随着内容监管趋严,软件企业不得不加大版权投入,这部分成本最终转嫁到会员费中。事实上,用户在社交平台上吐槽归吐槽,但真正续费的人并不少。“涨价能被接受,本质是AI创造了新价值。”一位用户说道。腾讯会议的AI功能就是典型例子,其AI助手能实时生成结构化纪要、自动分配待办事项,某互联网公司测试发现,这一功能让会议效率提升40%,即便未来涨价,他们也计划全员续费。WPSAI的“表格智能分析”功能则更受财务人员青睐,其能将3小时的数据分析工作压缩至20分钟。这种价值升级在创作领域更明显。剪映的“AI字幕翻译”支持20种语言,“无限运镜”能自动扩展视频画面,让普通用户也能做出专业级作品。据a16z报告指出,AI已把创意门槛降到零,任何岗位都能上手创作,这让付费变得理所当然。软件企业的营收数据,也印证了其涨价策略的有效性。金山办公2025年H1营收26.57亿元,其中WPS365业务收入同比激增62.3%,新增中国联通、长江三峡集团等头部客户,AI功能成为政企客户付费的核心理由。腾讯的增值服务收入更具说服力,2025年Q1达920亿元,同比增长17%,其中音乐订阅收入增长17%,订阅用户1.23亿,ARPU提升明显。虽然长视频板块增长乏力,但办公协作类服务的涨价贡献了可观收入。即便是争议最大的剪映,也通过涨价实现了收入跃升。据字节跳动内部数据显示,SVIP推出半年后付费转化率达3.2%,按抖音5亿创作者基数估算,付费用户规模超1600万,仅年卡收入就达80亿元,远超此前VIP体系的营收规模。反观未跟进AI升级的软件,生存状况愈发艰难。据悉,某老牌视频剪辑工具因未接入AI功能,2025年付费用户流失40%,被迫将年卡价格从199元降至99元,仍难挽颓势。究其根源,AI能够真正提升效率,才是中国用户愿意为这些APP涨价买单的根本原因。就像某位用户所说:“AI生成PPT太省时了,以前做一天方案,现在半小时搞定,涨价也认了。”软件付费的“中国时刻”终于到来二十年前,雷军带着金山毒霸喊出“免费杀毒”,开启了中国软件的免费时代。二十年后,AI技术正在终结这个时代,迎来付费的“中国时刻”。过去,软件企业靠免费吸引流量,再通过广告、捆绑软件盈利,陷入“越免费越劣质”的恶性循环。而现在,AI的出现打破了这一僵局,软件企业找到了更健康的商业模式,即价值收费。头部企业率先通过AI建立壁垒。字节跳动为剪映投入数十亿AI研发费用,百度为智能云文档接入文心一言大模型,腾讯为会议软件配备专属AI服务器。在头部企业都在“卷”AI的情况下,中小软件企业要么跟进AI投入,要么接受市场淘汰。某二线办公软件企业创始人坦言:“不做AI就没人用,做AI每年要烧几千万,只能通过涨价回收成本。”这种竞争倒逼行业从价格战转向价值战,而涨价正是品质升级的必然结果。由此也不难看出,这波软件涨价潮绝非简单的“割韭菜”,而是行业发展的必然:算力成本的飙升要求企业找到新的收入来源,AI带来的价值升级让用户愿意为好产品买单,市场竞争则倒逼企业从流量思维转向价值思维。对用户而言,付费不是负担,而是筛选优质服务的高效方式,当软件企业能通过付费获得合理利润,就不必靠广告和捆绑盈利,最终受益的还是用户。对行业而言,付费模式的成熟,则标志着中国软件终于摆脱了“免费诅咒”,进入健康发展的新阶段。正如一位行业老兵所言:“以前我们总羡慕国外软件能靠订阅费赚钱,现在才明白,不是中国用户不愿付费,而是我们没做出值得付费的产品。AI终于让我们补上了这一课。”当软件成为一门好生意,中国科技产业的创新活力,或许才刚刚被真正激活。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/17
智能体崛起,AI+软件研发到新拐点了?
LLM时代的软件研发新范式。大模型正在深刻改变研发流程的各个环节,推动自动化与智能化。辅助编程、CodingAgent……AI是如何从“辅助工具”变成核心生产力的?大模型原生开发时代到来了吗?近日InfoQ《极客有约》XAICon直播栏目特别邀请了平安科技高级产品经理吴朝雄、百度资深架构师颜志杰和汽车之家客户端架构师杜沛,在AICon全球人工智能开发与应用大会2025北京站(12月)即将召开之际,共同探讨LLM时代的软件研发新范式。部分精彩观点如下:AI在测试中更多是提效工具,而非替代方案。距离“原生开发时代”还有相当距离,现在只是走在“半坡上”。提示词其实是一种“角色扮演”,你要让模型理解你的意图,就要让它进入特定角色,比如“作为某领域的专家”,让模型在特定规则与业务逻辑下执行任务。CodingAgent代表了通用智能体的发展路径,能独立完成软件研发任务的智能体,其潜力将远超特定工具层面的自动化,因为它更接近人类在物理与逻辑层面的行动模式。我们希望AI不只是做演示级别的Demo,而是真正能满足产品开发的实际需求,产出可维护性强的代码,而不是仅仅能“跑起来”的代码。会用AI≠结果更好,不会用AI≠结果更差。考核的核心仍然是你最终的产出与影响,而不是过程里的工具选择。以下内容基于直播速记整理,经InfoQ删减。1LLM原生开发时代吴朝雄:很多观点还是认为“AI写代码”只是更高级的自动补全、不算范式变革。你们怎么看?颜志杰:“一半是火焰,一半是海水”。我们看到各种新闻时,会惊叹于AI的不断进化,它能完成越来越多任务、击败专业人士、甚至带来可观收益。然而,作为程序员,在实际开发中,尤其是在多年积累的代码基础上进行开发时,常常会发现AI并没有想象中那么“神”,有时甚至显得笨拙。所谓“火焰”的部分,是指AI在一些相对独立、结构清晰的小任务或0到1的创新场景中表现突出;而“海水”的部分,则是复杂、庞大的现实任务,尤其是在已有代码库中落地时,挑战依然巨大。对于不会写代码的人,只要能清楚表达意图,就能借助大模型具备软件开发的能力。举个例子,用“豆包”修图已经让很多不会用Photoshop的人完成了图片编辑,实现了从“不会”到“能”的跨越。但从程序员的角度看,AI的帮助虽日益明显,却尚未完全达到“范式变革”的程度,应该说正处于临界点的前夕。目前出现了越来越多AI编程产品形态,不再局限于IDE,例如Devin、SWEAgent等集成进DevOps平台的Web产品,还有ClaudeCode等命令行工具,能够深度融入研发流程。一个明显趋势是,越来越多公司开始披露其代码中由AI生成的比例,而这一比例仍在快速上升,部分团队甚至已超过50%。这意味着AI已深度介入代码生产,团队的开发习惯和工作方式正在改变。对非研发群体而言,这无疑是范式变革;而对依赖编码谋生的程序员群体,目前处于变革拐点阶段,虽尚未完全实现,但趋势已十分明显。从整体影响力和效率提升的角度看,还未达到“真正的范式变革”。杜沛:AI的使用效果与使用者能力差异巨大。从我们公司内部来看,大多数人已经在使用AI辅助开发,但不同人使用的深度和场景差别很大。有人仅用来做简单问答或辅助编写函数,也有人已经尝试通过ClaudeCode等工具构建自己的流程化智能体,用于方案设计和代码编写。从整体来看,开发方式确实发生了明显变化。过去我们习惯通过搜索解决方案,如今很多问题可以直接通过模型完成。不同模型间的能力差距也在迅速缩小。半年前还需要花大量时间解决的错误或兼容性问题,现在可能几分钟就能搞定。但模型本身的局限仍然存在,这也限制了我们进入真正高效的智能化开发时代。以客户端开发为例,业务复杂度极高。不同平台都有大量依赖、插件和业务线,AI在这些复杂场景下的表现仍有限。尤其在涉及3D建模等视觉任务时,大模型对视觉内容的理解仍较弱。因此,在许多复杂场景中,AI还远未达到完全可用的程度。但在标准化程度高的任务上,如文档生成、代码结构化设计等,AI表现优异。如果我们能提供足够清晰的引导、上下文记忆或预处理,AI能非常高效地完成工作。例如在跨端开发中,从Android迁移到iOS等规范性任务,AI的帮助已经相当明显。AI的全面接入还未实现,但正处在转折阶段;随着模型能力增强,我们会越来越接近真正智能化开发的时代。吴朝雄:测试环节在整个研发流程中是最复杂、分支最广的一部分,包括接口测试、UI测试、性能测试、手工测试等,每种类型的流程都不同。这些流程依赖严格的组织规范与管理体系,而这些是AI尚无法完全替代的。AI在测试领域中最擅长的仍是稳定性相关任务,如数据生成、数据分析、数据监控等。它能从大量数据中抽象出通用模式,帮助测试人员解决特定节点问题。比如在生成测试用例方面,模型在文本类内容上表现不错,尤其在需求明确的场景下。现在许多大模型经过蒸馏与训练,已具备特定领域的理解能力,如通义灵码等研发领域模型。然而,在更复杂的测试逻辑上,如微服务管理、数据拓扑关联等,模型仍力有不逮。这些环节需要人类根据经验判断。AI能生成局部的测试用例,但无法全面覆盖关联接口、异常场景等情况。在测试领域,AI目前仍主要承担辅助角色,尚无法达到协同开发的层面。与代码生成相比,测试用例更依赖具体业务属性。例如在金融行业,数据安全与系统复杂度极高,模型无法全面理解这些特定要求。AI在测试中更多是提效工具,而非替代方案。距离“原生开发时代”还有相当距离,现在只是走在“半坡上”。颜志杰:真正的范式变革,意味着从“不能”到“能”,或者能在可信度和可替代性上发生质变。无论是测试还是代码开发,目前模型仍难以胜任复杂任务,尤其是在微服务等需要深厚专业知识的场景下。虽然现在的阶段还不属于真正的范式变革,但不可否认的是,AI已在许多细分场景中极大地解放了我们的生产力。2哪些开发环节已经从“人做”变成“AI做”?吴朝雄:在我们的一线实践里,有哪些事情已经从“人做”变成“AI做”了?杜沛:先介绍一下我们在代码生成方面的实践,特别是与UI设计稿相关的“DesigntoCode”方向。其实我们在这方面起步较早,早在2023年AI刚兴起时,我们就已经开始尝试。但当时模型的能力有限,幻觉率很高,经常生成一些并不存在的内容。后来随着多模态模型的出现,我们看到了新的突破口。以往在开发中,页面复杂度会直接影响模型生成效果。页面信息越多,模型越容易出现选择性遗忘,遗漏部分细节。多模态模型引入图像理解后,情况有了明显改善。我们尝试了包括Claude、豆包等在内的多种方案,发现图像能帮助模型更好地理解UI的意图。例如,一个按钮是“登录”还是“分享”,一个区域是“Banner”还是“列表”,这些原本隐含的交互信息通过图像理解可以被模型更准确地识别。在此基础上,我们将图像理解与设计稿解析结合起来。目前我们内部使用MasterGo,通过解析设计文件并抽取关键信息,再反复加权强化这些要点,减少噪音的干扰。这一方法在实际应用中取得了不错的效果。从结果来看,我们的代码生成可用度已经能达到80%至90%。我们还进行了多轮跟踪测试,验证了它对整体效率的提升。但这并不意味着人力投入就能减少到10%。原因在于模型生成的内容仍需人工复核,比如对像素级别的比对、界面验收等环节,依旧需要人工严格检查。我们还在规范和记忆机制上进行了大量优化,使生成代码更符合人类开发习惯。我们还探索了多端代码转换,这部分逻辑规则相对清晰,比如在一端验证通过的逻辑可迁移到另一端,只需调整链路即可,这类任务AI处理得相当不错。例如,我们在H5、小程序或不同框架间的迁移中取得了良好效果。AI的代码生成质量可达70%以上,但由于后续仍需人工进行codereview与规范验收,整体提效约可达原来的1.5倍。相比传统自动化工具,AI的优势在于处理大规模工程项目时能更快定位、规划和生成逻辑,不再需要耗费数小时甚至数天运行分析。在代码审查方面。过去我们依赖静态扫描或动态分析,如今AI可以结合规范进行自动检测。针对不同技术栈、不同项目场景,只要设定好规则,AI就能识别潜在问题。通过这种双重机制,我们显著减少了测试阶段的bug数量,下降幅度可达30%–40%。虽然目前还难以精确评估线上bug的减少幅度,但测试阶段的改善已经非常明显。总体来说,这三个场景是我们在开发环节中最具代表性的AI应用。它们的共同特征是流程规范、任务可分解、结构化程度高。通过前期规划、阶段性检查与动态学习,能显著提升整体开发效率。颜志杰:首先,AI最擅长的是替代那些重复性、机械性的任务。过去我们主要依赖自动化手段来完成这类工作,但仍有许多自动化无法覆盖的场景。而现在,AI正在填补这些空白。以我们团队的项目“文心快码”为例,我们需要维护中英文两个版本的前端代码。以往需要人工分别开发并维护,现在我们通过设定规则,让AI代理完成中英文版本的互转。只需开发中文版本,AI就能自动生成英文版本,并完成验证与单元测试。这类工作过去靠自动化难以实现,而现在AI能高效、稳定、准确地完成。再回到之前提到的“一半是火焰,一半是海水”的比喻。AI在0到1阶段的创造性任务中表现尤为突出。例如生成脚本或原型开发,这些场景并不直接上线,但需要快速验证想法。AI在这里能极大提升生产力,让程序员将时间投入到更复杂的工作中。同时,它也让非技术人员如产品经理能通过草图与自然语言生成原型,促进沟通与协作。这种变化,本质上已经改变了开发流程。因此,我们可以看到,在0到1的“火焰”场景中,AI的潜力被充分释放。而像FigmatoCode这类应用,也属于这种相对简单、上下游关联较弱的领域,因而成为AI最先实现高效落地的方向。在测试用例生成方面,比如我在编写接口测试用例时,如果只针对单个接口进行测试,就不必绑定所有外部依赖,只需验证接口本身的输入输出是否正确即可。在这种情况下,AI的表现非常出色。当我们讨论“哪些事情从人做变成了AI做”时,我认为可以从DevOps或自动化的角度去理解:哪些任务过去依靠人工或传统自动化无法完成,而现在借助AI可以实现?如果重新梳理整个研发流程,就能发现许多环节都能精准匹配AI的特长,这正是AI替代人工的关键所在。吴朝雄:大模型的上层能力在于生成多样化的数据和内容,因此它特别适合用于数据构造或内容生成,比如最常见的文档润色。这类任务的模式固定、复现容易,AI能轻松胜任。以我熟悉的自动化测试领域为例,过去人力主要负责接口用例的生成和调试,而现在AI已经能在这一环节发挥很大作用。在简单的接口测试场景下,我们关注的往往不是接口背后的业务逻辑,而是接口是否能正常运行。无论是否使用模型,这类测试都可以完成,AI能自动生成部分输入数据,而人工也能手动构造,但差异在于复杂度。当测试对象是复杂接口时,情况就截然不同。在平安内部,很多接口都存在数据安全管控,需要身份验证或依赖上下游数据。一个接口往往依赖多个服务或数据库操作,无法仅通过简单的入参构造完成测试。要实现自动化,就必须先进行数据库查询、预置数据,再执行接口调用。这种场景对编排逻辑的要求极高,需要清晰的流程设计与强大的脚本能力。以往人工编写脚本容易出错,逻辑混乱、结构复杂,导致脚本无法执行。而现在,模型可以在理解数据库约束条件、接口逻辑、参数定义及场景需求后,自动组装上下文和执行逻辑,生成可运行的测试脚本。目前我们在平安集团内部通过共建与推广模式,将这项AI自动化能力推广到各子公司,用例数据的生成覆盖率已达60%左右。过去人工编写的测试脚本常出现逻辑漏洞或断言错误,而现在模型在理解接口文档、参数含义、代码逻辑及数据库结构后,能自动判断应先落库还是先查询数据,从而生成更合理的执行流程。举个例子:以前人工编写一个复杂接口的自动化测试脚本,通常需要一小时到半天不等,成本高且重复劳动多。现在通过模型生成,只需几分钟即可完成可执行用例,后续仅需微调即可,大大降低了人力投入。我们目前的重点是实现从用例生成到调试、评审、执行、诊断、报告生成的全流程自动化。这不仅需要多个agent协同,还需系统级的流程编排。我们的底层能力已初步搭建,计划在明年底前实现完整的全流程自动化编排体系。这将帮助我们真正跨越“原生时代”的技术壁垒,实现从辅助到自主的转变。过去测试人员需要思考如何设计用例,而未来他们只需关注“测什么”,也就是业务场景是否被充分覆盖。AI将承担设计和实现的繁琐部分,让测试人员转型为质量架构师,从事更高层次的质量保障与体系设计。3AI落地研发最先撞墙的是什么吴朝雄:当AI写代码、写测试、生成数据,真的进入真实业务后,最先撞墙的是什么?是稳定性?幻觉?规则不懂?还是团队不敢用?颜志杰:目前最大的问题在于AI的效果缺乏稳定性。当AI带来的收益不足以抵消改变原有工作习惯的成本时,落地就会变得非常困难,因为这种改变往往“反人性”、也“反直觉”。尤其是当人们尝试改变习惯后,发现效果依然不确定,那就更难推广与落地。因此,关键问题在于“稳定的效果”。比如在早期的Copilot模式中,AI用于代码续写或测试用例生成,对开发者的使用习惯影响不大,而且确实带来了一定收益。因为与传统基于规则的补全相比,AI的补全更智能,所以这种落地相对容易。但现在业界流行的SPEC模式却更复杂。开发者需要先进行需求澄清,不再是自己直接写代码,而是要通过与AI的自然语言交互逐步实现。特别是在大型存量代码库中,AI很难处理如此庞大的上下文。它有时能正确修改,但更多时候虽找到了问题,却以不符合逻辑的方式修改。例如,本该复用的函数被重复生成,或日志库被莫名替换。这些问题都让实际落地非常困难。因此,我们需要承认当前AI仍缺乏稳定性。若要务实推进落地,应从小任务开始,而非寄望“一句指令解决所有问题”。一句话对人来说都未必能准确表达,更何况对模型。即使写好了SPEC,也不能保证模型完全遵守逻辑。模型偶尔会“抽风”,即便明确要求它不做某事,它仍可能执行。所以我认为应像传统软件开发那样,从小任务、类工建设入手,写好文档、做好设计,逐步放大任务规模,探索人机协作的边界。随着信任与方法的积累,AI能承担的工作比例会逐渐提高,落地过程也会更加稳健。这是我对这一问题的理解与建议。杜沛:这实际上属于“信任建立”的问题。尤其在初期使用时,例如在IDE中输入需求,十次问答AI可能有两次回答不准确。用户往往会记住失败的那两次,因为那意味着额外的时间成本——要反复提问、修正,甚至多次都错,从而降低信任。在工具推广中,这种稳定性与容错机制尤为关键。如果AI结果不稳定,用户信任的建立就非常困难。算力问题也是一个重要因素。算力影响的不仅是能力,还有使用体验。模型响应越快,用户容忍错误的意愿就越高。比如从原先2分钟的生成降到10秒,即使结果出错,试错成本也低;但若等待5分钟仍出错,用户体验就会极差,负面反馈也更多。从数据来看,AI使用率差异巨大:有的用户AI参与率能达到50%,有的不足10%。我们分析发现,很多低效使用者的问题在于提示词太简单,只给出一个关键词或一句模糊话,导致模型误解意图、输出偏离目标。这种不当使用也加剧了体验差距。我们常收到反馈称“AI生成结果不对”,但很多时候问题在于输入模糊。为此,我们尝试在相同项目中预置模板或规范,提前定义依赖与规则,以减少AI发散造成的偏差。观众:用好AI做研发,对人员的能力模型是什么样的?吴朝雄:以测试领域为例,首先面临的问题就是“提示词工程”的理解。作为产品经理,我经常对接测试需求方,发现他们在使用我的AI工具或自动化测试平台时,往往在提示词能力上存在明显短板。在我看来,提示词工程的概念类似于“用户故事”。从产品视角来看,一个完整的用户故事需要把需求讲清楚,包括在什么角色、什么场景下,要解决什么问题,达成什么目标。提示词也是如此,应包含角色、场景、目标、任务等元素。提示词其实是一种“角色扮演”,你要让模型理解你的意图,就要让它进入特定角色,比如“作为某领域的专家”,让模型在特定规则与业务逻辑下执行任务。要让大模型正确理解你的指令,关键在于让输入的结构足够严谨、颗粒度足够细。比如定义“角色”时,要明确是产品实习生、助理、高级经理还是总监。不同角色视角不同,模型的解读结果也会不同。因此,第一个重要能力是写好提示词,而这需要持续的刻意练习与训练。第二个关键能力是“知识工程”。在研发领域,要让模型真正理解业务、帮助推动业务,就必须让它熟悉组织的知识体系。例如团队的流程规范、协作规范、人员管理、度量标准等。虽然这些在现实中可能以默认规则存在,但对模型来说,必须被整理成明确的文档,让它能够学习和引用。因此,使用AI的人需要具备撰写清晰、可拆解、可被模型理解的知识文档的能力。要为模型提供一套公开、可参考的方案,让它能基于这些资料进行模拟与推理。模型最擅长的不是从“无”到“有”的创新,而是基于已有知识进行“有到有”的推理。颜志杰:对于想要变得优秀的人来说,这是最坏的时代,因为你原有的技能一个都不能丢。AI还没有彻底改变工作范式,该懂代码的依然要懂代码;但同时这又是最好的时代,因为门槛变低了。很多过去需要花费大量精力的事情,现在借助AI就能高效完成。那些原本不会编程的人,若能善用AI,效率甚至能超过传统开发者。因此,关键在于你如何认知这个时代、如何定义自己想成为的人,再去决定你的能力模型和发展路径。像提示词工程、知识工程等能力,都是不可或缺的。吴朝雄:就像测试工作一样,要让模型理解你的规范,首先要把知识沉淀下来,而这些沉淀必须来自实际业务的经验,而不是由AI自己生成的。这些业务实践包括用例管理规范、代码管理规范、用例设计方法、代码设计原则等,都是研发人员必须掌握的基本知识。在此基础上,再去学习和掌握AI相关技术栈,并思考如何将这些技术与业务场景结合。要真正用好这些技术,就需要投入时间去理解、消化,并在实践中不断优化。观众:现在大模型的应用的技术栈都是java或者python的,百度内部使用的什么技术栈?颜志杰:我认为模型的技术栈与百度内部使用的技术栈并不存在直接关系。举例而言,搜索相关的程序可能是用C++编写的,云端的程序则多用Golang编写。但这两者的角色不同,一个是模型的生产方,另一个是模型的应用方。生产方使用什么语言实现模型,并不会影响应用方使用什么语言来调用或集成。对于应用方而言,无论模型是用于补全Golang、Java还是Python代码,其效果在当前模型体系下基本是一致的。4从“工具”到“协作者”吴朝雄:最近一个很明显的趋势是,行业似乎从“AI助手”在走向“智能体协作”。在你们的经验里,什么事情是原先的AI助手做不到,但智能体能做到的?杜沛:在我看来,最大的区别在于"闭环能力"——AI助手更多是单点辅助,而智能体可以串联起完整的开发-测试-审查流程。具体来说,从人工编写到AI编写,再到AI自动测试,最后由人进行结果审查与逻辑核对。这个方向无疑是未来的趋势,也是一种理想化的人机协同模式。AI参与写代码的关键问题在于如何保证生成代码的质量,特别是在业务开发中满足逻辑性和可靠性的要求。我们希望AI不只是做演示级别的Demo,而是真正能满足产品开发的实际需求,产出可维护性强的代码,而不是仅仅能“跑起来”的代码。如果生成的代码逻辑混乱或难以理解,后续维护人员需要重新阅读和分析,会带来额外的负担。因此,AI生成代码必须达到人类开发者可接受的标准,确保逻辑清晰、约束合理,才能真正降低人力成本。在测试环节,AI测试与传统人工测试的关注点也不同。传统测试主要关注结果正确性,而AI测试由于缺乏完整的运行环境,无法直接判断结果的对错。因此需要为其提供运行环境,帮助AI验证代码的构建是否通过、语法是否正确、边界条件是否覆盖等。对于复杂应用,尤其在移动端,还需在真机上运行测试,增加了难度和成本。AI测试不应仅停留在静态分析层面,而应延伸至动态运行状态的测试,才能形成更完整的闭环,从产品逻辑、代码质量、运行结果多维度提供保障。如果这一体系能实现动态测试闭环,AI将能更好地驱动整个开发流程,提升智能体验。这种模式的理想形态高度依赖于大模型能力。目前出现的“世界模型”虽然主要用于机器人,但未来也可能应用到软件开发与测试中。若模型能理解的不仅是文本或静态图像,而是结合视频、操作行为、屏幕显示等多模态信息进行判断,那么开发流程将迎来质的提升。吴朝雄:你提到整个研发流程会由agent协作完成。比如人类仅需输入开发意图,后续的代码生成与自测均由AI完成,人只需做最终审核。如果你们团队要实现这种流程的大规模落地,大概还需要多长时间?杜沛:从目前情况来看,这个目标短期内难以完全实现。按照我的预期,要真正打通流程、形成闭环,至少还需要一年以上的时间。颜志杰:AI助手到智能体的演化,本质上是从“动脑、动嘴”升级到“动脑、动手、动嘴”的阶段。AI助手主要处理思考和语言交互,而智能体则具备更强的自主执行能力。以研发领域为例,像Devin或SWEAgent就体现了这种形态。它们不再局限于IDE环境中的问答式交互,而是能在DevOps平台上自动执行任务,如代码生成、测试、验证、提交PR,甚至在发现问题后自动修复并反馈结果。这种模式体现出类人的逻辑链条:先观察,再推理,再行动,并持续感知环境变化。它不只是“口头助手”,而是能在异步环境中独立运作的执行体。过去仅依靠语言交互的助手无法完成端到端任务,如自动修复bug、补全测试用例、执行调试与代码审查,而智能体则能通过自主推理与操作实现这一切。这正是智能体强大的核心,也被认为是未来十年的关键方向。CodingAgent代表了通用智能体的发展路径,能独立完成软件研发任务的智能体,其潜力将远超特定工具层面的自动化,因为它更接近人类在物理与逻辑层面的行动模式。吴朝雄:智能体未来会走向统一的大平台,还是轻量化、插件化的生态?如果你们公司在研发类似产品,会倾向哪种形态?颜志杰:我更倾向于在当前模型能力的限制下,发展轻量化、插件化的生态。研发场景是一个极其严谨的科学过程,拥有成熟的流程来保证质量与协作。贸然构建“大一统平台”既不现实,也容易脱离实际。更合理的做法是让AI以插件形式逐步融入现有的软件研发体系,先观察它在各环节能带来多少改进。当AI能稳定接管50%以上流程后,再谈平台化整合才有意义。毕竟模型本质是概率系统,稳定性仍需时间和经验积累来优化。如果许多关键环节仍需要人工介入,就不应追求“全能平台”的虚高目标。吴朝雄:研发流程不仅涉及工具链,还包括人与项目的协作逻辑。这些协作往往在工具层面难以完全体现。当前的agent更多集中在单点问题的解决,比如帮助开发者发现或修复bug。但在DevOps层面,未来可能会出现更高抽象层次的AI工作台,整合数据检索、任务调度、执行分析等能力。例如JIRA已开始探索AI工作台,通过整合DevOps数据来实现项目进度追踪、代码库检索、任务完成情况分析、研发效能评估等功能。虽然目前仍以AI搜索为主,但雏形已经显现。国内多数产品还停留在单点agent阶段,尚未形成上层封装或生态体系。插件化生态仍是当下最稳妥、最现实的探索方向。观众:程序员使用AI生产代码,如何通过代码质量去给程序员打分,有什么参考指标进行绩效考核?颜志杰:目前几乎没有哪家公司会直接、明确地把“是否使用AI编码工具”或者“AI生成代码的比例”写进绩效体系。原因很简单:大家普遍仍然把AI当作一个工具,它的意义是提升效率,而不是成为评估个人好坏的指标。毕竟,AI生成代码的“量”与开发者真正的“质”之间差距很大。代码多不代表质量高,也不代表问题少。现在确实有很多公司会自上而下推动使用,比如用强制或激励的方式去推广CodeEngine类工具。目前也还没有出现那种“因为没用AI被扣分”的考核体系。唯一我听说比较激进的案例是Shopee,他们据说在绩效考核里已经纳入了一些AI使用相关的指标,但具体细节我还没深入研究。我的理解是,它更多是鼓励机制,比如“用得好、效果显著的人会得到奖励”,而不是“用得不好就被惩罚”。毕竟,AI用得少并不意味着你的产出不好。我们在内部推广AI工具时,也遇到过类似的问题。有开发者会问:“那如果我用AI生成的代码出了bug,这个责任算谁的?算我、算AI、还是算团队?”其实这个逻辑并不成立。你从网上复制一段开源代码,也没人会因此说那部分不是你写的。同理,AI工具只是一个辅助来源。我们团队目前在绩效体系里完全没有针对AI使用或代码质量的直接考核项,因为从逻辑上来说,这两者不能画等号。会用AI≠结果更好,不会用AI≠结果更差。考核的核心仍然是你最终的产出与影响,而不是过程里的工具选择。杜沛:我们会做一些“正向鼓励”,比如内部表扬或展示用AI提效的好案例,但不会强制,也不会把它绑定在绩效上。其实如果绩效里写“必须用AI”,反而会出现反效果,大家可能为了应付指标而“假用AI”,形式化操作,反倒偏离了效率提升的初衷。所以我们更倾向于通过文化与引导,而不是考核去推动AI的普及。吴朝雄:很多人听到AI进入研发流程,第一反应是“那我是不是要被替代了?会不会影响收入?”但现实是,AI更像是一种角色转变的工具,不是替代的力量。就拿测试岗位来说,AI确实能帮测试自动生成用例、发现缺陷、分析日志,但测试岗位并不会因此消失,而是转向更高层次的工作,比如验证业务逻辑、优化测试策略、整合分析数据等。AI带来的不是岗位的消亡,而是岗位价值的重塑。开发和测试都会因此变得更具策略性和创造性。5价值与人吴朝雄:未来两年,哪类工程师的价值会被放大?为什么?过去编写自动化测试脚本需要人工手动完成,投入成本很高,复杂脚本往往需要数小时甚至半天时间才能写好,因为其中涉及多个请求才能实现一个完整的功能测试。以往测试人员主要考虑如何设计一个准确、可用、能反映业务功能的测试用例。而现在,AI已经能在很大程度上突破“用例设计”这一难题。原因在于,AI能直接利用详细的代码和需求文档进行生成。例如,在接口自动化测试中有接口文档,在UI自动化中有页面组件信息,这些元素都可以在前期沉淀好。团队只要做好这些准备,后续在设计测试方案或测试用例时,就不再需要耗费大量时间思考脚本逻辑的构建,而是更关注测试本身能否发挥最大价值。重点转向“测什么”,也就是每个版本中要验证的代码与功能点。这才是测试人员更具专业性的部分。AI的引入并不意味着可以不懂代码,反而要求更精通代码。类似地,产品经理的角色也在变化。过去产品经理只需清楚表达逻辑即可,如今若希望模型辅助完成上下游流程,就必须把功能性和非功能性需求都描述清楚,并具备对系统架构的理解。未来产品经理不仅要懂业务逻辑,还需熟悉技术架构与系统关系。单纯掌握局部需求的产品经理将被替代,因为模型已经能根据业务逻辑生成漂亮的需求文档。而具有综合竞争力、能从全局视角解决问题的产品经理,将更具不可替代性。如果一个产品经理既懂技术、又懂业务与测试,即使每个领域不精通,但具备全面理解,就能在向下游输出内容时发挥不可替代的作用。事实上,AI的到来让产品角色更为重要。因为随着自动化程度提高,下游环节反而更依赖产品的决策与协调。同样地,对于其他岗位也是如此。以前端为例,基础的页面组件如今模型都能自动生成。但如果前端工程师同时理解后端逻辑与算法,就具备独特的竞争力。这种价值不在于页面是否漂亮,而在于对性能、架构、前后端交互的整体把控。当你能从架构视角考虑系统设计,具备整体技术思维,这种能力是AI无法取代的。因为你不仅懂代码规范,更了解团队系统的整体结构。AI时代加速了知识学习的深度,也推动各角色从“执行者”向“评估者”或“决策者”转变。当能力提升、知识扩展、角色升级,个人价值也会随之放大。这种变化不仅限于产品岗位,所有角色都在经历类似的转变。AI在研发领域的普及会凸显那些具备高水平能力的人,而只掌握基础技能的人可能被替代。要体现自身价值,关键是展示核心竞争力。这不仅包括AI使用能力,也包括坚实的基础知识储备。颜志杰:能熟练使用AI的人往往像架构师。架构师之所以重要,是因为他们能理解业务的边界与约束。AI在小任务上表现出色,但系统层面的设计、分层、异常处理仍需架构师来把控。AI无法承担系统责任,因此架构师在更高层次上能统筹全局,这种能力尤其重要。其次,是协作能力。同样使用AI,有人能比他人高效五到十倍。关键在于是否能清晰地与AI沟通任务,让模型理解意图。这不仅是一种思维能力,更是一种“放大效应”。第三,是持续学习与创新能力。我们要理解“如何做”与“为什么做”,因为技术更新极快,今天的框架明天就可能被替代。最重要的能力,我认为是“品味”。它类似艺术领域的审美判断。未来,当AI的供给极其丰富时,真正能体现个人差异的,就是对产品“应该做成什么样”的判断力。正如乔布斯设计手机时所展现的那种独到感知。好的产品设计需要这种品味与调性,而这正是产品经理不可替代的价值所在。杜沛:AI虽是概率模型,但若想真正用好它,必须理解其工作原理和局限性。虽然我们无法直接训练模型,但要知道如何高效使用。掌握这种能力能极大提升工作价值。例如,全栈工程师的价值可能更高。过去想要精通多种语言几乎不可能,如今借助AI,一些原本难以完成的任务也能实现,甚至做得更好。比如,前端工程师过去需要依赖数据分析师完成数据查询,而现在借助AI,通过日志查询平台就能快速生成SQL查询,无需他人协助。这种方式能显著提升个人能力的边界,使工作成果得到放大。只要你能善用AI,让它真正帮助你解决以往无法完成的任务,你的价值自然会提升。正如前面提到的,AI在研发中目前主要体现为效率提升,但这只是阶段性结果。未来随着模型形态变化,输入方式将不再局限于文本,还可能包括视觉、听觉等多模态信息,届时能实现的功能会更多。只要能真正用好AI,让它为你所用,你的能力与价值就会被放大,而不是取决于你属于哪一类工程师。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/17
AI下一站,软件应用是星辰大海
AI重塑世界,下一个“主战场”将是软件应用。大洋彼岸已经验证。英伟达亲自下场,今年的4起并购,全部是软件应用公司。美国老牌软件公司甲骨文拥抱AI+云计算,业绩超预期增长,2026年第一财季剩余的履约义务(即预订量的衡量指标)同比暴增359%,达到4550亿美元。新锐AI软件公司Palantir继续强劲增长,2025Q3营收11.81亿美元,同比增长63%,净利润4.77亿美元,同比增长220%,最新市值已达到4550亿美元。在国内,随着AI大模型持续升级,AI+软件应用也正如火如荼。C端加速渗透普及,据QuestMobile统计,截至2025Q3,国内移动端AI应用的用户规模已突破7亿。B端“供需两旺”。一方面,数智化转型已成为必答题,很多企业不再观望、犹豫。在他们看来,软件不再是开支,而是必须的投资。另一方面,得益于技术进步和政策支持,国产软件厂商已自主研发出国产操作系统,并推出了AIAgent等解决方案,生态日益繁荣。对此,中信建投认为,AI将推动国产软件厂商价值重估,将进一步打开估值“天花板”。在这一背景下,软件ETF易方达(562930)等相关指数产品,受到了投资者关注。国产软件“大航海时代”过去几年,卷硬件、卷AI大模型。如今,卷AI软件,落地应用,聚焦实际价值,正成为AI产业的主流叙事。值得注意的是,这也是政策鼓励的方向。“十五五”规划建议提出:全面实施“人工智能+”行动,以人工智能引领科研范式变革,加强人工智能同产业发展、文化建设、民生保障、社会治理相结合,抢占人工智能产业应用制高点,全方位赋能千行百业。近期,高层发文明确要求:2027年央企国企实现100%国产替代,覆盖操作系统、数据库等信创全产业链。另一方面,国内AI需求持续爆发。在C端,用户愈加青睐智能化应用。如金山办公旗下的WPS,截至2025上半年末,WPSAI月活2951万。还有字节旗下的豆包,截至2025年9月末,MAU达到1.72亿。在B端和G端,政策驱动叠加数智化转型浪潮,越来越多企业、机关机构更倾向通过AI来降本增效,他们还希望打通“数据孤岛”,借助AI大数据实现智能决策。与此同时,供给端正在革新。部分国产软件公司率先拥抱AI,打破海外垄断,已崭露头角。例如,在基础软件领域,华为发布的鸿蒙操作系统已“进化”至HarmonyOS6,终端设备数近2500万台。中国软件旗下麒麟软件自主研发的银河麒麟操作系统V11,已发布上线,它是国内首个突破百万生态的国产操作系统,已经与国产主流CPU、GPU及板卡实现全面兼容。在应用软件领域,EDA是芯片设计的“灵魂工具”,长期被国外厂商垄断。近期,启云方自主研发并推出了两款EDA软件,实现了从0到1的突破。AI奔涌激荡,政策、需求、供给“三重共振”下,国产软件将进入“大航海时代”。中国软协预测,2025年中国软件产业规模将达到15万亿元。高盛认为,到2030年,仅AIAgent,就将驱动全球软件市场规模至少增长20%。据此计算,仅AIAgent,就将在国内软件市场创造出万亿级的商业增量。同时,AI还将为国产操作系统、国产数据库等软件的可持续发展,注入更强劲的动能。展望未来,AI+国产软件拥有极强的确定性,它的想象力是“星辰大海”。把握主线,踏浪AI当前,上证指数已突破4000点,行至近十年的高位。后续,投资者该如何把握方向?兴业证券全球首席策略分析师张忆东认为:震荡不会影响A股“长牛”的底层逻辑,明年的主线依然是科技。更长远来看,AI浪潮才刚刚开始。民生证券在研究报告中指出,国产算力与国产软件共振,是后劲更强的方向。开源证券表示,AI软件加速突围,计算机板块的配置价值将愈加凸显。其中,中证软件指数年内涨幅为13.34%,低于通信、电子等板块的涨幅,从机构持仓比例和估值水平来看,后续都有较大的修复空间。对于普通人,尤其是投资新手来说,股市浮沉,要理解深奥的AI技术、复杂的软件产品,再筛选、投资优质个股,并不容易。专业的人做专业的事,软件ETF易方达(562930)是一个相对便捷的投资工具,正备受关注。它紧密追踪中证软件指数,一键“打包”了中国软件行业的“核心资产”。具体来看持仓,截至今年三季度末,软件ETF易方达(562930)前十大持仓为:科大讯飞、同花顺、金山办公、指南针、恒生电子、润和软件、三六零、拓维信息、用友网络、深信服。其中,科大讯飞是国内政务、教育、硬件等领域的AI先锋,2025Q3,其营收60.78亿元,同比增长10.02%,归母净利润1.72亿元,同比大幅增长202.4%。WPS母公司金山办公,是国内AI办公软件的龙头。2025Q3,其业绩稳健增长,营收15.21亿元,同比增长25.33%,归母净利润4.31亿元,同比增长35.42%。深信服的主营业务是网络安全、云计算及IT基础设施,也是国内AI+软件的领军者。今年第三季度,得益于AI业务持续突破,其营收21.16亿元,同比增长9.86%,归母净利润1.47亿元,同比大幅增长1097.4%。从更宏观的视角来看,国产软件的崛起,不仅仅是一次产业升级,更是中国科技实力、AI能力的彰显,是一个确定性的趋势。与此同时,乘着AI东风,跟踪恒生科技指数的恒生科技ETF易方达(513010)等产品近期也备受关注。从持仓来看,恒生科技ETF易方达(513010)主要聚焦中国AI应用的领军企业。如阿里、腾讯已成为云计算+AI基础设施,AI技术正广泛应用于电商、社交、金融等领域。京东、百度、美团也是AI先锋,正通过AI重构电商、出行、零售、医疗健康等行业。比亚迪股份、小米集团正将AI嵌入手机、汽车、家居等场景,同时还在积极探索具身智能的落地应用。资金流向方面,投资者正持续涌入。截至11月11日,恒生科技ETF易方达(513010)规模达到241.21亿元,年内增长了166.76亿元,增幅为224%。总的来看,投资必须把握未来趋势。站在长牛周期,拥抱AI时代的红利,AI+软件、国产化、AI应用,值得长期关注。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/17
AI浏览器Atlas,能否拯救亏损百亿的OpenAI?
AI浏览器,能不能革了传统浏览器的命?上周二,OpenAI发布的AI浏览器Atlas,图标看上去和GPT关系就很近。打开浏览器,需要使用GPT登录,可以选择一键导入Chrome浏览器的标签页。浏览器首页就是Chatgpt的对话框,和网页端的布局一致,过往的对话也完整保留。试着问了一个问题,在对话框顶端出现了五个选项,可以切换AI回答、网页、图片、视频或新闻结果。这样看,Atlas在搜索上和传统浏览器给出的选项类似,只是优先给出GPT的答案。点开一张具体的网页,网页右上角会出现一个“询问GPT”的功能按键。不需要再把信息复制粘贴到网页端,人们便可以直接就网页内容提问AI。很明显,OpenAI此举把矛头直接指向了拥有Chrome浏览器的谷歌。浏览器作为目前桌面端最大的用户流量入口,OpenAI这次做浏览器,是要更多的流量。OpenAI成立之初是一家非盈利机构,强调以实现AGI为目标,但在此过程中的研发和算力消耗是一笔巨大的持续性资金投入。10月28日,OpenAI宣布已完成资本重组,其不再是单纯的非营利组织,公司继续由非营利母公司控制,但将现有的营利部门改造成公共利益公司,该结构可以兼顾盈利目标和公益事业。近日路透社报道称OpenAI正在寻求上市,OpenAI首席执行官SamAltman也曾在公开直播中提及资金短缺问题,预计OpenAI2029年将消耗1150亿美元,而今年收入预计为130亿美元。不过,近期他又表示OpenAI实际营收远超这个数字,公司没有就上市做出决定,“我只是觉得事情最终会朝着那个方向发展。”OpenAI一直在谋求更多的利润空间。今年ChatGPT先是加入了电商业务,用户可以点击外部商品链接,接着又上线了付款功能,用户可以在GPT下单购物。现在OpenAI又做起了最大的流量入口——浏览器,使得被移动端抢了风头的桌面浏览器再次复兴。除了资金问题外,OpenAI的入局还有更加重要的原因——AI浏览器,有可能彻底改变我们和AI的关系。谁抢先把握住这个入口,谁就有可能再现“谷歌时刻”。等到那时,弥补现在的百亿亏损自然不是问题。AI浏览器大战,全面升级在过去很长一段时间里,AI浏览器走的是“集成”路线。顾名思义——“把AI放到浏览器里”,主要采取的方法是把AI放进侧边栏,人们在使用浏览器时可以随时对网页内容进行提问。侧边栏一度成为AI模型的“T台秀”。从豆包、DeepSeek到Gemini等等,各大AI模型纷纷提供网页助手插件,封装在侧边栏中,提供翻译、总结、快捷问答等功能。这样的结合方式大多基于浏览器的架构,网页助手能做的事情也有限。相比之下,这个赛道初创公司的产品Comet、Dia等采取了更加激进的方式,让AI直接上手解决人们的需求,不再只辅助人们理解“浏览结果”。图|Dia首页截图;Comet首页截图Atlas走的也是这条路线,概括特征是将AI置于浏览体验的核心。Atlas首页始终放置GPT搜索框,搜索后仍然以对话形式显示,不过在顶部栏可以选择传统浏览器的格式,还有生成图片等选项。Atlas支持谷歌插件,且在安装时用户可以选择导入谷歌或者Safari浏览器的书签。在任何网页上,AI都能直接“看到”并理解当前页面内容。分析代码、比较产品参数,无需用户手动复制粘贴。如果用户在隐私设置中允许Atlas访问记忆,浏览器能够记忆用户更多的浏览数据,并将其作为上下文。用户能够以自然语言打开历史记录,例如回顾上周看过的某篇文章。此外还有代理模式(目前仅限付费订阅用户),允许Atlas自主或半自主地处理某些任务,这也是AI从搜集信息走向电子秘书的关键一步。获得授权后,Atlas可自主执行多步骤网络操作,如自动搜索、填写信息、提交订单等。OpenAI首席设计师称之为“邀请ChatGPT进入你互联网的角落”。当浏览器开始基于浏览数据“了解你”,它就不再是被动展示信息的工具,而是一个能理解、记忆并主动为你执行任务的助手。在OpenAI之前,已有多家初创公司在这一方向上先行一步。AI搜索公司Perplexity推出浏览器Comet,TheBrowserCompany先后推出了Arc和Dia两个AI浏览器。以Dia为例,其设计简洁,核心是强化AI的“研究秘书”能力。目前Atlas还不支持引用多个网页,Dia可以对多个已打开的网页提问。对于需要浏览阅读大量信息的研究者和内容创作者来说,Dia是一个大脑容量无限的“信息秘书”。图|试用dia的网页比较功能Atlas的发布两天后,微软巧合般地推出Edge浏览器全新“Copilot模式”,试图将Copilot从被动的“助手”升级为可以执行任务的“智能体”。新增的“Actions”功能允许AI填写表单或预订酒店,“Journeys”能追踪并分组相关标签页。国内市场同样有类似的AI浏览器。目前,豆包电脑端界面也是AI对话栏,顶端栏显示打开的网页,支持导入Chrome书签,和Atlas采用的同类布局。虽然下载过程中豆包一直以“AI桌面助手”介绍,但打开设置可以看到设置默认浏览器的选项。除此之外,夸克浏览器界面也是AI对话,提问后AI回答和网页搜索在同一界面。无论是从模型出发打造浏览器,还是改装升级原先的浏览器,国内外AI浏览器大战随着OpenAI的入场,进入白热化阶段。OpenAI为何入局AI浏览器?从2022年底GPT发布算起,大模型之间的竞争已经打了快三年。DeepSeek、Gemini、Claude……新玩家层出不穷,用户的选择越来越多。在这场旷日持久的技术竞赛里,赚钱始终是最难的一环。AI的商业化形式有限,靠烧钱堆算力、靠订阅支撑研发,都不是长久之计。各个模型开始想办法增加用户的停留时间,获得更多的商业化可能。这时,“浏览器”成了一个更具想象力的入口。相比AI网站,浏览器天然就有更强的用户黏性。人们打开网站只是“用完即走”,广告插进去反而会破坏体验;但浏览器作为信息的起点,是所有上网行为的开关。谁掌握了浏览器,谁就掌握了流量。浏览器享有着“信息集合”这一牢固的用户心智,且从商业角度,显示顺序、边栏都是很好的广告位置。这一领域占据霸权地位的是谷歌的Chrome浏览器。根据数据平台Statcounter统计,截至2025年10月,Chrome占据全球浏览器市场的73.22%,有着毫无争议的霸主地位。网站分析工具Similarweb的数据显示,ChatGPT.com网站目前月访问量高达59亿次。据TechCrunch今年7月报道,OpenAI首席执行官SamAltman表示其活跃用户数超过8亿。不难想象很多用户打开浏览器的首要目的已经成为了使用AI。推出浏览器,标志着OpenAI想要从一家”技术公司“转向建设属于“用户平台”,把入口、用户与数据全部掌控在自己手里。GPT做浏览器还有初创公司比不了的优势。Dia浏览器的公司推出的另一款AI浏览器——Arc浏览器,产品也备受好评,但由于功能的创新性较高,用户群体相对小众,最终团队决定转向开发一个更大众的AI浏览器,也就是Dia。GPT有着庞大的用户群体,不必太过担心新功能对用户的阻拦,这是OpenAI天然具有的竞争优势。用户无需重新积累数据并形成个人画像,可以一键迁移过去的记忆、与GPT自动共享搜索记录,使得聊天更顺畅。能够在Atlas获得更好的GPT使用体验,这足以吸引用户进行一次产品尝试。对OpenAI来说,这些信任的用户数据还能反哺模型训练,让模型越用越聪明、体验越顺滑,形成一个正向循环。所有的在线行为都在这一环境中发生,这个平台会逐渐拥有对你最完整的理解,成为最好的“电子亲信”。你使用得越频繁,它就越了解你,从而你也越离不开它。AI浏览器,再造谷歌时刻在移动互联网时代,浏览器能再次成为巨头争夺的流量入口,关键在于Agent的爆发——让AI长出“手脚”。Agent出现之前,浏览器仅是信息网站和用户的中介。如果人们想要在众多香水品牌中选择一个,需要浏览多个品牌主页或者电商平台,在多个网站之间跳转并自己总结不同牌子的异同。有了Agent的加持,浏览器成为智慧和执行力并具的助手。人们只需要用自然语言描述自己的需求,模型会解读含义,Agent会自动执行任务。2025年7月21日,Perplexity完成1亿美元融资,企业估值达180亿美元。AI搜索公司获得的高估值,一定程度上反映了市场对搜索引擎变革或“新入口”形态的期待。但用户能否真正改变搜索习惯,还要打一个问号。浏览器是用户在电脑端使用时间最长的工具,短时间内更改习惯必然不现实。与此同时,AI浏览器还必须面对两个现实问题。这些新功能需要强大的算力支持,多以付费订阅的形式提供服务,这需要用户接受从“免费浏览”到“付费使用”的观念转变。除此之外是用户对安全的忧虑。当浏览器拥有了更强的主动执行能力,新的安全隐患也随之而来。据FORTUNE报道,目前AI系统还难以完美区分用户的可信指令和来自网页的恶意指令。黑客可能会隐藏这些指令,例如在网站某个位置采用机器代码,对人类用户来说难以察觉,但AI浏览器仍会读取,这意味着AI助手可能由于盲目听信诈骗指令,对用户造成损失。Reddit论坛上也有不少用户表露出对隐私的担忧,很多用户难以接受一个AI代理了解和控制自己的信息。图|Reddit论坛的讨论不过改变也不是完全不可能。当谷歌推出Chrome时,IE浏览器凭借操作系统的捆绑占据着绝对主导地位。Chrome凭借在速度、稳定性和简洁性上远超IE的体验,成功实现了大规模的用户迁移。只有新产品能在体验上有足够好的改善时,颠覆成熟市场的逆转才有可能发生。从目前的产品形态来看,Agent在阅读和整理信息时表现尚可,但在实际操作复杂的网页界面以执行任务时,仍处于早期发展阶段。但可以预见,未来的所有浏览器都将具备AI能力,走向“AI专业秘书”。开发Dia的初创公司创始人JoshMiller预言,五年后,桌面端最常用的AI界面将取代过去的默认浏览器。在AI浏览器功能尚不完善的今天,AI界面将如何重塑人们的上网体验仍然是一个谜题。不过我们可以相信,这个问题背后是广阔的想象空间,必将是一种全新的获取信息、融入数字世界的方式。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/17
别被骗了,AI Coding可没那么神,22名软件开发者道出了这些弊端
唯有变化才是永恒。软件的产出速度,从未像今天这么快。以ChatGPT、GitHubCopilot为代表的大语言模型(LLM)驱动代码生成器和编程助手,正在重塑软件开发者的工作方式。LLM不再只是工具,而是一个随时待命的虚拟搭档。AICoding正在成为全球科技巨头和初创企业的战略焦点。然而,尽管沉浸在AICoding中的软件开发者们将工作效率提高了26%,但也不得不思考一个新的问题:当AI可以生成实用代码,我们还在“开发”什么?当效率被AI极致放大,创造力与思考是否正在被稀释?日前,莫纳什大学、新加坡管理大学团队通过实际访谈22名软件开发者,探讨了LLM对软件开发的影响,以及如何管理这种影响。论文链接:https://arxiv.org/pdf/2511.06428结果显示,LLM有助于提高开发速度、维持开发流程、促进创业等,但也存在导致损害开发者声誉、影响个性(如懒惰)、阻碍开发者提升技能等风险。此外,研究团队还提出了一套关于如何最佳使用LLM进行软件开发任务的建议。研究方法为了理解软件从业者在采用LLM进行软件工程活动时的真实感受,研究团队采用了社会技术扎根理论(STGT)方法。该研究共分三轮,基于22位软件从业者的访谈数据进行收集与分析。在第一轮中,研究团队采访了6位初级开发者;在第二轮中,他们采访了13位初级与有经验的开发者,以提炼核心概念与类别;在第三轮中,他们又进行了3场访谈,以验证和完善理论。图|研究方法的全流程概述就LLM使用情况而言,多数参与者使用过多种LLM工具,其中ChatGPT最常被使用。大多数参与者使用LLM的时间超过一年,约59%的参与者每天与LLM至少交互6次。图|受访者使用LLM的情况研究结果基于上述方法,研究团队根据个人、团队、组织和社会层面,识别和分类了采纳LLM进行软件开发任务的益处和弊端。分别如下:▍LLM如何帮助软件开发者进步?个人层面,LLM有效提升了软件开发者的开发效率和学习能力。。LLM能自动生成样板代码、修复语法、提供即时反馈,帮助开发者节省时间、减少中断并保持“心流”状态。同时,LLM也是学习与反思的工具——开发者能借助它理解陌生代码、掌握新语言、比较不同解法。LLM还能够为开发者提供心理支持,让他们敢于提问,不怕暴露自己的无知,从而增强信心与主动性。图|LLM对个人开发者的积极影响团队层面,LLM减少了开发者之间的协作干扰与沟通成本。新手小白能够先借助LLM解决问题,再向同事求助,团队的运转更高效。LLM还能提供“第二意见”,帮助团队跳出惯性思维,提升整体创造力。组织层面,LLM节约了软件开发公司的时间和成本。LLM能够加快整体调试、排错与代码审查等流程,特别是对中小型企业而言,能以更少的人力完成更多的任务。社会层面,LLM促进了创新创业。许多开发者用LLM快速完成原型设计、学习商业与技术知识,降低了创业门槛。LLM甚至可以作为日常生活中的智能顾问,帮助解决时间规划和信息检索等问题。▍LLM如何阻碍软件开发者发展?当然,基于LLM的AICoding也并非没有弊端。例如,许多软件开发者发现,LLM在生成代码或提供建议时容易出现错误或“幻觉”,反而拖慢了进度,还需要花额外时间验证结果。而且,频繁的上下文切换、提示分解和反复修正也让工作量不减反增,过度依赖LLM也可能削弱开发者的代码理解力与学习动力。一些开发者提到,长期使用LLM会导致自己变得懒惰、冷漠,甚至对自身能力失去信心;新手则更容易陷入“让AI替我思考”的陷阱,导致技能停滞。更严重的是,当LLM生成错误代码时,责任仍由开发者承担,影响个人声誉。图|LLM对个人开发者的负面影响此外,由于担心LLM输出的代码涉及版权或许可问题,部分软件开发公司会明令禁止员工使用LLM。而且,LLM生成代码中可能隐藏漏洞,引发安全隐患。值得一提的是,成本问题也是一大阻力——频繁调用LLM需要付费,增加了企业的运行负担。最后,LLM的普及也让一些人面临失业的风险。虽然高精尖开发者依旧重要,但依赖经验和重复性工作的技术岗位正变得岌岌可危。▍软件开发者如何正确使用LLM?那么,既然AICoding是未来的一大趋势,开发者如何“既要又要”呢?根据访谈结果,研究团队发现,许多开发者会在不同LLM之间反复试用,直到找到最契合自己工作需求的LLM。通过这种比较,他们逐渐认识到LLM并非“智能体”,而只是基于统计的工具,于是选择使用不同LLM解决不同问题,例如,用ChatGPT处理需求沟通,用Copilot辅助编码,这反映了软件工程向“代理式”系统演进的趋势。此外,不少开发者更倾向让LLM参与代码优化而非直接生成,从而保持对逻辑与结构的控制。他们甚至出于隐私考虑,选择在本地运行模型,哪怕牺牲部分便捷。当前,软件开发者需要与LLM维持一种成熟的关系:既信任其能力,又保持理性距离,用人机协作的方式扩展自己的边界,而不是被取代。总之,无论使用什么工具,在软件开发工作中都离不开“直觉”。这里的“直觉”不是模糊的感觉,而是开发者在长期经验积累中形成的快速判断能力。它是一种经验性思维,帮助开发者在复杂和不确定的情境下做出决策。这种基于经验的直觉在开发者与LLM协作时,起到了“安全阀”的作用:当LLM提供错误或误导性的建议时,帮助开发者识别出问题、避免盲从模型的输出。那么,另一个问题来了,当开发者越来越依赖LLM生成的代码或建议,他们的直觉是否会被侵蚀呢?本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
