新闻资讯
News and information
-
25
11/25
巨头加码:AI如何重塑中国互联网“看不见”的战场
中国互联网的牌局,从未如此焦灼。中国互联网的牌局,从未如此焦灼。一场围绕AI的“军备竞赛”已骤然升级,战火的焦点逐渐从展示模型参数的“肌肉秀”,转向真刀真枪的应用登陆战。阿里巴巴(09988.HK)近乎以“all-in”的姿态豪赌个人AI管家,先后推出了夸克、千问等APP;而字节跳动早已凭借“豆包”的亿级用户,再次上演流量奇袭。与此同时,腾讯(00700.HK)正将AI能力悄然注入微信、QQ帝国,而百度(09888.HK)则试图将十余年在AI领域的技术苦修兑换为商业胜势。这场巨头之战,不再仅仅是技术的较量,而是一场关乎流量、生态与商业模式的终极考验。当大洋彼岸的同行已然跑通“生产力付费”的商业路径时,中国的巨头们又将如何在这片独特的土壤上,重塑互联网的未来?深水区的登陆战:从模型竞赛到场景为王如果说2024年是AI大模型的“播种之年”,那么2025年无疑是AI的“登陆之年”。尤其是下半年,中国各大互联网巨头不再满足于发布会上的性能跑分,已悄然将战略重心悉数转移至“场景”这片最考验实力的前沿阵地,路径选择却又因各自的基因与产品而泾渭分明。其中,阿里巴巴的“壮士断腕”式转向,是一场关于流量入口的豪赌。近日,阿里已将原来的“通义”APP升级更名为“千问”,并明确表示要全面对标ChatGPT。这一布局不仅是名称的变更,更是阿里战略重心的彻底转移。阿里正集结大量资源,试图将淘宝的电商、高德的地图、饿了么的外卖等核心生活服务,悉数接入这个全新的AI助理中。其意图显而易见,利用千问模型的技术优势,打造一个AI时代的超级流量入口,让用户在一个App内,通过对话就能完成从购物、导航到订餐的全链路操作。这背后,既是阿里对过去B端模型服务路径的修正,更是对其强大电商与生活服务生态的一次终极考验。阿里能否通过千问APP真正打通公司旗下的各个业务板块,从而实现无缝整合,为用户提供极致的“办事”体验,或将决定这场豪赌的成败。相较阿里的激进,腾讯的策略则更显稳健。在表面平静之下,腾讯已通过多次的小更新,将AI技术融入了其庞大的社交帝国。与阿里不同,腾讯并不急于再造一个独立的超级App,而是将“元宝”等AI能力,作为“智能化引擎”,全面赋能到微信、腾讯会议、游戏、广告等其所有核心业务线中。如在腾讯会议中实时生成纪要、在微信中快速摘要文章、让AI辅助提升广告的精准定向能力等。这种“生态协同”的模式,既避免了应用冷启动的难题,又能迅速获得海量用户反馈以迭代技术。AI对于腾讯而言,更像是一个“催化剂”和“增效器”,其核心目标是提升现有帝国的运转效率与商业价值。字节跳动的AI之路,则充满了赖以成功的“爆款方法论”。作为后来者,字节的布局务实且充满攻击性。“豆包”应用的快速崛起,是其“流量换市场”策略的又一次成功复刻。豆包通过抖音、头条的巨量导流,配合“AI伴侣”等强粘性功能,迅速抓住了大量的用户。而在AI编程等专业领域,每月9.9元的“包邮”套餐,则以一种近乎“掀桌子”的方式抢占了开发者生态;其下属平台扣子空间搭建的开发者生态,有效提高了打工人的工作效率。字节这种“实用至上、追求极致性价比”的打法,旨在通过快速落地和规模化应用,以数据飞轮反哺模型迭代,试图在AI应用层复刻企业在短视频领域的成功。百度则是这条赛道上最为执着的“技术长跑者”。坚持“芯片-框架-模型-应用”四层全栈自研的百度,是全球少数实现全栈自主可控的科技公司。其“AllinAI”的战略已坚持十余年,如今正进入收获期。其中,对核心产品百度搜索的AI化改造最为彻底。目前,百度旗下超过七成的头部搜索结果已由AI生成。而将百度文库AI化,以重构为“一站式内容创作平台”,更成为国内商业化最成功的AI产品之一。百度的AI发展路径,是一场由技术积累驱动的“效果涌现”,其深厚的技术壁垒使其在这场竞争中占据了独特的生态位。不过如何将技术优势转化为C端市场不可撼动的用户粘性,仍是百度亟需解决的问题。两条道路,两种哲学:中美AI的发展分野将视线投向全球,就会发现中美AI产业正沿着两条截然不同的道路演进。这不仅是技术路线的差异,更是市场环境与产品哲学的根本分野。美国AI的发展,呈现出典型的“技术突破驱动”模式。从OpenAI的GPT-5到谷歌最新的Gemini3,这些产品往往是实验室中诞生的革命性技术,技术发布后,再自上而下地寻找和定义应用场景。这些产品也因此更倾向于打造“强大的专业工具”,无论是作为“最强大脑”的ChatGPT,还是作为“工作副驾”的微软Copilot,其核心价值都在于帮助用户更高效地完成特定任务。这种定位,自然地导向了清晰直接的商业模式——SaaS订阅和API调用付费,用户需要为“效率”买单。中国的路径则恰恰相反,大厂的发展路径是典型的“应用场景驱动”模式。基于全球最庞大的移动互联网市场,大厂们面对的是海量的具体需求。如何让电商推荐更精准?如何让内容创作更高效?这些问题倒逼着AI技术的快速工程化落地。巨大的需求下,大厂更侧重于打造“全能的生活伴侣”,字节“豆包”的情感陪伴、阿里“千问”的“管家式”服务,价值都在于渗透用户生活的方方面面。这种定位决定了其商业化更偏向于“生态变现”。主流打法依旧是互联网的“免费”逻辑,先圈占海量用户,再通过生态内的增值服务、广告效率提升或交易佣金来获利。这样发展路径的不同,并无优劣之分,而是两国市场环境的必然产物。美国强大的ToB市场和开发者文化,为“工具型”AI的商业化提供了沃土。而中国无与伦比的ToC生态和数字生活一体化,则为“服务型”AI的场景落地创造了绝佳条件。版图重塑:流量、生态与未来AI技术的深度融合,正像一场深刻的底层构造运动,悄然间,已系统性地重塑了中国互联网的商业版图。在移动互联网时代,流量被分割在功能各异的App孤岛中。而大厂拟通过AI助手,打通各个业务生态。彼时,用户无需在App间频繁跳转,只需在一个统一的对话界面提出需求,此后由AI理解、拆解任务,最好由APp调度后台所有服务资源完成服务闭环。这意味着,未来流量的分配权将从应用商店和超级App,向上转移至“AI助理”的掌控者手中。谁的助理更“懂你”、能办的事更多,谁就能扼住未来数字世界的咽喉。AI时代,传统的“广告+佣金”模式也在逐渐被颠覆,一个更多元、更健康的商业模式矩阵正慢慢形成。其核心是从收割“注意力”转向出售“生产力”与“便利性”。这主要体现在三个层面,首先,是针对专业功能的“免费+增值”订阅模式,百度文库的AI会员已成功验证了这条路;其次,是在AI助理完成服务闭环后抽取的交易佣金,这将AI与GMV直接挂钩;最后,是广告模式的智能化革命,AI可以根据用户实时场景即时生成广告内容,从而将转化效率提升到新的量级。以往,互联网公司的护城河是建立在用户关系链上的“网络效应”。而AI时代,新的护城河或将演变为一个更强大的“数据+模型+生态”的智能飞轮。拥有最丰富场景和海量用户数据(如阿里的电商数据、腾讯的社交数据)的平台,能够训练出更懂该场景的模型;更智能的模型则能提供更极致的用户体验,吸引更多用户;更多用户的交互行为又会产生更优质的数据,进一步强化模型。当这个飞轮与平台强大的商业履约能力(支付、物流、线下服务)结合时,所形成的壁垒将是纯技术公司难以逾越的。展望未来,中国AI市场的竞争格局远未尘埃落定。这场竞赛已不再是单纯的模型优劣之争,而是生态整合能力、产品创新能力和商业化效率的全方位比拼。阿里的电商、腾讯的社交、字节的内容和百度的信息,各家都将宝押在了自己最坚实的阵地上。最终的胜负,或许不取决于谁的技术最顶尖,而在于谁能率先将AI真正融入其商业基因,并成功让数亿用户心甘情愿地为“智能”本身买单。这场深刻的变革,才刚刚拉开序幕。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/21
Gemini 3.0 发布,软件产业的分水岭来了
有数据有场景有Know-how的应用厂商,机会来了Google在今天凌晨正式发布Gemini3.0!我的第一个感受是,大模型竞争真是刺激:大家都在一片充满未知、充满挑战的领域不分日夜、全力狂奔。大模型竞争真是残酷!新模型一出手,必须打败业界之前的最顶级模型;但最新模型一旦落地,便立即意味着它马上会落后。因为后面的模型必然要超过它。我心里还真为OpenAI、国内的大模型厂商们捏了一把汗。有了Gemini3.0之后,大模型版本升级的故事就不那么好讲了。什么时候才会是大模型的天花板?我不知道。但Gemini3.0会是个里程碑事件。连OpenAI的老板Altman都对它表示佩服:看上去真是个伟大的模型!后面的模型要想超过它,需要花点时间了。因为它不仅仅是参数的扩大、算力的加强。Gemini3.0的四大核心技术突破如果说1.0是诞生,2.0是速度与效率,那么Gemini3.0的关键词就是深度推理与主动智能(Agentic)。它不再仅仅是一个陪聊的Chatbot,而是一个能帮你干活的Agent。我主要看重它的四个突破:1、最完整的原生多模态百度文心一言最新模型强调的也是多模态,但Gemini3.0更将其进行了更大的拓展:不仅能同时处理文字、图片、视频、音乐、代码,还能同时处理3D、地理空间。包含文字图片视频音乐等类型在内的原生多模态都只是少部分模型实现,还能处理3D、地理空间等模态的就更少了。目前,Google应该是唯一。2、DeepThink+多Agent的协同Gemini3.0推出了DeepThink推理架构,能像人类思维链一样思考问题。它在遇到问题时,会多步、复杂地思考,而后考虑如何给出答案。而不是像之前的模型,只是直觉式快速回答。和以前2.5Pro版本的思考模式相比,它的思考深度和准确性大有提升。同时,Gemini3.0还能同时启动和调用多个Agent执行任务,并相互协作。这意味着,它是一个Agentic基座大模型,是一个能执行各种工作的智能助手。3、长上下文与长时记忆Gemini3.0采用新的上下文和检索机制,可支持的上下文大大增加,同时也能更长时间地记住历史任务。这说明,它能记住你风格偏好,甚至你喜欢的语气。它开始有了懂你的感觉,而不是每次都是全新的陌生人。4、长上下文与长时记忆Gemini3.0还发布了一个Agent-First编程工具,叫GoogleAntigravity。它是一个IDE,可以用来氛围编程,也可以用来开发各种AI应用。这意味着它在自动化开发、复杂任务规划,以及高级助手等产品中会有很大用途。我之所以看重这四大突破,是因为他们是思维能力的重要方面。软件产业的分水岭:模型定义应用在很多人眼中,这是一次技术的狂欢;但在我看来,对于中国广大的企业服务和软件厂商而言,这更像是一次产业重构。过去我们常说软件定义世界,而从Gemini3.0开始,我们或许要习惯一个新的命题:模型定义应用。对于用友、金蝶、致远、泛微、东软、北森、纷享销客、销售易等长期深耕企服赛道的软件厂商,Gemini3.0带来的不是冲击,而是千载难逢的升维机遇。长期以来,ERP、CRM、OA等企业应用的核心价值在于固化流程和记录数据。但痛点也显而易见:系统越来越重,操作越来越繁,数据沉淀在系统里成了哑巴。Gemini3.0展现出的慢思考推理能力和原生多模态交互,将极大加速传统软件的数智化升级:一方面,交互界面的去门槛化:LUI(自然语言交互)将逐渐取代复杂的GUI。未来的企业软件,入口可能就是一个简单的对话框。业务人员不再需要学习复杂的菜单操作,一句分析上月回款异常,系统就能自动调取ERP数据并生成分析报告。这对提升软件的易用性和全员推广度是革命性的。另一方面,数据资产的价值变现:传统厂商最大的护城河是懂业务、有数据。依托大模型的长窗口和推理能力,原本沉睡的业务数据将被激活,从记录历史转变为预测未来。所以我认为,传统软件厂商的下一个十年,比拼的不再是功能的堆砌,而是模型+行业Know-how的融合深度。但对于近年来涌现的AI创业者,尤其是做Agent智能体的厂商,Gemini3.0释放了一个明确的信号:通用中间层的窗口期正在关闭,套壳厂商窗口期即将关闭。早期的AI应用,很多是在做大模型的补丁——补全记忆、补全联网、补全工具调用。但随着Gemini3.0将这些能力内化为原生能力,那些仅仅依靠Prompt工程或简单编排的薄壳应用,其生存空间将被巨头无情挤压。但这并不意味着机会的消失,相反,真正的机会才刚刚浮出水面。未来的高价值AI应用,一定不诞生在通用的聊天框里,而是诞生在具体的业务场景中。如果你做的是通用的AI员工,你很难打败大模型;但如果你做的是懂中国税务政策的AI财务合规官,或者是精通某类机床维修的AI专家,那么巨头的模型越强,你的底座就越稳。场景为王,垂类深耕。这是未来新兴AI厂商的生存之道。总之,Gemini3.0的发布,实际上理清了未来软件产业的生态分工:大厂(MaaS层)负责把模型的智商(IQ)推向极致,提供通用的水电煤;应用厂商(SaaS/ISV层)负责解决最后一公里的业务难题,把模型能力翻译成企业听得懂、用得上的生产力。因此,对于中国软件产业来说,焦虑大可不必。在这个数智化转型的深水区,懂技术很重要,但更重要的是懂行业、懂客户、懂场景。这正是应用软件厂商的底气所在。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/17
AI时代,中国人终于愿意为软件付费了
为效率买单?AI软件集体涨价,白嫖党边吐槽边付费“现在什么都得付费买个会员,不是会员视频下载速度就超级慢!”“有的视频会议软件吃相太难看了,一年会员费涨了三倍!”“辛辛苦苦剪了两个小时视频,结果导出4K高清画质时还要解锁SVIP会员,离大谱了!”近期,各个社交平台上都充斥着,用户对软件付费以及会员涨价的吐槽。自2024年至今,从办公软件到视频工具,从个人会员到企业服务,一场席卷全行业的软件涨价潮悄然蔓延。据光锥智能不完全统计,国内软件会员费用价格平均涨幅达20-30%。企业涨价的动力,来自AI带来的价值和成本的双重提升。跟互联网时代相比,AI正在改变人们对“软件付费”的消费观。以往,中国用户对软件付费的态度是“能蹭就蹭”,白嫖党占据绝大多数。如2015年,某办公软件推出10元/月会员时,论坛满是卸载预警;2018年视频平台首次涨价,微博相关话题下充斥着割韭菜的骂声。现在,尽管社交平台上依然骂声一片,但却与十年前“付费即卸载”的抵制潮不同,更多的用户选择了愿意为其AI功能买单。据智联招聘2025年调研显示,56.1%的职场人愿意为AI服务付费,其中23.4%的职场人已完成AI工具付费行为,16.5%曾为单个AI工具/服务付费,如购买单月会员,6.9%职场人曾为多个AI工具/服务付费,而24.1%高管愿意为单个AI工具支付200元以上的单月费用。一位短视频博主在过去三年一直自动续费剪映25元/月VIP,此轮价格调整后,其常用的“智能抠像”“数字人合成”功能则被归入高阶权益,SVIP价格是499元一年,而普通VIP则是258元一年。更让她无奈的是,即便吐槽“太贵”,最终还是咬牙续费,毕竟“AI数字人一天能拍10条口播,比雇真人演员省太多,这点会员费算零头。”可以看到,这场涨价潮的背后,是中国软件市场三十年来未有的深刻变革,AI技术不仅重构了产品价值,更彻底扭转了用户的付费认知。这背后根源就在于,中国用户愿意为能够真正提升效率的、好用的AI工具和产品买单。而当免费模式不再是唯一通行证,产品能力成为用户衡量是否值得付费标准时,有AI加持的软件订阅模式,或许在中国市场,终于能成为一门赚钱的生意。涨价潮里的众生相,AI成绕不开的加价项越来越多的APP,开始在产品内集成AI功能。从基础的AI助手,到知识问答,再到AI搜索等,而这也成为这些APP会员费用涨价的核心筹码。具体来看,视频剪辑领域的涨价用户感知最为强烈,剪映的VIP升级SVIP操作堪称典型。2024年6月前,剪映仅设25元/月的VIP会员,涵盖基础特效与水印去除功能;6月推出SVIP后,形成“VIP限移动端、SVIP全平台通用”的分级体系,SVIP月费59元、年费499元,较原VIP年卡涨幅达93%。更让老用户不满的是功能“迁移”,原本免费的“智能划重点”“自动字幕翻译”,以及常用的“4K导出”功能被归入SVIP权益池。从社交媒体上用户的反馈来看,虽然吐槽很多,但更多用户还是为其买单。剪映涨价之后,同类工具类产品也纷纷跟进,如MovaviVideoEditor就针对国内用户推出促销价格69元/月的订阅制,其核心卖点正是一键式AI工具,包括AI自动字幕生成等功能。(MovaviVideoEditor会员价格)相比于视频剪辑工具,协同办公软件的涨价逻辑更清晰,即绑定AI功能实现价值重构。在这其中,WPS的操作更具代表性。2025年8月,WPS重组了会员体系,其超级会员从198元/年降至148元/年,但却单独推出了AI会员,国际版定价129.99美元/年(约930元),国内版虽未公开高价,但通过功能拆分实现精准变现。而腾讯会议的会员费则实现了一年翻三倍的增幅,同时完成从个人-企业的付费梯队建设。2024年10月,个人专业版从25元/月涨至49元/月,涨幅96%,对应的权益升级包括100人参会、不限时会议、100GB云录制及AI小助手Pro,可自动生成结构化会议纪要。2025年1月,腾讯会议再推商业版,139元/月/账号的定价瞄准中小企业,新增300人会议、企业SSO等功能,形成“个人-企业”的付费梯度。飞书也完成付费体系搭建,标准版50元/月可以提供AI字幕、多语言实时翻译,专业版80元/月解锁专业数据报告功能,而旗舰版则高达120元/月,提供包含多维表格、高级存储及AI功能等。值得一提的是,飞书还将部分产品进行独立收费,比如多维表格,其提供免费版和付费版,其中付费版包括高级版(2499元/年,20000行)和企业版(5499元/年,50000行)。另外,阿里巴巴旗下1688的诚信通,每年的会员费由6688元涨价至9988元,涨价的原因是其推出了诚信通AI版,集成AI智能经营系统(AI4.0),提供全链路AI服务(开店、选品、营销、分析等),据平台估算,新增权益市场价值超6688元。可以看到,AI已经成为这些软件涨价的核心筹码,甚至很多软件还在酝酿AI功能独立付费。有消息显示,腾讯会议的AI功能月活跃用户已达1500万,同比增长一倍,其AI会议纪要、实时翻译等功能也正酝酿收费升级。有企业IT负责人透露,多家厂商上门推销时明确表示:“AI功能单独定价,是行业新规则。”相比较来说,视频平台APP涨价却遇阻,AI救场乏力。如腾讯视频在2025年Q1长视频订阅用户1.17亿,同比增长1%,但收入持平。其试图通过AI功能破局,在会员体系中加入“AI剧情解说”“个性化推荐”等权益,但用户感知度较低,尚未形成像办公软件那样的付费驱动力。综上来看,在光锥智能的统计中也发现,相比较来说,工具类的APP集成AI功能后涨价会更容易被用户所接受,比如协同办公软件、视频剪辑软件等。而对于视频平台类APP,用户会更注重所提供内容质量,AI反倒并没有给涨价提供更多的价值。软件涨价根源,AI背后的“烧钱黑洞”“以前做软件是写代码,现在做软件是买算力。”一位AI软件产品经理的话道出涨价本质。当前,生成式AI普及,让软件企业陷入算力烧钱大战,而这笔成本最终势必要转嫁到用户身上。如剪映的“数字人合成”功能,每生成1分钟视频需调用服务器约3分钟,按2025年CoreWeave的租赁价格49美元/小时计算,单条视频的算力成本就达2.45美元,若按日活用户生成100万条视频估算,单日算力成本超240万美元。为覆盖成本,剪映不得不将此类功能归入高价SVIP。另外,服务器和带宽成本同样居高不下。其中,DeepSeek的涨价最能说明问题。2025年2月,这款爆火的国产AI大模型结束优惠期,输出tokens价格从每百万2元飙升至8元,涨幅高达300%,输入tokens费用也翻了2~5倍。对此,DeepSeek给出的理由很直白:优惠期用户暴增导致服务器负载激增,运营成本大幅上升。另外,金山办公为支撑WPSAI的2951万月活用户,仅数据中心改造就投入数亿元,这些投入也都是需要通过会员费回收。此外,对于视频剪辑类软件来说,版权的成本也在增加。比如剪映素材库中的每首BGM、每个特效模板都需支付版权费,有业内人士透露,一首热门短视频BGM的年度版权费可达数十万元。随着内容监管趋严,软件企业不得不加大版权投入,这部分成本最终转嫁到会员费中。事实上,用户在社交平台上吐槽归吐槽,但真正续费的人并不少。“涨价能被接受,本质是AI创造了新价值。”一位用户说道。腾讯会议的AI功能就是典型例子,其AI助手能实时生成结构化纪要、自动分配待办事项,某互联网公司测试发现,这一功能让会议效率提升40%,即便未来涨价,他们也计划全员续费。WPSAI的“表格智能分析”功能则更受财务人员青睐,其能将3小时的数据分析工作压缩至20分钟。这种价值升级在创作领域更明显。剪映的“AI字幕翻译”支持20种语言,“无限运镜”能自动扩展视频画面,让普通用户也能做出专业级作品。据a16z报告指出,AI已把创意门槛降到零,任何岗位都能上手创作,这让付费变得理所当然。软件企业的营收数据,也印证了其涨价策略的有效性。金山办公2025年H1营收26.57亿元,其中WPS365业务收入同比激增62.3%,新增中国联通、长江三峡集团等头部客户,AI功能成为政企客户付费的核心理由。腾讯的增值服务收入更具说服力,2025年Q1达920亿元,同比增长17%,其中音乐订阅收入增长17%,订阅用户1.23亿,ARPU提升明显。虽然长视频板块增长乏力,但办公协作类服务的涨价贡献了可观收入。即便是争议最大的剪映,也通过涨价实现了收入跃升。据字节跳动内部数据显示,SVIP推出半年后付费转化率达3.2%,按抖音5亿创作者基数估算,付费用户规模超1600万,仅年卡收入就达80亿元,远超此前VIP体系的营收规模。反观未跟进AI升级的软件,生存状况愈发艰难。据悉,某老牌视频剪辑工具因未接入AI功能,2025年付费用户流失40%,被迫将年卡价格从199元降至99元,仍难挽颓势。究其根源,AI能够真正提升效率,才是中国用户愿意为这些APP涨价买单的根本原因。就像某位用户所说:“AI生成PPT太省时了,以前做一天方案,现在半小时搞定,涨价也认了。”软件付费的“中国时刻”终于到来二十年前,雷军带着金山毒霸喊出“免费杀毒”,开启了中国软件的免费时代。二十年后,AI技术正在终结这个时代,迎来付费的“中国时刻”。过去,软件企业靠免费吸引流量,再通过广告、捆绑软件盈利,陷入“越免费越劣质”的恶性循环。而现在,AI的出现打破了这一僵局,软件企业找到了更健康的商业模式,即价值收费。头部企业率先通过AI建立壁垒。字节跳动为剪映投入数十亿AI研发费用,百度为智能云文档接入文心一言大模型,腾讯为会议软件配备专属AI服务器。在头部企业都在“卷”AI的情况下,中小软件企业要么跟进AI投入,要么接受市场淘汰。某二线办公软件企业创始人坦言:“不做AI就没人用,做AI每年要烧几千万,只能通过涨价回收成本。”这种竞争倒逼行业从价格战转向价值战,而涨价正是品质升级的必然结果。由此也不难看出,这波软件涨价潮绝非简单的“割韭菜”,而是行业发展的必然:算力成本的飙升要求企业找到新的收入来源,AI带来的价值升级让用户愿意为好产品买单,市场竞争则倒逼企业从流量思维转向价值思维。对用户而言,付费不是负担,而是筛选优质服务的高效方式,当软件企业能通过付费获得合理利润,就不必靠广告和捆绑盈利,最终受益的还是用户。对行业而言,付费模式的成熟,则标志着中国软件终于摆脱了“免费诅咒”,进入健康发展的新阶段。正如一位行业老兵所言:“以前我们总羡慕国外软件能靠订阅费赚钱,现在才明白,不是中国用户不愿付费,而是我们没做出值得付费的产品。AI终于让我们补上了这一课。”当软件成为一门好生意,中国科技产业的创新活力,或许才刚刚被真正激活。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/17
智能体崛起,AI+软件研发到新拐点了?
LLM时代的软件研发新范式。大模型正在深刻改变研发流程的各个环节,推动自动化与智能化。辅助编程、CodingAgent……AI是如何从“辅助工具”变成核心生产力的?大模型原生开发时代到来了吗?近日InfoQ《极客有约》XAICon直播栏目特别邀请了平安科技高级产品经理吴朝雄、百度资深架构师颜志杰和汽车之家客户端架构师杜沛,在AICon全球人工智能开发与应用大会2025北京站(12月)即将召开之际,共同探讨LLM时代的软件研发新范式。部分精彩观点如下:AI在测试中更多是提效工具,而非替代方案。距离“原生开发时代”还有相当距离,现在只是走在“半坡上”。提示词其实是一种“角色扮演”,你要让模型理解你的意图,就要让它进入特定角色,比如“作为某领域的专家”,让模型在特定规则与业务逻辑下执行任务。CodingAgent代表了通用智能体的发展路径,能独立完成软件研发任务的智能体,其潜力将远超特定工具层面的自动化,因为它更接近人类在物理与逻辑层面的行动模式。我们希望AI不只是做演示级别的Demo,而是真正能满足产品开发的实际需求,产出可维护性强的代码,而不是仅仅能“跑起来”的代码。会用AI≠结果更好,不会用AI≠结果更差。考核的核心仍然是你最终的产出与影响,而不是过程里的工具选择。以下内容基于直播速记整理,经InfoQ删减。1LLM原生开发时代吴朝雄:很多观点还是认为“AI写代码”只是更高级的自动补全、不算范式变革。你们怎么看?颜志杰:“一半是火焰,一半是海水”。我们看到各种新闻时,会惊叹于AI的不断进化,它能完成越来越多任务、击败专业人士、甚至带来可观收益。然而,作为程序员,在实际开发中,尤其是在多年积累的代码基础上进行开发时,常常会发现AI并没有想象中那么“神”,有时甚至显得笨拙。所谓“火焰”的部分,是指AI在一些相对独立、结构清晰的小任务或0到1的创新场景中表现突出;而“海水”的部分,则是复杂、庞大的现实任务,尤其是在已有代码库中落地时,挑战依然巨大。对于不会写代码的人,只要能清楚表达意图,就能借助大模型具备软件开发的能力。举个例子,用“豆包”修图已经让很多不会用Photoshop的人完成了图片编辑,实现了从“不会”到“能”的跨越。但从程序员的角度看,AI的帮助虽日益明显,却尚未完全达到“范式变革”的程度,应该说正处于临界点的前夕。目前出现了越来越多AI编程产品形态,不再局限于IDE,例如Devin、SWEAgent等集成进DevOps平台的Web产品,还有ClaudeCode等命令行工具,能够深度融入研发流程。一个明显趋势是,越来越多公司开始披露其代码中由AI生成的比例,而这一比例仍在快速上升,部分团队甚至已超过50%。这意味着AI已深度介入代码生产,团队的开发习惯和工作方式正在改变。对非研发群体而言,这无疑是范式变革;而对依赖编码谋生的程序员群体,目前处于变革拐点阶段,虽尚未完全实现,但趋势已十分明显。从整体影响力和效率提升的角度看,还未达到“真正的范式变革”。杜沛:AI的使用效果与使用者能力差异巨大。从我们公司内部来看,大多数人已经在使用AI辅助开发,但不同人使用的深度和场景差别很大。有人仅用来做简单问答或辅助编写函数,也有人已经尝试通过ClaudeCode等工具构建自己的流程化智能体,用于方案设计和代码编写。从整体来看,开发方式确实发生了明显变化。过去我们习惯通过搜索解决方案,如今很多问题可以直接通过模型完成。不同模型间的能力差距也在迅速缩小。半年前还需要花大量时间解决的错误或兼容性问题,现在可能几分钟就能搞定。但模型本身的局限仍然存在,这也限制了我们进入真正高效的智能化开发时代。以客户端开发为例,业务复杂度极高。不同平台都有大量依赖、插件和业务线,AI在这些复杂场景下的表现仍有限。尤其在涉及3D建模等视觉任务时,大模型对视觉内容的理解仍较弱。因此,在许多复杂场景中,AI还远未达到完全可用的程度。但在标准化程度高的任务上,如文档生成、代码结构化设计等,AI表现优异。如果我们能提供足够清晰的引导、上下文记忆或预处理,AI能非常高效地完成工作。例如在跨端开发中,从Android迁移到iOS等规范性任务,AI的帮助已经相当明显。AI的全面接入还未实现,但正处在转折阶段;随着模型能力增强,我们会越来越接近真正智能化开发的时代。吴朝雄:测试环节在整个研发流程中是最复杂、分支最广的一部分,包括接口测试、UI测试、性能测试、手工测试等,每种类型的流程都不同。这些流程依赖严格的组织规范与管理体系,而这些是AI尚无法完全替代的。AI在测试领域中最擅长的仍是稳定性相关任务,如数据生成、数据分析、数据监控等。它能从大量数据中抽象出通用模式,帮助测试人员解决特定节点问题。比如在生成测试用例方面,模型在文本类内容上表现不错,尤其在需求明确的场景下。现在许多大模型经过蒸馏与训练,已具备特定领域的理解能力,如通义灵码等研发领域模型。然而,在更复杂的测试逻辑上,如微服务管理、数据拓扑关联等,模型仍力有不逮。这些环节需要人类根据经验判断。AI能生成局部的测试用例,但无法全面覆盖关联接口、异常场景等情况。在测试领域,AI目前仍主要承担辅助角色,尚无法达到协同开发的层面。与代码生成相比,测试用例更依赖具体业务属性。例如在金融行业,数据安全与系统复杂度极高,模型无法全面理解这些特定要求。AI在测试中更多是提效工具,而非替代方案。距离“原生开发时代”还有相当距离,现在只是走在“半坡上”。颜志杰:真正的范式变革,意味着从“不能”到“能”,或者能在可信度和可替代性上发生质变。无论是测试还是代码开发,目前模型仍难以胜任复杂任务,尤其是在微服务等需要深厚专业知识的场景下。虽然现在的阶段还不属于真正的范式变革,但不可否认的是,AI已在许多细分场景中极大地解放了我们的生产力。2哪些开发环节已经从“人做”变成“AI做”?吴朝雄:在我们的一线实践里,有哪些事情已经从“人做”变成“AI做”了?杜沛:先介绍一下我们在代码生成方面的实践,特别是与UI设计稿相关的“DesigntoCode”方向。其实我们在这方面起步较早,早在2023年AI刚兴起时,我们就已经开始尝试。但当时模型的能力有限,幻觉率很高,经常生成一些并不存在的内容。后来随着多模态模型的出现,我们看到了新的突破口。以往在开发中,页面复杂度会直接影响模型生成效果。页面信息越多,模型越容易出现选择性遗忘,遗漏部分细节。多模态模型引入图像理解后,情况有了明显改善。我们尝试了包括Claude、豆包等在内的多种方案,发现图像能帮助模型更好地理解UI的意图。例如,一个按钮是“登录”还是“分享”,一个区域是“Banner”还是“列表”,这些原本隐含的交互信息通过图像理解可以被模型更准确地识别。在此基础上,我们将图像理解与设计稿解析结合起来。目前我们内部使用MasterGo,通过解析设计文件并抽取关键信息,再反复加权强化这些要点,减少噪音的干扰。这一方法在实际应用中取得了不错的效果。从结果来看,我们的代码生成可用度已经能达到80%至90%。我们还进行了多轮跟踪测试,验证了它对整体效率的提升。但这并不意味着人力投入就能减少到10%。原因在于模型生成的内容仍需人工复核,比如对像素级别的比对、界面验收等环节,依旧需要人工严格检查。我们还在规范和记忆机制上进行了大量优化,使生成代码更符合人类开发习惯。我们还探索了多端代码转换,这部分逻辑规则相对清晰,比如在一端验证通过的逻辑可迁移到另一端,只需调整链路即可,这类任务AI处理得相当不错。例如,我们在H5、小程序或不同框架间的迁移中取得了良好效果。AI的代码生成质量可达70%以上,但由于后续仍需人工进行codereview与规范验收,整体提效约可达原来的1.5倍。相比传统自动化工具,AI的优势在于处理大规模工程项目时能更快定位、规划和生成逻辑,不再需要耗费数小时甚至数天运行分析。在代码审查方面。过去我们依赖静态扫描或动态分析,如今AI可以结合规范进行自动检测。针对不同技术栈、不同项目场景,只要设定好规则,AI就能识别潜在问题。通过这种双重机制,我们显著减少了测试阶段的bug数量,下降幅度可达30%–40%。虽然目前还难以精确评估线上bug的减少幅度,但测试阶段的改善已经非常明显。总体来说,这三个场景是我们在开发环节中最具代表性的AI应用。它们的共同特征是流程规范、任务可分解、结构化程度高。通过前期规划、阶段性检查与动态学习,能显著提升整体开发效率。颜志杰:首先,AI最擅长的是替代那些重复性、机械性的任务。过去我们主要依赖自动化手段来完成这类工作,但仍有许多自动化无法覆盖的场景。而现在,AI正在填补这些空白。以我们团队的项目“文心快码”为例,我们需要维护中英文两个版本的前端代码。以往需要人工分别开发并维护,现在我们通过设定规则,让AI代理完成中英文版本的互转。只需开发中文版本,AI就能自动生成英文版本,并完成验证与单元测试。这类工作过去靠自动化难以实现,而现在AI能高效、稳定、准确地完成。再回到之前提到的“一半是火焰,一半是海水”的比喻。AI在0到1阶段的创造性任务中表现尤为突出。例如生成脚本或原型开发,这些场景并不直接上线,但需要快速验证想法。AI在这里能极大提升生产力,让程序员将时间投入到更复杂的工作中。同时,它也让非技术人员如产品经理能通过草图与自然语言生成原型,促进沟通与协作。这种变化,本质上已经改变了开发流程。因此,我们可以看到,在0到1的“火焰”场景中,AI的潜力被充分释放。而像FigmatoCode这类应用,也属于这种相对简单、上下游关联较弱的领域,因而成为AI最先实现高效落地的方向。在测试用例生成方面,比如我在编写接口测试用例时,如果只针对单个接口进行测试,就不必绑定所有外部依赖,只需验证接口本身的输入输出是否正确即可。在这种情况下,AI的表现非常出色。当我们讨论“哪些事情从人做变成了AI做”时,我认为可以从DevOps或自动化的角度去理解:哪些任务过去依靠人工或传统自动化无法完成,而现在借助AI可以实现?如果重新梳理整个研发流程,就能发现许多环节都能精准匹配AI的特长,这正是AI替代人工的关键所在。吴朝雄:大模型的上层能力在于生成多样化的数据和内容,因此它特别适合用于数据构造或内容生成,比如最常见的文档润色。这类任务的模式固定、复现容易,AI能轻松胜任。以我熟悉的自动化测试领域为例,过去人力主要负责接口用例的生成和调试,而现在AI已经能在这一环节发挥很大作用。在简单的接口测试场景下,我们关注的往往不是接口背后的业务逻辑,而是接口是否能正常运行。无论是否使用模型,这类测试都可以完成,AI能自动生成部分输入数据,而人工也能手动构造,但差异在于复杂度。当测试对象是复杂接口时,情况就截然不同。在平安内部,很多接口都存在数据安全管控,需要身份验证或依赖上下游数据。一个接口往往依赖多个服务或数据库操作,无法仅通过简单的入参构造完成测试。要实现自动化,就必须先进行数据库查询、预置数据,再执行接口调用。这种场景对编排逻辑的要求极高,需要清晰的流程设计与强大的脚本能力。以往人工编写脚本容易出错,逻辑混乱、结构复杂,导致脚本无法执行。而现在,模型可以在理解数据库约束条件、接口逻辑、参数定义及场景需求后,自动组装上下文和执行逻辑,生成可运行的测试脚本。目前我们在平安集团内部通过共建与推广模式,将这项AI自动化能力推广到各子公司,用例数据的生成覆盖率已达60%左右。过去人工编写的测试脚本常出现逻辑漏洞或断言错误,而现在模型在理解接口文档、参数含义、代码逻辑及数据库结构后,能自动判断应先落库还是先查询数据,从而生成更合理的执行流程。举个例子:以前人工编写一个复杂接口的自动化测试脚本,通常需要一小时到半天不等,成本高且重复劳动多。现在通过模型生成,只需几分钟即可完成可执行用例,后续仅需微调即可,大大降低了人力投入。我们目前的重点是实现从用例生成到调试、评审、执行、诊断、报告生成的全流程自动化。这不仅需要多个agent协同,还需系统级的流程编排。我们的底层能力已初步搭建,计划在明年底前实现完整的全流程自动化编排体系。这将帮助我们真正跨越“原生时代”的技术壁垒,实现从辅助到自主的转变。过去测试人员需要思考如何设计用例,而未来他们只需关注“测什么”,也就是业务场景是否被充分覆盖。AI将承担设计和实现的繁琐部分,让测试人员转型为质量架构师,从事更高层次的质量保障与体系设计。3AI落地研发最先撞墙的是什么吴朝雄:当AI写代码、写测试、生成数据,真的进入真实业务后,最先撞墙的是什么?是稳定性?幻觉?规则不懂?还是团队不敢用?颜志杰:目前最大的问题在于AI的效果缺乏稳定性。当AI带来的收益不足以抵消改变原有工作习惯的成本时,落地就会变得非常困难,因为这种改变往往“反人性”、也“反直觉”。尤其是当人们尝试改变习惯后,发现效果依然不确定,那就更难推广与落地。因此,关键问题在于“稳定的效果”。比如在早期的Copilot模式中,AI用于代码续写或测试用例生成,对开发者的使用习惯影响不大,而且确实带来了一定收益。因为与传统基于规则的补全相比,AI的补全更智能,所以这种落地相对容易。但现在业界流行的SPEC模式却更复杂。开发者需要先进行需求澄清,不再是自己直接写代码,而是要通过与AI的自然语言交互逐步实现。特别是在大型存量代码库中,AI很难处理如此庞大的上下文。它有时能正确修改,但更多时候虽找到了问题,却以不符合逻辑的方式修改。例如,本该复用的函数被重复生成,或日志库被莫名替换。这些问题都让实际落地非常困难。因此,我们需要承认当前AI仍缺乏稳定性。若要务实推进落地,应从小任务开始,而非寄望“一句指令解决所有问题”。一句话对人来说都未必能准确表达,更何况对模型。即使写好了SPEC,也不能保证模型完全遵守逻辑。模型偶尔会“抽风”,即便明确要求它不做某事,它仍可能执行。所以我认为应像传统软件开发那样,从小任务、类工建设入手,写好文档、做好设计,逐步放大任务规模,探索人机协作的边界。随着信任与方法的积累,AI能承担的工作比例会逐渐提高,落地过程也会更加稳健。这是我对这一问题的理解与建议。杜沛:这实际上属于“信任建立”的问题。尤其在初期使用时,例如在IDE中输入需求,十次问答AI可能有两次回答不准确。用户往往会记住失败的那两次,因为那意味着额外的时间成本——要反复提问、修正,甚至多次都错,从而降低信任。在工具推广中,这种稳定性与容错机制尤为关键。如果AI结果不稳定,用户信任的建立就非常困难。算力问题也是一个重要因素。算力影响的不仅是能力,还有使用体验。模型响应越快,用户容忍错误的意愿就越高。比如从原先2分钟的生成降到10秒,即使结果出错,试错成本也低;但若等待5分钟仍出错,用户体验就会极差,负面反馈也更多。从数据来看,AI使用率差异巨大:有的用户AI参与率能达到50%,有的不足10%。我们分析发现,很多低效使用者的问题在于提示词太简单,只给出一个关键词或一句模糊话,导致模型误解意图、输出偏离目标。这种不当使用也加剧了体验差距。我们常收到反馈称“AI生成结果不对”,但很多时候问题在于输入模糊。为此,我们尝试在相同项目中预置模板或规范,提前定义依赖与规则,以减少AI发散造成的偏差。观众:用好AI做研发,对人员的能力模型是什么样的?吴朝雄:以测试领域为例,首先面临的问题就是“提示词工程”的理解。作为产品经理,我经常对接测试需求方,发现他们在使用我的AI工具或自动化测试平台时,往往在提示词能力上存在明显短板。在我看来,提示词工程的概念类似于“用户故事”。从产品视角来看,一个完整的用户故事需要把需求讲清楚,包括在什么角色、什么场景下,要解决什么问题,达成什么目标。提示词也是如此,应包含角色、场景、目标、任务等元素。提示词其实是一种“角色扮演”,你要让模型理解你的意图,就要让它进入特定角色,比如“作为某领域的专家”,让模型在特定规则与业务逻辑下执行任务。要让大模型正确理解你的指令,关键在于让输入的结构足够严谨、颗粒度足够细。比如定义“角色”时,要明确是产品实习生、助理、高级经理还是总监。不同角色视角不同,模型的解读结果也会不同。因此,第一个重要能力是写好提示词,而这需要持续的刻意练习与训练。第二个关键能力是“知识工程”。在研发领域,要让模型真正理解业务、帮助推动业务,就必须让它熟悉组织的知识体系。例如团队的流程规范、协作规范、人员管理、度量标准等。虽然这些在现实中可能以默认规则存在,但对模型来说,必须被整理成明确的文档,让它能够学习和引用。因此,使用AI的人需要具备撰写清晰、可拆解、可被模型理解的知识文档的能力。要为模型提供一套公开、可参考的方案,让它能基于这些资料进行模拟与推理。模型最擅长的不是从“无”到“有”的创新,而是基于已有知识进行“有到有”的推理。颜志杰:对于想要变得优秀的人来说,这是最坏的时代,因为你原有的技能一个都不能丢。AI还没有彻底改变工作范式,该懂代码的依然要懂代码;但同时这又是最好的时代,因为门槛变低了。很多过去需要花费大量精力的事情,现在借助AI就能高效完成。那些原本不会编程的人,若能善用AI,效率甚至能超过传统开发者。因此,关键在于你如何认知这个时代、如何定义自己想成为的人,再去决定你的能力模型和发展路径。像提示词工程、知识工程等能力,都是不可或缺的。吴朝雄:就像测试工作一样,要让模型理解你的规范,首先要把知识沉淀下来,而这些沉淀必须来自实际业务的经验,而不是由AI自己生成的。这些业务实践包括用例管理规范、代码管理规范、用例设计方法、代码设计原则等,都是研发人员必须掌握的基本知识。在此基础上,再去学习和掌握AI相关技术栈,并思考如何将这些技术与业务场景结合。要真正用好这些技术,就需要投入时间去理解、消化,并在实践中不断优化。观众:现在大模型的应用的技术栈都是java或者python的,百度内部使用的什么技术栈?颜志杰:我认为模型的技术栈与百度内部使用的技术栈并不存在直接关系。举例而言,搜索相关的程序可能是用C++编写的,云端的程序则多用Golang编写。但这两者的角色不同,一个是模型的生产方,另一个是模型的应用方。生产方使用什么语言实现模型,并不会影响应用方使用什么语言来调用或集成。对于应用方而言,无论模型是用于补全Golang、Java还是Python代码,其效果在当前模型体系下基本是一致的。4从“工具”到“协作者”吴朝雄:最近一个很明显的趋势是,行业似乎从“AI助手”在走向“智能体协作”。在你们的经验里,什么事情是原先的AI助手做不到,但智能体能做到的?杜沛:在我看来,最大的区别在于"闭环能力"——AI助手更多是单点辅助,而智能体可以串联起完整的开发-测试-审查流程。具体来说,从人工编写到AI编写,再到AI自动测试,最后由人进行结果审查与逻辑核对。这个方向无疑是未来的趋势,也是一种理想化的人机协同模式。AI参与写代码的关键问题在于如何保证生成代码的质量,特别是在业务开发中满足逻辑性和可靠性的要求。我们希望AI不只是做演示级别的Demo,而是真正能满足产品开发的实际需求,产出可维护性强的代码,而不是仅仅能“跑起来”的代码。如果生成的代码逻辑混乱或难以理解,后续维护人员需要重新阅读和分析,会带来额外的负担。因此,AI生成代码必须达到人类开发者可接受的标准,确保逻辑清晰、约束合理,才能真正降低人力成本。在测试环节,AI测试与传统人工测试的关注点也不同。传统测试主要关注结果正确性,而AI测试由于缺乏完整的运行环境,无法直接判断结果的对错。因此需要为其提供运行环境,帮助AI验证代码的构建是否通过、语法是否正确、边界条件是否覆盖等。对于复杂应用,尤其在移动端,还需在真机上运行测试,增加了难度和成本。AI测试不应仅停留在静态分析层面,而应延伸至动态运行状态的测试,才能形成更完整的闭环,从产品逻辑、代码质量、运行结果多维度提供保障。如果这一体系能实现动态测试闭环,AI将能更好地驱动整个开发流程,提升智能体验。这种模式的理想形态高度依赖于大模型能力。目前出现的“世界模型”虽然主要用于机器人,但未来也可能应用到软件开发与测试中。若模型能理解的不仅是文本或静态图像,而是结合视频、操作行为、屏幕显示等多模态信息进行判断,那么开发流程将迎来质的提升。吴朝雄:你提到整个研发流程会由agent协作完成。比如人类仅需输入开发意图,后续的代码生成与自测均由AI完成,人只需做最终审核。如果你们团队要实现这种流程的大规模落地,大概还需要多长时间?杜沛:从目前情况来看,这个目标短期内难以完全实现。按照我的预期,要真正打通流程、形成闭环,至少还需要一年以上的时间。颜志杰:AI助手到智能体的演化,本质上是从“动脑、动嘴”升级到“动脑、动手、动嘴”的阶段。AI助手主要处理思考和语言交互,而智能体则具备更强的自主执行能力。以研发领域为例,像Devin或SWEAgent就体现了这种形态。它们不再局限于IDE环境中的问答式交互,而是能在DevOps平台上自动执行任务,如代码生成、测试、验证、提交PR,甚至在发现问题后自动修复并反馈结果。这种模式体现出类人的逻辑链条:先观察,再推理,再行动,并持续感知环境变化。它不只是“口头助手”,而是能在异步环境中独立运作的执行体。过去仅依靠语言交互的助手无法完成端到端任务,如自动修复bug、补全测试用例、执行调试与代码审查,而智能体则能通过自主推理与操作实现这一切。这正是智能体强大的核心,也被认为是未来十年的关键方向。CodingAgent代表了通用智能体的发展路径,能独立完成软件研发任务的智能体,其潜力将远超特定工具层面的自动化,因为它更接近人类在物理与逻辑层面的行动模式。吴朝雄:智能体未来会走向统一的大平台,还是轻量化、插件化的生态?如果你们公司在研发类似产品,会倾向哪种形态?颜志杰:我更倾向于在当前模型能力的限制下,发展轻量化、插件化的生态。研发场景是一个极其严谨的科学过程,拥有成熟的流程来保证质量与协作。贸然构建“大一统平台”既不现实,也容易脱离实际。更合理的做法是让AI以插件形式逐步融入现有的软件研发体系,先观察它在各环节能带来多少改进。当AI能稳定接管50%以上流程后,再谈平台化整合才有意义。毕竟模型本质是概率系统,稳定性仍需时间和经验积累来优化。如果许多关键环节仍需要人工介入,就不应追求“全能平台”的虚高目标。吴朝雄:研发流程不仅涉及工具链,还包括人与项目的协作逻辑。这些协作往往在工具层面难以完全体现。当前的agent更多集中在单点问题的解决,比如帮助开发者发现或修复bug。但在DevOps层面,未来可能会出现更高抽象层次的AI工作台,整合数据检索、任务调度、执行分析等能力。例如JIRA已开始探索AI工作台,通过整合DevOps数据来实现项目进度追踪、代码库检索、任务完成情况分析、研发效能评估等功能。虽然目前仍以AI搜索为主,但雏形已经显现。国内多数产品还停留在单点agent阶段,尚未形成上层封装或生态体系。插件化生态仍是当下最稳妥、最现实的探索方向。观众:程序员使用AI生产代码,如何通过代码质量去给程序员打分,有什么参考指标进行绩效考核?颜志杰:目前几乎没有哪家公司会直接、明确地把“是否使用AI编码工具”或者“AI生成代码的比例”写进绩效体系。原因很简单:大家普遍仍然把AI当作一个工具,它的意义是提升效率,而不是成为评估个人好坏的指标。毕竟,AI生成代码的“量”与开发者真正的“质”之间差距很大。代码多不代表质量高,也不代表问题少。现在确实有很多公司会自上而下推动使用,比如用强制或激励的方式去推广CodeEngine类工具。目前也还没有出现那种“因为没用AI被扣分”的考核体系。唯一我听说比较激进的案例是Shopee,他们据说在绩效考核里已经纳入了一些AI使用相关的指标,但具体细节我还没深入研究。我的理解是,它更多是鼓励机制,比如“用得好、效果显著的人会得到奖励”,而不是“用得不好就被惩罚”。毕竟,AI用得少并不意味着你的产出不好。我们在内部推广AI工具时,也遇到过类似的问题。有开发者会问:“那如果我用AI生成的代码出了bug,这个责任算谁的?算我、算AI、还是算团队?”其实这个逻辑并不成立。你从网上复制一段开源代码,也没人会因此说那部分不是你写的。同理,AI工具只是一个辅助来源。我们团队目前在绩效体系里完全没有针对AI使用或代码质量的直接考核项,因为从逻辑上来说,这两者不能画等号。会用AI≠结果更好,不会用AI≠结果更差。考核的核心仍然是你最终的产出与影响,而不是过程里的工具选择。杜沛:我们会做一些“正向鼓励”,比如内部表扬或展示用AI提效的好案例,但不会强制,也不会把它绑定在绩效上。其实如果绩效里写“必须用AI”,反而会出现反效果,大家可能为了应付指标而“假用AI”,形式化操作,反倒偏离了效率提升的初衷。所以我们更倾向于通过文化与引导,而不是考核去推动AI的普及。吴朝雄:很多人听到AI进入研发流程,第一反应是“那我是不是要被替代了?会不会影响收入?”但现实是,AI更像是一种角色转变的工具,不是替代的力量。就拿测试岗位来说,AI确实能帮测试自动生成用例、发现缺陷、分析日志,但测试岗位并不会因此消失,而是转向更高层次的工作,比如验证业务逻辑、优化测试策略、整合分析数据等。AI带来的不是岗位的消亡,而是岗位价值的重塑。开发和测试都会因此变得更具策略性和创造性。5价值与人吴朝雄:未来两年,哪类工程师的价值会被放大?为什么?过去编写自动化测试脚本需要人工手动完成,投入成本很高,复杂脚本往往需要数小时甚至半天时间才能写好,因为其中涉及多个请求才能实现一个完整的功能测试。以往测试人员主要考虑如何设计一个准确、可用、能反映业务功能的测试用例。而现在,AI已经能在很大程度上突破“用例设计”这一难题。原因在于,AI能直接利用详细的代码和需求文档进行生成。例如,在接口自动化测试中有接口文档,在UI自动化中有页面组件信息,这些元素都可以在前期沉淀好。团队只要做好这些准备,后续在设计测试方案或测试用例时,就不再需要耗费大量时间思考脚本逻辑的构建,而是更关注测试本身能否发挥最大价值。重点转向“测什么”,也就是每个版本中要验证的代码与功能点。这才是测试人员更具专业性的部分。AI的引入并不意味着可以不懂代码,反而要求更精通代码。类似地,产品经理的角色也在变化。过去产品经理只需清楚表达逻辑即可,如今若希望模型辅助完成上下游流程,就必须把功能性和非功能性需求都描述清楚,并具备对系统架构的理解。未来产品经理不仅要懂业务逻辑,还需熟悉技术架构与系统关系。单纯掌握局部需求的产品经理将被替代,因为模型已经能根据业务逻辑生成漂亮的需求文档。而具有综合竞争力、能从全局视角解决问题的产品经理,将更具不可替代性。如果一个产品经理既懂技术、又懂业务与测试,即使每个领域不精通,但具备全面理解,就能在向下游输出内容时发挥不可替代的作用。事实上,AI的到来让产品角色更为重要。因为随着自动化程度提高,下游环节反而更依赖产品的决策与协调。同样地,对于其他岗位也是如此。以前端为例,基础的页面组件如今模型都能自动生成。但如果前端工程师同时理解后端逻辑与算法,就具备独特的竞争力。这种价值不在于页面是否漂亮,而在于对性能、架构、前后端交互的整体把控。当你能从架构视角考虑系统设计,具备整体技术思维,这种能力是AI无法取代的。因为你不仅懂代码规范,更了解团队系统的整体结构。AI时代加速了知识学习的深度,也推动各角色从“执行者”向“评估者”或“决策者”转变。当能力提升、知识扩展、角色升级,个人价值也会随之放大。这种变化不仅限于产品岗位,所有角色都在经历类似的转变。AI在研发领域的普及会凸显那些具备高水平能力的人,而只掌握基础技能的人可能被替代。要体现自身价值,关键是展示核心竞争力。这不仅包括AI使用能力,也包括坚实的基础知识储备。颜志杰:能熟练使用AI的人往往像架构师。架构师之所以重要,是因为他们能理解业务的边界与约束。AI在小任务上表现出色,但系统层面的设计、分层、异常处理仍需架构师来把控。AI无法承担系统责任,因此架构师在更高层次上能统筹全局,这种能力尤其重要。其次,是协作能力。同样使用AI,有人能比他人高效五到十倍。关键在于是否能清晰地与AI沟通任务,让模型理解意图。这不仅是一种思维能力,更是一种“放大效应”。第三,是持续学习与创新能力。我们要理解“如何做”与“为什么做”,因为技术更新极快,今天的框架明天就可能被替代。最重要的能力,我认为是“品味”。它类似艺术领域的审美判断。未来,当AI的供给极其丰富时,真正能体现个人差异的,就是对产品“应该做成什么样”的判断力。正如乔布斯设计手机时所展现的那种独到感知。好的产品设计需要这种品味与调性,而这正是产品经理不可替代的价值所在。杜沛:AI虽是概率模型,但若想真正用好它,必须理解其工作原理和局限性。虽然我们无法直接训练模型,但要知道如何高效使用。掌握这种能力能极大提升工作价值。例如,全栈工程师的价值可能更高。过去想要精通多种语言几乎不可能,如今借助AI,一些原本难以完成的任务也能实现,甚至做得更好。比如,前端工程师过去需要依赖数据分析师完成数据查询,而现在借助AI,通过日志查询平台就能快速生成SQL查询,无需他人协助。这种方式能显著提升个人能力的边界,使工作成果得到放大。只要你能善用AI,让它真正帮助你解决以往无法完成的任务,你的价值自然会提升。正如前面提到的,AI在研发中目前主要体现为效率提升,但这只是阶段性结果。未来随着模型形态变化,输入方式将不再局限于文本,还可能包括视觉、听觉等多模态信息,届时能实现的功能会更多。只要能真正用好AI,让它为你所用,你的能力与价值就会被放大,而不是取决于你属于哪一类工程师。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/17
AI下一站,软件应用是星辰大海
AI重塑世界,下一个“主战场”将是软件应用。大洋彼岸已经验证。英伟达亲自下场,今年的4起并购,全部是软件应用公司。美国老牌软件公司甲骨文拥抱AI+云计算,业绩超预期增长,2026年第一财季剩余的履约义务(即预订量的衡量指标)同比暴增359%,达到4550亿美元。新锐AI软件公司Palantir继续强劲增长,2025Q3营收11.81亿美元,同比增长63%,净利润4.77亿美元,同比增长220%,最新市值已达到4550亿美元。在国内,随着AI大模型持续升级,AI+软件应用也正如火如荼。C端加速渗透普及,据QuestMobile统计,截至2025Q3,国内移动端AI应用的用户规模已突破7亿。B端“供需两旺”。一方面,数智化转型已成为必答题,很多企业不再观望、犹豫。在他们看来,软件不再是开支,而是必须的投资。另一方面,得益于技术进步和政策支持,国产软件厂商已自主研发出国产操作系统,并推出了AIAgent等解决方案,生态日益繁荣。对此,中信建投认为,AI将推动国产软件厂商价值重估,将进一步打开估值“天花板”。在这一背景下,软件ETF易方达(562930)等相关指数产品,受到了投资者关注。国产软件“大航海时代”过去几年,卷硬件、卷AI大模型。如今,卷AI软件,落地应用,聚焦实际价值,正成为AI产业的主流叙事。值得注意的是,这也是政策鼓励的方向。“十五五”规划建议提出:全面实施“人工智能+”行动,以人工智能引领科研范式变革,加强人工智能同产业发展、文化建设、民生保障、社会治理相结合,抢占人工智能产业应用制高点,全方位赋能千行百业。近期,高层发文明确要求:2027年央企国企实现100%国产替代,覆盖操作系统、数据库等信创全产业链。另一方面,国内AI需求持续爆发。在C端,用户愈加青睐智能化应用。如金山办公旗下的WPS,截至2025上半年末,WPSAI月活2951万。还有字节旗下的豆包,截至2025年9月末,MAU达到1.72亿。在B端和G端,政策驱动叠加数智化转型浪潮,越来越多企业、机关机构更倾向通过AI来降本增效,他们还希望打通“数据孤岛”,借助AI大数据实现智能决策。与此同时,供给端正在革新。部分国产软件公司率先拥抱AI,打破海外垄断,已崭露头角。例如,在基础软件领域,华为发布的鸿蒙操作系统已“进化”至HarmonyOS6,终端设备数近2500万台。中国软件旗下麒麟软件自主研发的银河麒麟操作系统V11,已发布上线,它是国内首个突破百万生态的国产操作系统,已经与国产主流CPU、GPU及板卡实现全面兼容。在应用软件领域,EDA是芯片设计的“灵魂工具”,长期被国外厂商垄断。近期,启云方自主研发并推出了两款EDA软件,实现了从0到1的突破。AI奔涌激荡,政策、需求、供给“三重共振”下,国产软件将进入“大航海时代”。中国软协预测,2025年中国软件产业规模将达到15万亿元。高盛认为,到2030年,仅AIAgent,就将驱动全球软件市场规模至少增长20%。据此计算,仅AIAgent,就将在国内软件市场创造出万亿级的商业增量。同时,AI还将为国产操作系统、国产数据库等软件的可持续发展,注入更强劲的动能。展望未来,AI+国产软件拥有极强的确定性,它的想象力是“星辰大海”。把握主线,踏浪AI当前,上证指数已突破4000点,行至近十年的高位。后续,投资者该如何把握方向?兴业证券全球首席策略分析师张忆东认为:震荡不会影响A股“长牛”的底层逻辑,明年的主线依然是科技。更长远来看,AI浪潮才刚刚开始。民生证券在研究报告中指出,国产算力与国产软件共振,是后劲更强的方向。开源证券表示,AI软件加速突围,计算机板块的配置价值将愈加凸显。其中,中证软件指数年内涨幅为13.34%,低于通信、电子等板块的涨幅,从机构持仓比例和估值水平来看,后续都有较大的修复空间。对于普通人,尤其是投资新手来说,股市浮沉,要理解深奥的AI技术、复杂的软件产品,再筛选、投资优质个股,并不容易。专业的人做专业的事,软件ETF易方达(562930)是一个相对便捷的投资工具,正备受关注。它紧密追踪中证软件指数,一键“打包”了中国软件行业的“核心资产”。具体来看持仓,截至今年三季度末,软件ETF易方达(562930)前十大持仓为:科大讯飞、同花顺、金山办公、指南针、恒生电子、润和软件、三六零、拓维信息、用友网络、深信服。其中,科大讯飞是国内政务、教育、硬件等领域的AI先锋,2025Q3,其营收60.78亿元,同比增长10.02%,归母净利润1.72亿元,同比大幅增长202.4%。WPS母公司金山办公,是国内AI办公软件的龙头。2025Q3,其业绩稳健增长,营收15.21亿元,同比增长25.33%,归母净利润4.31亿元,同比增长35.42%。深信服的主营业务是网络安全、云计算及IT基础设施,也是国内AI+软件的领军者。今年第三季度,得益于AI业务持续突破,其营收21.16亿元,同比增长9.86%,归母净利润1.47亿元,同比大幅增长1097.4%。从更宏观的视角来看,国产软件的崛起,不仅仅是一次产业升级,更是中国科技实力、AI能力的彰显,是一个确定性的趋势。与此同时,乘着AI东风,跟踪恒生科技指数的恒生科技ETF易方达(513010)等产品近期也备受关注。从持仓来看,恒生科技ETF易方达(513010)主要聚焦中国AI应用的领军企业。如阿里、腾讯已成为云计算+AI基础设施,AI技术正广泛应用于电商、社交、金融等领域。京东、百度、美团也是AI先锋,正通过AI重构电商、出行、零售、医疗健康等行业。比亚迪股份、小米集团正将AI嵌入手机、汽车、家居等场景,同时还在积极探索具身智能的落地应用。资金流向方面,投资者正持续涌入。截至11月11日,恒生科技ETF易方达(513010)规模达到241.21亿元,年内增长了166.76亿元,增幅为224%。总的来看,投资必须把握未来趋势。站在长牛周期,拥抱AI时代的红利,AI+软件、国产化、AI应用,值得长期关注。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/17
AI浏览器Atlas,能否拯救亏损百亿的OpenAI?
AI浏览器,能不能革了传统浏览器的命?上周二,OpenAI发布的AI浏览器Atlas,图标看上去和GPT关系就很近。打开浏览器,需要使用GPT登录,可以选择一键导入Chrome浏览器的标签页。浏览器首页就是Chatgpt的对话框,和网页端的布局一致,过往的对话也完整保留。试着问了一个问题,在对话框顶端出现了五个选项,可以切换AI回答、网页、图片、视频或新闻结果。这样看,Atlas在搜索上和传统浏览器给出的选项类似,只是优先给出GPT的答案。点开一张具体的网页,网页右上角会出现一个“询问GPT”的功能按键。不需要再把信息复制粘贴到网页端,人们便可以直接就网页内容提问AI。很明显,OpenAI此举把矛头直接指向了拥有Chrome浏览器的谷歌。浏览器作为目前桌面端最大的用户流量入口,OpenAI这次做浏览器,是要更多的流量。OpenAI成立之初是一家非盈利机构,强调以实现AGI为目标,但在此过程中的研发和算力消耗是一笔巨大的持续性资金投入。10月28日,OpenAI宣布已完成资本重组,其不再是单纯的非营利组织,公司继续由非营利母公司控制,但将现有的营利部门改造成公共利益公司,该结构可以兼顾盈利目标和公益事业。近日路透社报道称OpenAI正在寻求上市,OpenAI首席执行官SamAltman也曾在公开直播中提及资金短缺问题,预计OpenAI2029年将消耗1150亿美元,而今年收入预计为130亿美元。不过,近期他又表示OpenAI实际营收远超这个数字,公司没有就上市做出决定,“我只是觉得事情最终会朝着那个方向发展。”OpenAI一直在谋求更多的利润空间。今年ChatGPT先是加入了电商业务,用户可以点击外部商品链接,接着又上线了付款功能,用户可以在GPT下单购物。现在OpenAI又做起了最大的流量入口——浏览器,使得被移动端抢了风头的桌面浏览器再次复兴。除了资金问题外,OpenAI的入局还有更加重要的原因——AI浏览器,有可能彻底改变我们和AI的关系。谁抢先把握住这个入口,谁就有可能再现“谷歌时刻”。等到那时,弥补现在的百亿亏损自然不是问题。AI浏览器大战,全面升级在过去很长一段时间里,AI浏览器走的是“集成”路线。顾名思义——“把AI放到浏览器里”,主要采取的方法是把AI放进侧边栏,人们在使用浏览器时可以随时对网页内容进行提问。侧边栏一度成为AI模型的“T台秀”。从豆包、DeepSeek到Gemini等等,各大AI模型纷纷提供网页助手插件,封装在侧边栏中,提供翻译、总结、快捷问答等功能。这样的结合方式大多基于浏览器的架构,网页助手能做的事情也有限。相比之下,这个赛道初创公司的产品Comet、Dia等采取了更加激进的方式,让AI直接上手解决人们的需求,不再只辅助人们理解“浏览结果”。图|Dia首页截图;Comet首页截图Atlas走的也是这条路线,概括特征是将AI置于浏览体验的核心。Atlas首页始终放置GPT搜索框,搜索后仍然以对话形式显示,不过在顶部栏可以选择传统浏览器的格式,还有生成图片等选项。Atlas支持谷歌插件,且在安装时用户可以选择导入谷歌或者Safari浏览器的书签。在任何网页上,AI都能直接“看到”并理解当前页面内容。分析代码、比较产品参数,无需用户手动复制粘贴。如果用户在隐私设置中允许Atlas访问记忆,浏览器能够记忆用户更多的浏览数据,并将其作为上下文。用户能够以自然语言打开历史记录,例如回顾上周看过的某篇文章。此外还有代理模式(目前仅限付费订阅用户),允许Atlas自主或半自主地处理某些任务,这也是AI从搜集信息走向电子秘书的关键一步。获得授权后,Atlas可自主执行多步骤网络操作,如自动搜索、填写信息、提交订单等。OpenAI首席设计师称之为“邀请ChatGPT进入你互联网的角落”。当浏览器开始基于浏览数据“了解你”,它就不再是被动展示信息的工具,而是一个能理解、记忆并主动为你执行任务的助手。在OpenAI之前,已有多家初创公司在这一方向上先行一步。AI搜索公司Perplexity推出浏览器Comet,TheBrowserCompany先后推出了Arc和Dia两个AI浏览器。以Dia为例,其设计简洁,核心是强化AI的“研究秘书”能力。目前Atlas还不支持引用多个网页,Dia可以对多个已打开的网页提问。对于需要浏览阅读大量信息的研究者和内容创作者来说,Dia是一个大脑容量无限的“信息秘书”。图|试用dia的网页比较功能Atlas的发布两天后,微软巧合般地推出Edge浏览器全新“Copilot模式”,试图将Copilot从被动的“助手”升级为可以执行任务的“智能体”。新增的“Actions”功能允许AI填写表单或预订酒店,“Journeys”能追踪并分组相关标签页。国内市场同样有类似的AI浏览器。目前,豆包电脑端界面也是AI对话栏,顶端栏显示打开的网页,支持导入Chrome书签,和Atlas采用的同类布局。虽然下载过程中豆包一直以“AI桌面助手”介绍,但打开设置可以看到设置默认浏览器的选项。除此之外,夸克浏览器界面也是AI对话,提问后AI回答和网页搜索在同一界面。无论是从模型出发打造浏览器,还是改装升级原先的浏览器,国内外AI浏览器大战随着OpenAI的入场,进入白热化阶段。OpenAI为何入局AI浏览器?从2022年底GPT发布算起,大模型之间的竞争已经打了快三年。DeepSeek、Gemini、Claude……新玩家层出不穷,用户的选择越来越多。在这场旷日持久的技术竞赛里,赚钱始终是最难的一环。AI的商业化形式有限,靠烧钱堆算力、靠订阅支撑研发,都不是长久之计。各个模型开始想办法增加用户的停留时间,获得更多的商业化可能。这时,“浏览器”成了一个更具想象力的入口。相比AI网站,浏览器天然就有更强的用户黏性。人们打开网站只是“用完即走”,广告插进去反而会破坏体验;但浏览器作为信息的起点,是所有上网行为的开关。谁掌握了浏览器,谁就掌握了流量。浏览器享有着“信息集合”这一牢固的用户心智,且从商业角度,显示顺序、边栏都是很好的广告位置。这一领域占据霸权地位的是谷歌的Chrome浏览器。根据数据平台Statcounter统计,截至2025年10月,Chrome占据全球浏览器市场的73.22%,有着毫无争议的霸主地位。网站分析工具Similarweb的数据显示,ChatGPT.com网站目前月访问量高达59亿次。据TechCrunch今年7月报道,OpenAI首席执行官SamAltman表示其活跃用户数超过8亿。不难想象很多用户打开浏览器的首要目的已经成为了使用AI。推出浏览器,标志着OpenAI想要从一家”技术公司“转向建设属于“用户平台”,把入口、用户与数据全部掌控在自己手里。GPT做浏览器还有初创公司比不了的优势。Dia浏览器的公司推出的另一款AI浏览器——Arc浏览器,产品也备受好评,但由于功能的创新性较高,用户群体相对小众,最终团队决定转向开发一个更大众的AI浏览器,也就是Dia。GPT有着庞大的用户群体,不必太过担心新功能对用户的阻拦,这是OpenAI天然具有的竞争优势。用户无需重新积累数据并形成个人画像,可以一键迁移过去的记忆、与GPT自动共享搜索记录,使得聊天更顺畅。能够在Atlas获得更好的GPT使用体验,这足以吸引用户进行一次产品尝试。对OpenAI来说,这些信任的用户数据还能反哺模型训练,让模型越用越聪明、体验越顺滑,形成一个正向循环。所有的在线行为都在这一环境中发生,这个平台会逐渐拥有对你最完整的理解,成为最好的“电子亲信”。你使用得越频繁,它就越了解你,从而你也越离不开它。AI浏览器,再造谷歌时刻在移动互联网时代,浏览器能再次成为巨头争夺的流量入口,关键在于Agent的爆发——让AI长出“手脚”。Agent出现之前,浏览器仅是信息网站和用户的中介。如果人们想要在众多香水品牌中选择一个,需要浏览多个品牌主页或者电商平台,在多个网站之间跳转并自己总结不同牌子的异同。有了Agent的加持,浏览器成为智慧和执行力并具的助手。人们只需要用自然语言描述自己的需求,模型会解读含义,Agent会自动执行任务。2025年7月21日,Perplexity完成1亿美元融资,企业估值达180亿美元。AI搜索公司获得的高估值,一定程度上反映了市场对搜索引擎变革或“新入口”形态的期待。但用户能否真正改变搜索习惯,还要打一个问号。浏览器是用户在电脑端使用时间最长的工具,短时间内更改习惯必然不现实。与此同时,AI浏览器还必须面对两个现实问题。这些新功能需要强大的算力支持,多以付费订阅的形式提供服务,这需要用户接受从“免费浏览”到“付费使用”的观念转变。除此之外是用户对安全的忧虑。当浏览器拥有了更强的主动执行能力,新的安全隐患也随之而来。据FORTUNE报道,目前AI系统还难以完美区分用户的可信指令和来自网页的恶意指令。黑客可能会隐藏这些指令,例如在网站某个位置采用机器代码,对人类用户来说难以察觉,但AI浏览器仍会读取,这意味着AI助手可能由于盲目听信诈骗指令,对用户造成损失。Reddit论坛上也有不少用户表露出对隐私的担忧,很多用户难以接受一个AI代理了解和控制自己的信息。图|Reddit论坛的讨论不过改变也不是完全不可能。当谷歌推出Chrome时,IE浏览器凭借操作系统的捆绑占据着绝对主导地位。Chrome凭借在速度、稳定性和简洁性上远超IE的体验,成功实现了大规模的用户迁移。只有新产品能在体验上有足够好的改善时,颠覆成熟市场的逆转才有可能发生。从目前的产品形态来看,Agent在阅读和整理信息时表现尚可,但在实际操作复杂的网页界面以执行任务时,仍处于早期发展阶段。但可以预见,未来的所有浏览器都将具备AI能力,走向“AI专业秘书”。开发Dia的初创公司创始人JoshMiller预言,五年后,桌面端最常用的AI界面将取代过去的默认浏览器。在AI浏览器功能尚不完善的今天,AI界面将如何重塑人们的上网体验仍然是一个谜题。不过我们可以相信,这个问题背后是广阔的想象空间,必将是一种全新的获取信息、融入数字世界的方式。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/17
别被骗了,AI Coding可没那么神,22名软件开发者道出了这些弊端
唯有变化才是永恒。软件的产出速度,从未像今天这么快。以ChatGPT、GitHubCopilot为代表的大语言模型(LLM)驱动代码生成器和编程助手,正在重塑软件开发者的工作方式。LLM不再只是工具,而是一个随时待命的虚拟搭档。AICoding正在成为全球科技巨头和初创企业的战略焦点。然而,尽管沉浸在AICoding中的软件开发者们将工作效率提高了26%,但也不得不思考一个新的问题:当AI可以生成实用代码,我们还在“开发”什么?当效率被AI极致放大,创造力与思考是否正在被稀释?日前,莫纳什大学、新加坡管理大学团队通过实际访谈22名软件开发者,探讨了LLM对软件开发的影响,以及如何管理这种影响。论文链接:https://arxiv.org/pdf/2511.06428结果显示,LLM有助于提高开发速度、维持开发流程、促进创业等,但也存在导致损害开发者声誉、影响个性(如懒惰)、阻碍开发者提升技能等风险。此外,研究团队还提出了一套关于如何最佳使用LLM进行软件开发任务的建议。研究方法为了理解软件从业者在采用LLM进行软件工程活动时的真实感受,研究团队采用了社会技术扎根理论(STGT)方法。该研究共分三轮,基于22位软件从业者的访谈数据进行收集与分析。在第一轮中,研究团队采访了6位初级开发者;在第二轮中,他们采访了13位初级与有经验的开发者,以提炼核心概念与类别;在第三轮中,他们又进行了3场访谈,以验证和完善理论。图|研究方法的全流程概述就LLM使用情况而言,多数参与者使用过多种LLM工具,其中ChatGPT最常被使用。大多数参与者使用LLM的时间超过一年,约59%的参与者每天与LLM至少交互6次。图|受访者使用LLM的情况研究结果基于上述方法,研究团队根据个人、团队、组织和社会层面,识别和分类了采纳LLM进行软件开发任务的益处和弊端。分别如下:▍LLM如何帮助软件开发者进步?个人层面,LLM有效提升了软件开发者的开发效率和学习能力。。LLM能自动生成样板代码、修复语法、提供即时反馈,帮助开发者节省时间、减少中断并保持“心流”状态。同时,LLM也是学习与反思的工具——开发者能借助它理解陌生代码、掌握新语言、比较不同解法。LLM还能够为开发者提供心理支持,让他们敢于提问,不怕暴露自己的无知,从而增强信心与主动性。图|LLM对个人开发者的积极影响团队层面,LLM减少了开发者之间的协作干扰与沟通成本。新手小白能够先借助LLM解决问题,再向同事求助,团队的运转更高效。LLM还能提供“第二意见”,帮助团队跳出惯性思维,提升整体创造力。组织层面,LLM节约了软件开发公司的时间和成本。LLM能够加快整体调试、排错与代码审查等流程,特别是对中小型企业而言,能以更少的人力完成更多的任务。社会层面,LLM促进了创新创业。许多开发者用LLM快速完成原型设计、学习商业与技术知识,降低了创业门槛。LLM甚至可以作为日常生活中的智能顾问,帮助解决时间规划和信息检索等问题。▍LLM如何阻碍软件开发者发展?当然,基于LLM的AICoding也并非没有弊端。例如,许多软件开发者发现,LLM在生成代码或提供建议时容易出现错误或“幻觉”,反而拖慢了进度,还需要花额外时间验证结果。而且,频繁的上下文切换、提示分解和反复修正也让工作量不减反增,过度依赖LLM也可能削弱开发者的代码理解力与学习动力。一些开发者提到,长期使用LLM会导致自己变得懒惰、冷漠,甚至对自身能力失去信心;新手则更容易陷入“让AI替我思考”的陷阱,导致技能停滞。更严重的是,当LLM生成错误代码时,责任仍由开发者承担,影响个人声誉。图|LLM对个人开发者的负面影响此外,由于担心LLM输出的代码涉及版权或许可问题,部分软件开发公司会明令禁止员工使用LLM。而且,LLM生成代码中可能隐藏漏洞,引发安全隐患。值得一提的是,成本问题也是一大阻力——频繁调用LLM需要付费,增加了企业的运行负担。最后,LLM的普及也让一些人面临失业的风险。虽然高精尖开发者依旧重要,但依赖经验和重复性工作的技术岗位正变得岌岌可危。▍软件开发者如何正确使用LLM?那么,既然AICoding是未来的一大趋势,开发者如何“既要又要”呢?根据访谈结果,研究团队发现,许多开发者会在不同LLM之间反复试用,直到找到最契合自己工作需求的LLM。通过这种比较,他们逐渐认识到LLM并非“智能体”,而只是基于统计的工具,于是选择使用不同LLM解决不同问题,例如,用ChatGPT处理需求沟通,用Copilot辅助编码,这反映了软件工程向“代理式”系统演进的趋势。此外,不少开发者更倾向让LLM参与代码优化而非直接生成,从而保持对逻辑与结构的控制。他们甚至出于隐私考虑,选择在本地运行模型,哪怕牺牲部分便捷。当前,软件开发者需要与LLM维持一种成熟的关系:既信任其能力,又保持理性距离,用人机协作的方式扩展自己的边界,而不是被取代。总之,无论使用什么工具,在软件开发工作中都离不开“直觉”。这里的“直觉”不是模糊的感觉,而是开发者在长期经验积累中形成的快速判断能力。它是一种经验性思维,帮助开发者在复杂和不确定的情境下做出决策。这种基于经验的直觉在开发者与LLM协作时,起到了“安全阀”的作用:当LLM提供错误或误导性的建议时,帮助开发者识别出问题、避免盲从模型的输出。那么,另一个问题来了,当开发者越来越依赖LLM生成的代码或建议,他们的直觉是否会被侵蚀呢?本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/15
谁是AI领域下一个敲钟人?
怎样的AI企业才能成为市场共识?自2023年下半年以来,已有25家人工智能相关企业在港交所IPO上市,仅2025年上半年就有5家AI企业成功上市。可见AI板块正成为资金链条上最具确定性的增长点。资本的目光从来不会无的放矢。那些被资本选中的“AI宠儿”们,究竟具备怎样的共性?哪些落地方向最具现实变现潜力?而想成为“AI第一股”的公司,又应该怎么走?2025年,AI似乎成了少数仍能汇聚确定性与想象力的方向,吸引着资金、人才与叙事的加速汇聚。IT桔子数据显示,截止今年三季度,共有764家AI公司获得风投投资,创下近五年新高,交易金额高达830亿元。表面上看,一级市场热度在回升,但事实上,市场可投赛道并不多,而资金仍集中涌向了AI领域,呈现出一种风景独好的状况。这种“热度集中”的现象,并非只出现在一级市场。二级市场的IPO动向,同样验证了AI的资本吸引力。据LiveReport大数据统计,自2023年下半年以来,已有25家人工智能相关企业在港交所IPO上市,仅2025年上半年就有5家AI企业成功上市。可见AI板块正成为资金链条上最具确定性的增长点。资本的目光从来不会无的放矢。那些被资本选中的“AI宠儿”们,究竟具备怎样的共性?哪些落地方向最具现实变现潜力?而想成为“AI第一股”的公司,又应该怎么走?这些,正是下一阶段AI产业竞争的关键命题。被资本选中的“AI宠儿”们对比2024年,今年被资本选中的AI企业,显然更加务实。据产业家统计,2025年前三个季度,人工智能领域一级市场共发生548起交易事件,同比增长44.59%,具体到细分赛道上,AI通用应用和AI行业应用占据近一半,成为增长最迅猛的两条主线;在交易金额上,AI行业应用则跃升为资金最集中的洗到赛道,达到150亿元。这一趋势与去年资本在AIGC层的狂热完全不一样。2024年同期,AIGC赛道交易金额高达308亿元,占总额六成。而今年这一数字锐减至111亿元,同比下降64.01%。资本对AIGC“降温”也直接拉低了整个AI交易金额,使得2025年前三个季度交易金额仅为460.64亿元,同比下降8.43%。然而,资金并未离场,而是更精准地流向了“能落地”的领域。资本将更多资源投向AI通用应用、AI行业应用以及AI基础技术三大方向,分别增长216%、36.8%和153.74%。值得注意的是,基础层虽然拿到更多融资,但这在一定程度上与该领域设备重、投入高有关。资本不是收缩,而是在调整配置,把钱放在更能转化为生产力的地方。进一步剖析前三季度一级市场获得1亿以上融资的企业,发现大部分公司主要是聚焦于医疗、物流、自动驾驶、机器人、营销数字化这几类具体的应用场景。资本显然在回归一个原则,即AI要“接地气”。再看AI领域的二级市场。截止2025年7月,二级市场成功上市五家企业,涵盖仓储物流、解决方案、无人矿卡等多个领域。表面上看这些企业也属于行业应用,但不同点在于,IT桔子将这些企业归于了AI基础层和AI技术层。此外,这些企业普遍具备稳健的盈利能力。例如极智嘉收入达人民币10.25亿元,同期增长31.0%,这得益于仓储机械人跑通AI商业模式;云知声虽整体利润增长放缓,但其山海大模型收入近1亿元,同比激增457%。显示出AI技术在原有业务体系中的放大效应。值得注意的是,无论是一级市场还是二级市场,这些“AI宠儿”大部分AI属性都不够“纯粹”。换句话说,AI并非它们的唯一标签,大多数并不是AI原生公司。明略科技仍以政企数字化、知识图谱和智能决策为主营;云知声早在2012年成立,定位也曾转换;滴普科技的根基在数据分析。一级市场上,真正“纯AI”的公司屈指可数,仅有的几家,背后也都有巨头加持或成熟产业链的资源托底。比如betteryear背靠阿里,IntentAI获得的是战略投资。同样地,二级市场的赢家往往是那些深耕行业已久,再借AI完成跃迁的企业。这透露出一个耐人寻味的现象,无论是一级市场还是二级市场,资本押的不是AI,而是“能AI化的公司”,真正走向IPO的公司更是有着清晰的商业化路径。AI落地产业,真实温度几何?资本的选择,从不是孤立事件,这背后反映出的是市场对落地难易度的集体判断。回看AI技术热潮袭来的这几年,技术落地最多、最快的是界面层的改造。这一层改造集中发生在编程开发、客服、办公、内容营销等场景,它们具备“低风险、高频率”的特征,AI在这些环节提升了操作效率、降低了人力成本,也迅速让企业初步看到了ROI的正反馈。比如在编程开发场景,GitHub的一项研究显示,AI编程助手可使开发者完成任务的速度提升约26%,AI不仅擅长代码补全、单元测试生成、逻辑优化,甚至参与初步的代码审查。但随着AI进入更高阶的开发环节,短板逐渐显现。MIT一项实验指出,对于资深开发者而言,AI对生产力的提升仅为8%~13%,甚至在某些场景中,AI的引导反而让开发时间延长了19%。这也解释了为什么在一级市场上,许多主打界面层应用的AI初创企业在早期看似炙手可热,却很难持续放大营收曲线。技术门槛不高、服务可替代性强、同质化严重,是这个赛道的系统性难题。这些界面层的AI改造,只有与业务流程深度串联,才能释放真正的生产力。一些企业已经意识到这一点,开始将AI嵌入核心业务链条。由此,在医疗、金融、教育、物流、零售等领域,AI的重心正逐步下沉至流程层的改造。医疗行业是一个典型样本,阿里云白皮书提出的四象限模型显示,医学影像诊断与药物研发处于“高成熟度+高潜力”区间,其中医学影像AI产品商业化率已达90%;英矽智能其生成式AI平台将抗体研发周期压缩10倍,实现四项药物授权合作,总金额超15亿美元。而就在今年这家企业获得多笔大额融资。AI在医疗行业的落地,不仅限于研发。BD公司通过预测性分析优化库存管理,将预测准确率提升20%,显著降低库存成本;而森亿智能的智慧医院解决方案,通过AI驱动的病历生成与质控,将医生文书时间缩短50%;西门子的AI平台,在提升诊断精度的同时,将放射科工作流程效率提升40%,实现协同优化。这些案例背后的共同点在于AI不再只是工具,而是嵌入系统之中的决策变量。一旦进入流程,它便成为企业最深的护城河,也因此成为资本最愿意押注的方向。但流程层的改造并不轻松。首先是数据,企业的数据分散在不同系统、格式不统一,AI模型要理解需要大量清洗与标注。其次是组织,要让AI接管决策流程,意味着管理层要放权给算法。多数企业依然在“AI+人工”双轨状态,模型决策还需要人工验证。医疗场景就凸显了这种复杂性。数据偏差、解释性不足、伦理责任模糊、流程嵌入复杂等问题,使得AI目前在医疗行业主要承担质控、影像判读、医患沟通等角色,离“独立诊断”仍有显著距离。不过,从技术节奏来看,这仍不是AI落地的尽头。AI真正的价值,在于对业务逻辑的重新定义。这一层不是工具升级,也不是流程优化,而是对整个系统运行机制的重塑。自动驾驶、具身智能,以及像京东、快手构建的AI导购系统,阿里国际站的“AI合伙人”,本质上都在探索一种AI原生的组织与运营方式。但这一步也最远。它要求的不仅是高质量数据和巨额算力投入,更需要多年的工程落地验证。在当下,能进入这一层的公司寥寥,大多数仍处于实验室验证或局部试点阶段。总的来说,界面层AI持续变现难,业务逻辑重塑层AI投的是未来,而流程改造层AI则可能是眼下最容易兑现的商业化区间。这也解释了为什么一级市场真正“纯AI”的公司数量极少,而二级市场上大多数被归为“AI概念股”的上市企业,其实是“AI+多年行业经验”的组合体。寻找AI浪潮里的下一个IPO在AI领域,下一个敲钟的人,正在加速赶来。数据显示,截至2025年7月24日,港交所已有214家公司递交上市申请,其中AI相关企业多达48家,占比22.43%。换句话说,每5家拟上市公司中,就有1家与AI相关。更有意思的是,这48家AI概念拟上市公司中,11家为A+H公司,占比高达22.92%。这意味着AI领域已有一批技术成熟、商业化路径清晰、具备国际化布局能力的“头部企业”崭露头角。它们正通过双重上市来稳固资本根基、放大全球影响力。天下英雄如过江之鲫,谁能脱颖而出,成为下一个真正意义上的产业敲钟人?回看2025年前后成功登陆资本市场的一批AI公司,可以发现一种隐性的共识:落地路径要“以点带面”,技术打法需“以场景起家”。无论是云知声的医疗AI、明略的营销AI,还是极智嘉的仓储机器人、斯年智驾的港口无人车,几乎都遵循了类似轨迹,那就是从一个确定性高的业务场景出发,深挖需求、打磨产品,做到业内领先,再逐步横向扩张相近领域。云知声选择的突破口是病历质控和地铁语音购票两个场景。通过树立标杆项目,它构筑起能用、好用的早期用户认知,为后续通用大模型的应用拓展提供了现实抓手。海致科技也是类似路径,其通过知识图谱技术切入金融反欺诈场景,逐步将能力延展至运营风控与数据治理,实现了“场景突破—平台沉淀”的良性循环。这些AI企业在商业化的路径选择上,也普遍绕开了与通用大模型正面竞争,转而采取“垂直化+专精化”的策略。值得注意的是,这批走到“敲钟”前线的AI企业,还有一个共性,那就是他们几乎都在早期就投入建设了自己的平台型产品或基础技术架构。比如云知声拥有自研的大模型平台“云知大脑”与语音芯片Atlas;滴普科技打造了FastData与FastAGI双平台,分别对应数据引擎与智能引擎;明略在“秒针系统”与“小明助理”之间构建起从分析到决策的全链路AI运营系统;而极智嘉和斯年智驾则围绕AI应用场景构建了软硬件一体化的全栈方案,实现从算法、感知、决策、执行的端到端闭环。这些自主平台一方面凝聚了核心算法、模型、工具链,形成技术壁垒,另一方面也方便产品标准化复制,降低项目交付成本。是AI企业从人力密集型项目向产品化、规模化发展的必要阶段,谁的平台能力强,谁就更能主导商业化节奏。据IDC等机构预测,中国AI解决方案市场未来5年仍将保持50%以上年增长,2030年规模可望超过万亿元。这既是巨大机遇,也是激烈战场。大模型时代技术日新月异,唯有掌握独特场景数据和know-how,才能抵御同质化竞争,成为下一个敲钟的人。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
11/15
AI,开始重组互联网大厂了
大厂为AI发电,“拥抱变化”的含金量还在上升。饿了么、飞猪合并进阿里电商半个月以来,大厂内又发生了不少组织变动。阿里进一步精简非业务一线的合伙人团队,从26个减少为17个;字节Seed大语言模型技术负责人因个人问题被辞退,机器人负责人孔涛被曝离职创业。这些调整背后,很多都和AI有关。过去一年,头部互联网公司中的半壁江山——腾讯、阿里、字节、美团、百度、快手6家大厂都把AI写进公司战略,至少做了12次组织架构调整。其中,腾讯、阿里、字节调整最多。大厂对AI的投入和预期相比AI创业公司有过之而无不及。在大模型越来越难融到钱、AI应用还没真正火爆就已经红海的情况下,大厂有自己的优势:资金池稳定,创始人足够重视,再加上“无上限投入”的态度和不断突破上限的慷慨薪资,吸引了AI大牛们加入。不过,大厂也很难完全复刻AI创业公司的气质,一是科研气氛,二是AI优先级。当下这个微妙的时间点,大厂频繁调整架构也情有可原。自上而下“全员AI”的第一阶段已经过去——往往是公司创始人意识到AI的重要性,写入公司战略,加大AI投入,设置AI事业部;自下而上的第二阶段还在进行中——业务执行过程中遇到实际问题,需要再分配调整AI分工。核心人物动向,更是直接反映了高层关注的重点。半年内,马云五次回到阿里。每次回归,阿里组织变化都如影随形。几次分别是:去年11月蒋凡任职电商事业群CEO一周之后;12月8日蚂蚁周年马云发表“AI时代”主题致辞;2月11日阿里宣布“未来三年投入3800亿元建设云和AI硬件基础设施”的当天,马云再度回到阿里;5月阿里打通内网、取消事业部限制的第二天,马云参加阿里日活动;以及6月24日,就在淘宝闪购破6000万订单,阿里宣布饿了么、飞猪合并进电商事业群的第二天,马云据称参加了淘宝闪购周会。2023年之后低调许久的马云,每次出现都和电商、AI+云有关。退出一线五年之久的张一鸣,近期也开始频繁往返新加坡北京,参与字节AI核心团队Seed的月会。据多家媒体报道,张一鸣这段时间一直在拜访科学家、创业者,深入交流AI。期间字节AI团队高管来来去去,灵魂人物张一鸣就成了AI和机器人的“定海神针”。互联网是劳动密集型产业,AI也是。人事变动、部门更替就像是一家大公司描绘蓝图时留下的草蛇灰线,顺着这些线索,能帮助我们看到大公司内部真实而动态的变化。从战略、业务,再到人,最近一年,AI影响大厂组织架构变化呈现出三点特征:1.战略上赋权AI,形成3种不同的架构模式;2.业务上,无上限投入与“合并同类项”并存;3.具体岗位上,字节流动性最强,阿里调整还在继续。AI在大厂长出3种架构模式互联网大厂一度离AI最近,创始人在AI领域有前瞻力。不过,从过往大厂AI发展历程上看,也不乏“灯下黑”时刻:一早设立AI团队,经历过一段探索时期,没有获得相应产出而逐渐边缘化,被横空出世的ChatGPT敲醒,再度奋起直追。其中最有代表性的就是字节。2016年,张一鸣就主导成立了AIlab,但随着张一鸣从一线后撤、字节重心偏移到站内商业化,不赚钱的AIlab渐渐没了声响。直到字节2023年重组AI部门,AIlab依然摇摆,今年6月被收归进Seed团队。这背后有战略决策原因,也有大厂“水土”原因。和OpenAI、Anthropic、智谱AI这些从成立之初就定位研究型机构的AI原生公司(AINative)不一样,中国互联网大厂二十年间摸索出了一套自己的前、中、后台架构,偏好在自有组织架构体系内为AI开垦一块新地,建立“AI事业群”或实现“业务一体化”,强调落地和变现。这一点有好有坏。好处是,可以推动AI与业务结合,坏处是,AI研究员习惯的实验室式协同、纯粹的模型研究,和商业公司晋升路径和考核标准天然相悖。比如2023年就营收1亿美元的Midjourney仅有11人,150人的DeepSeek仅有三层架构:创始人-小组长-员工,这并不妨碍它们长成厉害的组织,带来可观的收入。意识到了这一点的字节在今年3月18日取消了AI核心Seed团队的OKR季度考核,给重金招进来的AI大牛们提供更宽松的研究空间。经过多次调整磨合,目前,互联网大厂AI部门主要采取3种架构方式:1.技术-模型-应用:比如字节“Stone(技术算力中台)-Seed(大模型研发)-Flow(AI应用产品)”,阿里则是阿里云底座、通义千问大模型中间层、夸克+钉钉应用层三层;2.技术+模型-应用:如腾讯TEG(技术工程事业部)下设大语言模型部、多模态模型部,整合机器学习平台部、数据平台部等,集成技术和模型;CSIG(云与智慧产业事业群)管理QQ浏览器、搜狗输入法、ima、元宝等应用。百度则是把AI能力作为技术中台(TPG),向各个业务输出AI算法、深度学习平台(飞桨)、大模型(文心一言)等技术支持。3.AI应用事业部:刚刚在4月底设立可灵AI事业部的快手,则依然采取互联网产品逻辑,围绕可灵AI下设产品、技术、运营部门。前两种更适合大规模、大投入、大团队的阿里、字节、腾讯,第三种则适合“小而美”打法,比如快手——到2025年Q1,聚焦视频+图像生成的可灵AI已经为快手贡献1.5亿元收入。从无限支持到“合并同类项”AI研发投入耗时周期长,而且投入数以百亿计。对于大厂来说,即便对AI始终坚持“无上限”支持,但也同时在进行横向合并,以集中力量投入更有机会获得增长的业务。从近一年大厂AI相关的架构调整中可以看出,阿里明显在收缩核心业务,从零售、线下业务中抽身,把精力转移到到电商、AI+云。另一边,其他大厂也在归拢现有AI业务,合并同类项。字节在大力扶持Seed大模型团队,同时评估Flow团队十余个AI应用赛马结果,留下用户规模更大、产品力更强的,整合其次的。腾讯则是合并四大AI相关产品线到一处——QQ浏览器、搜狗输入法、ima、元宝都迁移并入CSIG(腾讯云与产业事业群),将AI技术统一到TEG(技术工程事业群)下。阿里也是同样的思路,并且不单限制在AI部门。今年3月,阿里鼓励各个业务部门积极探索AI,CEO吴泳铭主张在阿里现有业务中全面实现“AI化”,阿里所有部门被告知,他们2025年的绩效将通过如何利用AI促进增长来评估。如今随着1+6+N逐渐回归一个阿里,该进程可能被动放缓。比如6月初,饿了么刚刚宣布AI化,后脚就被并入大电商事业群。显然,在阿里内部,饿了么被归纳为电商撮合类业务,业务与AI的结合也就不那么优先紧迫——据一财商学院了解,电商事业群CEO蒋凡的OKR中,AI优先级并不高,排在所有指标的最后。一个概念悄悄变了:大厂有针对性地“无上限支持”,而不是支持全部业务AI化。换句话说,就是把资源花在刀刃上,避免重复性建设。阿里三年投入3800亿计划依然在进行,字节依然会给出超出市场预期的AI岗位薪资,腾讯依然不急于靠AI收获短期回报,只不过:承担核心指标的部门变了,还需要时间量化落地;表现不及预期的应用或团队将被更“温和”地重新整合,不为打出“325”绩效低分,而是为刺激AI赋能业务。互联网大厂在以自己的方式摸索AI团队的运行逻辑。字节流动性最强,阿里还在调整,腾讯加码招聘换个视角,从“具体的人”维度看大厂组织变化,也不过是一次次招聘、离职罢了。但不得不承认,AI行业正处在炙手可热的劲头上。一位人工智能从业者告诉一财商学院,半年前一位硅谷人工智能专业毕业的应届生,就可以拿到20万美元/年的薪资offer。国内快手、腾讯、字节等大厂,算法、AI搜等岗位硕士应届生薪资也水涨船高,可以达到4-5万元/月。大厂高价吸引人才,AI人才薪资不断突破薪资体系上限。近两年,字节笼络了许多技术大牛和成功创业者。据晚点报道,Flow总负责人朱骏曾是短视频产品Musical.ly的创始人之一,36氪创始人刘成城(Kayden)目前在负责字节AI耳机和眼镜和手机厂商合作。去年12月,字节曾豪掷千万年薪招入阿里大模型大将周畅,今年2月又招来前谷歌DeepMind副总裁吴永辉,其目前担任Seed一号位。紧接着3月,字节推出TopSeed计划,不拘一格降人才。“豪横”的招聘风格让本来就贵的AI人才更贵了,字节多次为技术岗位开出数百万元年薪。但另一方面,成功经验丰富的老兵和高价笼络来的大牛,很难一直留在大厂,跳槽其他大厂或者跳出去创业的很多。据统计,字节系高管已有超20人离开字节进行AI创业。其中包括前抖音产品负责人、PICO副总裁任利锋,前字节视觉技术负责人王长虎,前飞书海外产品负责人张涛,联合创办了Manus;前剪映商业化负责人陈冕,创办了LiblibAI等。阿里这边,4月“钉钉之父”陈航(无招)回归之后,6月23日刚刚经历事业部之间的大框架合并,再向下延展的调整还在继续,因此具体岗位变动消息不多。据阿里内部员工推测,回归“一个阿里”,部门合并之后,各个事业部的职能部门可能也将迎来合并缩减。相比之下,腾讯稳定性更强一些,更多是在加码招聘。4月17日,腾讯宣布启动史上最大就业计划,三年内将新增28000个实习岗位并加大转化录用,仅2025年将迎来10000名校招实习生,技术类岗位“扩招”力度空前。6月校招季,腾讯还推出招聘技术人才的“青云计划”,对标华为天才少年、字节TopSeed,“薪酬上不封顶”。不论战略、业务还是具体岗位,AI都在深刻地改变互联网。大厂面对AI,重点在于如何激发组织活力,从而赢得长期的胜利。写在后面短短一年,各厂AI部门就经历多次重组,大厂的组织内功恐怕还要继续修炼。纵观这场由国外卷到国内,小厂卷到大厂的AI赛跑,短期内还没有显著的盈利模式,且大厂研发开支还在逐年上升。字节、阿里、腾讯2024年投入均超过500亿元,2025年即将逼近千亿。这其中大部分钱都花在AI算力、研发人员成本上。各厂AI业务中,仅有阿里云2022年进入盈利周期,2024年营收突破1180亿。大厂绑定AI,意图也是显而易见。互联网增长见顶,大厂需要上AI的牌桌,获取赢家通吃的机会。手握前一个时代赚到的红利,押上自己最大限度的筹码,换一张AGI时代入场券。不过不是所有大厂都对AI热潮感冒,京东、拼多多、网易们延续自己的逻辑,也活得挺好——刘强东再次亲自上一线带领57万“兄弟们”杀入外卖,拼多多砸下千亿补贴换用户,网易“苟”住游戏文娱,净利还能逐年攀升。AI不是互联网大厂唯一解法,但如果选择了AI,就要接受它的高度不确定性。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
10/24
AI时代,开发者不能再当 i 人了,「云计算代言人」敬告
要会和AI聊。开发者不能再内向了:要会和客户同事说,会和AI说。「我想说的很明确:现在我们有了更多学习新技术的机会,但最有意思的是,很多技巧并非技术。我坚信,未来最成功的开发者,必须拥有强大的沟通能力。」这是全球最著名的云技术布道者,面对AI时代给开发者们的建议。近日,亚马逊云科技副总裁兼首席布道师JeffBarr受邀来到上海,向我们分享了多年来对开发者生态的观察和实践。他深入分享了AI驱动的开发模式如何重塑生产力、协作方式和创新速度,给我们带来了很多启发。JeffBarr最为人们所知的身份是亚马逊云科技博客的创始人,一位在云计算领域深耕多年的资深专家。他不仅是亚马逊云科技新技术的积极传播者,也是云计算产业发展的重要推动力量。他创造性地以一个开发者身份,以自身实际体验的形式点评亚马逊云科技的新产品,促成了「技术社区」概念的形成。JeffBarr是一个世界级的软件工程师,曾写下全球第一个弹性计算产品AmazonEC2的首行代码。作为亚马逊云科技的核心奠基人之一,他在2004年创建了AWS官方博客,到2024年12月他不再担任AWS新闻博客首席博主时,他已经撰写了3283篇博文(超过157万词),内容涵盖新服务发布、技术详解、用例分析等方面。他还坚持录制每周AWS服务更新视频,并活跃于社交媒体,通过这些方式与广大社区保持紧密联系。作为云计算、AI等技术的传播者、解释者和开发者社区连接者,二十多年来,JeffBarr一直以深厚的技术洞察力和极具亲和力的表达方式,持续向全球开发者分享云计算的创新理念——他撰写了数千篇技术博客,走遍世界各地,与无数技术人面对面交流,被誉为「云计算的原点见证者」。然而在见证了互联网时代、云计算的兴起之后,面对汹涌而来的AI时代,他仍然表示自己正在亲历前所未有的技术革命。在与我们交流的过程中,他反复强调了这一点。在他看来,AI带来的不仅是「提升生产力」这样简单的一句话,更意味着无处不在的创新趋势,对一个又一个新领域的覆盖。比起以往,开发者会获得机会,也面临着更多挑战。这场革命是如何开始的?又要走向何处?不妨就从JeffBarr的自身经历说起。从「带云入华」到跟上「AI创新的节奏」在JeffBarr横跨近半个世纪的职业生涯中,他不仅是技术演进的亲历者,更是行业思想的塑造者。他此次时隔16年的中国之行,恰好构成了两个技术时代的完美对照:一个是由他开启的「云计算」时代,一个是他正在步入的「AI原生」时代。时间拉回到2008年底,JeffBarr第一次来到北京。「我还记得那是我第一次到访中国,」他在采访中回忆道,「我与当时比较早期的开发者沟通,他们对刚刚兴起的云感到非常、非常的兴奋。」那是一个「云」在国内还是陌生概念的年代,全球云计算市场尚在萌芽,亚马逊云科技也仅有大约5项核心服务。JeffBarr的任务是「布道」,也就是向中国的技术先驱们解释「什么是云计算」以及它近乎科幻的潜力。16年后的今天,当JeffBarr再次站到中国开发者的面前,他所面对的图景已截然不同。「在这么短一段时间内,中国取得了巨大进展,」他毫不掩饰自己的惊讶,「让我感到非常、非常的敬佩。」这种时空对比带来的冲击感非常巨大。今天的中国开发者,早已不再需要「被启蒙」云为何物,他们本身就生活在云上,并且正在成为全球AI浪潮中最活跃的群体之一。「我看到很多中国公司现在正在走出去开拓全球的市场,」JeffBarr提到了CTG(ChinaToGlobal),即中国出海战略,「云在帮助他们向多地部署应用方面非常有效。」这种从被启蒙到引领的跨越,被JeffBarr归纳为一个他常在亚马逊云科技内部提及的词:「创新的节奏」(PaceofInnovation)。「在当下AI的技术趋势下,这种创新的节奏和速度前所未有。」他生动地描述了这种「加速度」带来的冲击感,「在西雅图飞来上海途中,我就在担心,是不是会又有什么AI技术突破。」这种「担心」精准地呼应了中国开发者生态16年来的指数级进化。作为见证者,JeffBarr看到的不仅是技术的更迭,更是一个开发者群体在全球技术版图中的强势崛起。AI是合乎逻辑的下一步面对AI带来的兴奋与焦虑,JeffBarr的观点清晰而坚定:AI并非替代者,而是放大器。JeffBarr在主题为「下一代软件开发」的演讲中强调:「AI驱动的开发工具,并非什么彻底的革命,而是我们开发工具演进中合乎逻辑的下一步(logicalnextstep)。」作为一名从16岁就开始编写商业代码的「老兵」,他的视角极具历史纵深感。他亲历了从大型机、小型机到微型计算机的变迁;他用过的语言从打孔卡带上的0和1演变到汇编,再到高级语言。「从一开始,我们开发者就一直在使用软件工具来构建其他软件工具。」他解释道,「今天我们看到的AI编程助手,是这一演进的自然延续。」他认为,每一次工具的飞跃,都是为了让开发者站上「巨人的肩膀」,从更高级的抽象层面去思考问题。AI助手能将开发者从繁琐的语法和模板代码中解放出来,正如当年高级语言将开发者从管理内存地址和寄存器中解放出来一样。「AI工具的价值在于让开发者更有力量。」JeffBarr在采访中畅想,它可以让开发者更雄心勃勃,去构想和构建那些过去看起来过于庞大和复杂的应用。他甚至提到了一个极具未来感的概念:单人独角兽(Unicornbuiltbyasingledeveloper),即由单个开发者利用AI工具,创造出价值10亿美金的公司。JeffBarr对此深信不疑:「在我们有生之年,这完全可能发生。」智能体加持下,规范驱动的开发AI带来的力量,也催生了新的开发范式。JeffBarr敏锐地注意到了今年VibeCoding(氛围编程)的兴起。他认为这非常适合中小型应用和非技术人员的快速原型构建,它极大地降低了从想法到实现的门槛。但对于更严肃、大型、结构化的企业级应用,则需要一种更严谨的模式。「我们称之为规范驱动的开发(Spec-DrivenDevelopment)。」他以此引出了亚马逊云科技的最新工具Kiro。在JeffBarr看来,这代表了AI时代专业软件开发的未来。Kiro支持两种模式。JeffBarr解释说:「你可以在氛围编码模式下将其用于中小型应用程序。当你想要更有条理、更严谨一些时,你可以选择采用规范驱动模式。」值得注意的是,在规范驱动模式下,开发者同样无需逐行编写代码,也依然是通过自然语言与AI智能体协作,其核心在于要与Kiro来回沟通来编写规范。其大致流程是这样的:•生成规范:Kiro会与开发者来回对话,将模糊的想法扩展为一份详细的、包含验收标准(AcceptanceCriteria)的技术规范。•智能体构建:AI智能体根据这份规范,并遵循开发者提供的指导文档(SteeringDocuments),例如公司内部的编码标准、技术栈偏好(如使用Python后端、特定云服务等),然后自主地规划任务、生成代码、编写单元测试并执行。Kiro基于开发者意图生成的需求规范文件requirements.md、design.md、tasks.md以及执行任务的页面。「在这个过程中,开发者仍然是掌控者,」JeffBarr强调,「AI是你的助手,而不是你的替代者。它在放大你的技能,而不是取代它们。」这种模式确保了AI在释放强大生产力的同时,其行为依然可控、可预测且符合企业级标准。未来图景:一次性代码,与AI的沟通透过JeffBarr的演讲,我们感受到他不仅是一位布道师和历史的见证者,也是一个未来学者。在他勾勒的AI未来中,软件开发的形态将发生两个根本性转变。第一个转变是「即用即抛代码」(DisposableCode)的出现。「在过去,我们构建一个应用需要投入巨额的资金和时间,」他在演讲中分析道,「因此我们必须小心翼翼地维护它很多年。」但在AI的加持下,从规范到成品的过程会变得极其高效和廉价。「未来,可能会有某些应用,我们将其视为即用即抛的。」JeffBarr预测道,「我们会构建它、使用它,但不再考虑长期维护。当需求变更时,我们只需回到规范层面进行修改,然后让AI重新生成一个全新的、更好的版本。」在这种模式下,真正持久(Durable)的不再是代码本身,而是代码背后的规范和数据。JeffBarr补充道:「我们将花费更多的时间和金钱来精心管理我们的数据,因为数据将变得比以往任何时候都更加宝贵。」第二个,也是更深刻的转变,来自人本身。「我坚信,未来最成功的开发者,将是那些拥有强大人类沟通技巧的人。」这是JeffBarr在此次中国之行中,向所有开发者发出的最强音,也是他反复强调的「新箴言」。他试图打破外界乃至开发者对自身的刻板印象。「时至今日,开发者的任务主要是和机器沟通,偶尔和人类打交道。这让大家觉得开发者是安静内向、喜欢屏幕的人。」但在AI时代,这一角色被彻底反转。「未来成功的开发者需要更加开放,善于社交。」JeffBarr在接受采访时说,因为开发者未来的核心工作流将是沟通:•与客户沟通:更深入地聆听和理解客户的业务问题。•与AI沟通:将理解到的、模糊的业务问题,清晰、准确、无歧义地传达给AI编程助手,即表达自己的意图。JeffBarr总结道:「我们正在从一个主要编写代码的时代,进入一个主要阅读代码和描述意图的时代。」看起来,沟通正在成为AI时代的第一生产力。20年布道,始于一篇博客JeffBarr对未来的深刻洞察并非空中楼阁。它源自于他过去20多年作为「云计算原点见证者」的非凡经历。他的职业生涯,几乎就是一部亚马逊云科技的成长史,也是一部现代云计算的定义史。JeffBarr对未来的深刻洞察,源自他20多年作为「云计算原点见证者」的非凡经历。他的职业生涯,几乎就是一部亚马逊云科技的成长史。2004年,JeffBarr参与创建亚马逊云科技时,面临一个营销难题:云计算「即时交付」的特性,彻底打破了传统PR按周期发布的固定节奏。在那个博客刚兴起、被视为个人情感表达方式的年代,JeffBarr大胆提议用个人博客代替官方新闻稿,用以介绍亚马逊云科技的新产品。这个想法得到了时任CEOAndyJassy的「两天之约」:「你先写博客保留两天,如果不行,我们就赶紧撤下来。」这个充满亚马逊风格的决策,最终开启了一个全新的营销门类。JeffBarr的博客(AWSNewsBlog)正式上线,他以第一人称的开发者视角,亲自测试、撰写代码,发布了S3、EC2等早期服务。AWSNewsBlog的第一篇博客更重要的是,这无意中开创了云计算时代「开发者关系(DevRel)」的核心范式。JeffBarr的博客不仅是发布,更构建了一个反馈闭环。开发者可以第一时间交流喜爱或吐槽,亚马逊云科技则照单全收。这带来了一种前所未有的共建(Co-build)体验,开发者不再是技术的被动接受者,而是成为了产品迭代的参与者。这种「英雄惜英雄」的开发者生态,让亚马逊云科技在早期拥有了用户「溺爱」般的优势。支撑JeffBarr20年写下3000多篇博文的动力,源自他作为一个Builder的纯粹信仰。他本人就是一名资深开发者,曾写下AmazonEC2的首行代码。他坚信:「开发者是创造未来的人,我们所做的,就是要支持他们对于未来的构建。」这种「开发者服务开发者」理念,正是他布道的核心。永恒的布道者2025年初,JeffBarr宣布他将正式退休,不再担任亚马逊云科技新闻博客的首席博主。这个消息标志着一个时代的落幕,但也更像是一次传承。从2004年写下第一篇博客,到2025年在上海畅谈智能体,JeffBarr的职业生涯完美诠释了他所扮演的三个角色。作为布道师,他开创了用个人博客(一种新的沟通方式)发布硬核技术产品的先河,定义了云计算行业的开发者关系(DevRel)范式。作为见证者,他亲历了亚马逊云科技从5项服务到数百项服务的爆发式增长,也见证了中国开发者生态16年间从追随到引领的惊人跨越。作为未来学者,在AI浪潮重塑一切的今天,他再次布出了新的道:在一个人人都可编程的时代,技术技巧依然重要,但沟通技巧将成为新的胜负手。二十多年前,JeffBarr向世界布道云计算,教开发者如何认识云;二十多年后,他向世界布道AI时代的沟通,教开发者如何「对话」云。技术在变,从他亲手写下首行代码的EC2,到如今他极力推广的AI智能体Kiro;但他和亚马逊云科技的核心使命从未改变。正如JeffBarr说的那样:「我们相信开发者是创造未来的人,我们所做的,就是要支持他们对于未来的构建。」「如果说对现在的开发者有什么期许,我想说:Thinkeverybigthoughts,解决大问题,更有雄心壮志。」本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
10/24
和互联网一样,国产AI产品重回“大厂叙事”时代
在这场流量游戏中,初创公司几乎没有胜算。创业窗口,或许关闭了一边奔赴上市,另一边却无情裁员,智谱AI近日的举动让外界突然透视到这家明星AI企业内部的风雨飘摇。据社交媒体上流传的消息,作为公司商业化重要支柱的产研中心,被曝出“就地解散”,60多人仅保留一半左右,很多员工在节前收到紧急通知,期权与年假清零,N+1补偿直接走人。实际上,2025年以来,智谱AI早已陷入高管离职的多米诺骨牌效应:从首席战略官到COO,再到业务线负责人,核心团队的动荡从未停止。回看年初,包括智谱AI在内的“AI六小龙”作为技术创新的代表,在AI技术的浪潮中风光无限,万众瞩目,但不到一年,它们就集体失速,路遇险境。这背后不容忽视的一点是随着大厂发力,用户正在向有大厂背景的产品流去。尤其是在AI应用上,根据aicpb.com,国内AI应用Top20中,来自大厂(市值超过500亿元)应用有14个,占比高达70%。AI应用赛道,会成为大厂主导的游戏吗?或许是的,我们看到越来越多的AI应用正在把重心转移到海外,而这对国内技术创新力量的成长,也可能会造成损失。“逼”走初创公司的AI应用?几乎不到一年的时间,国内AI应用的市场就变了天。根据Xsignal发布的2025年上半年国内AI应用热度榜单,前二十名中大厂原生应用占12席,大厂老应用升级AI版本占1席,创业公司原生应用仅7席,占比约三分之一。在第三方监测机构aicpb.com发布的国内AI应用Top20中,来自大厂的应用占比更是高达70%。这种形势与全球市场截然相反。全球总榜上,34个非中国产品里只有5个属于“大厂”,占比约15%,除Gemini(Google)、Grok(X)、Character.AI(Google)和MicrosoftCopilot外,其他几乎全是来自小团队或创业公司。如排名第一的ChatGPT,来自巨星级初创企业OpenAI。在大厂还没有发力AI应用时,外界普遍认为大模型的机会只属于大厂,而AI创业公司会凭借功能创新在AI应用上找到更多的机会。可是,当大厂一面在通用大模型上加大投入,另一面开始养成自己的AI应用,AI创业公司强势的发展势头还是被重重打压了。如月之暗面的Kimi,aicpb.com数据显示,今年7月,KimiAPP月活跃用户(MAU)仅居全球第19位,落后于豆包、DeepSeek、腾讯元宝等国内对手,下载量更跌出前20。流量的碾压,是大厂“扼杀”其他AI应用、占据市场的关键。去年,Kimi靠着声势浩大的“重金投流”,成功出圈,字节跳动迅速跟进,加大投流,豆包很快后来者居上。到了今年,腾讯、阿里也直接下场,在其自身多元化的分发渠道上进行大规模投流,更大范围地渗透到用户层。在这场流量游戏中,初创公司几乎没有胜算,这不单单是因为比不过烧钱,而是大厂占据着社交、电商、搜索或短视频的生态入口,在原有产品的基础上进行AI升级,自然而然能吸引用户。大厂对初创公司的降维打击,印证了在国内AI应用的赛道不可避免地又成了流量的“战争”,这意味着大厂只要通过“复制”爆款,就可以通过流量的绝对优势轻而易举地抢夺用户、抹平差距。事实上,他们也正在这样做。简单来说,或许AI产品的创业窗口,正在关闭。在这种形势下,初创公司的AI应用越来越多地流向海外市场。根据不久前a16z发布的AI移动应用Top50排行榜,我们看到,有22个中国产品上榜,但只有三个主要在国内使用。也就是说,22个中国AI移动应用中有19个主战场在海外。尽管这说明了国内的AI应用在全球市场正在成为主导力量,可是这其中夹杂了诸多的无奈。产品固化,再次重演?当前各种AI应用大乱斗的状态,很难不令人联想到移动互联网时代初期的APP大战,无论大厂还是小厂都在争抢流量入口和培养用户习惯,也正是通过这场大战,超级APP陆续诞生,逐渐形成了当前的竞争格局。可是一个难以忽视的问题就是市场固化,互联网大厂凭借几款头部产品几乎统治了社交、电商、短视频、视频等各个赛道,也牢牢把控了用户时间。所以,在APP市场上,产品的竞争变成了巨头之间“神仙打架”,而创新的、具有颠覆性的新品几乎没再出现。根据七麦数据前段时间发布的2025年8月热门应用排行榜,下载榜Top30中,字节跳动有11款产品进榜,其次是阿里,有7款产品进榜,仅这两个巨头就在榜单上占据了一半以上的名额;在收入榜上,更几乎是大厂的“天下”,“抖音”位列Top1,腾讯旗下的“腾讯视频”与“QQ音乐”紧随其后。国内移动互联网渐渐失去了创新力,早已成了一个共识。原本我们以为AI应用的涌现和落地在技术的想象力下有可能会改变这种状态,可从目前来看,互联网大厂再次成为AI应用的主导力量。如果未来初创公司凭借创新性应用突出重围的路被堵死了,那AI应用市场是否会重蹈覆辙呢?回顾移动互联网时代的发展,不可否认,很多互联网大厂的超级APP当初也是作为初创产品从竞争中成功厮杀出来的。比如美团,经历了“百团大战”,最终成为外卖行业最后的胜者;在大厂的移动新闻客户端掌握新闻资讯的分发渠道时,今日头条靠个性化分发异军突起,势不可挡,由此带飞了字节跳动这个巨头。初创公司虽然也是有机会的,可一个令人悲观的事实是这个机会或许变得越来越小。在移动互联网,最后诞生的一个国民级应用抖音,其成立的时间是2016年,也就是说,将近9年的时间里,再也没有诞生过一个国民级应用。从微信到美团、滴滴、今日头条到抖音,我们可以发现,超级APP诞生的时间正在明显拉长。一方面是因为互联网大厂对各个领域的“统治”越发强化,尤其是有了字节跳动这个APP工厂后,其产品几乎遍布所有赛道;另一方面则是移动互联网各个领域的增长已然触及天花板,留给初创公司寻找的新蓝海几乎没有了。初创公司的AI应用们现在面临的困境,再次印证了在互联网大厂的碾压下想要创造一个杀手级应用,可以说是难如登天。更何况,在模型能力趋同背景下,AI应用的升级很大程度上取决于场景挖掘与高质量数据,而国内核心用户数据恰恰集中于互联网大厂手中。创新力流失陷阱正在扩大在这场全球科技竞赛中,当国内的初创公司们被迫把市场转移到海外,难免会带来一个关键的问题:创新力是否会流失。Manus的“跑路”,就是部分AI创业公司命运的缩影。今年年初,Manus骤然爆火,内测邀请码炒作到10万元一个,一度被热捧为“下一个DeepSeek”。然而不到4个月,Manus悄悄从国内撤退,网页无法登录、团队全部裁员。后来人们发现在中国团队彻底解散前,Manus却在新加坡展开了大规模招聘。尽管Manus远走他乡的做法引发了巨大的争议,可它也确确实实暴露出了国内AI创业公司的生存困境。一方面,一旦接受了外资的投资,就很有可能受到外资的裹挟,当然,如果接受大厂的投资,同样要受到掣肘;另一方面,国内用户付费意愿低下、欧美用户付费意愿更强,如果始终留在国内,必须面临巨大的商业化压力。在Manus之前,我们看到,AI视频应用HeyGen在2023年注销中国主体,把总部从深圳搬到了洛杉矶。今年5月开始内测、7月正式开放上线的Lovart,总部则设在旧金山,美国也是Lovart目前用户数量和收入最多的市场。这意味着这些来自国内的创业团队和人才也转移到了其他国家。随着越来越多的AI创业公司把核心市场转移到海外,不排除未来会有更多的创业者选择彻底离开,而这对带动国内AI技术创新、寻找杀手级AI应用来讲不是好消息。从目前国内AI应用的发展已经可以看出一些影响。根据各种AI榜单,可以发现,除了大厂“统治”头部产品之外,另一个鲜明的特点是AI应用主要集中在聊天机器人与AI陪伴上,AI视频生成工具、AI音乐生成工具、AI绘画、AI编程等其他赛道上,产品数量相对较少,也缺少标杆性的产品。与之对比,全球AI应用市场上,众多细分赛道则相对活跃。从A16Z最新发布的一份《全球百强AI消费者应用榜单》第五版可见,除了几个“老面孔”覆盖了几乎所有高频场景—学习、陪伴、设计、生产力、社区,作为“黑马”的几款产品来自不同的领域。比如主打氛围编程的Lovable直接冲到第22位,Suno首次把音乐生成带入主榜。这些新的AI应用的出现,显示出全球市场上新一轮差异化竞争的可能性,相反,国内却还停留在同质化竞争中。尤其是大厂、小厂纷纷接入DeepSeek后,产品反而更加趋同。国内还是海外?这个问题或许终将摆在AI初创公司的面前,但我们希望的是这些公司带着凝聚着本土创新力的AI应用去征服海外市场,而不是在无奈之下被迫转移战场,丧失国内生存的根基。这无疑是我们所有人都不希望看到的情况。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
10/18
灵魂拷问:如果AI真能造出10x工程师,那“软件洪水”在哪儿呢?
25年老兵怒喷:AI编程的“生产力神话”,正让行业开倒车满世界都在谈AI提效,但全球软件发布量为何毫无波澜?我快气炸了,愤怒到想推倒别人的沙堡,朝丹尼尔·拉鲁索脸上来一拳,还要当着他女朋友的面狠狠羞辱他!我通常不怎么生气,但我实在受不了所在行业正在发生的那些破事。我从事软件开发已经25年了,如果算上早年在那琥珀色单色屏幕上做市场调研制表的日子,甚至可能接近28年。没错,我算是老了——一个人到中年的编程书呆子。不管好坏,我的人生与个人身份早已和“编程”紧紧绑定。我靠着发布出色产品时那股多巴胺的冲击而活着。我曾经是AI编程的早期采用者,也是它的忠实粉丝,直到大约两个月前,我读到METR的那份研究报告,突然产生了强烈的怀疑。研究中指出,开发者对自己生产效率的感知其实并不可靠:他们自以为AI帮自己提速了20%,但实际上却慢了19%。这个结果让我大吃一惊——因为就在一周之前,我还跟别人说,感觉AI只让我快了25%左右,甚至还在为这个数字不够高而有点沮丧。而我的误估,与那些开发者的实际误差只相差5%。这事儿让我感到不安。我无法不质疑自己对经历的叙述是否可靠。我是否被屏幕上飞速闪过,以至于无法量化的代码所蒙蔽了:阅读和审查所有这些代码,是否从一开始就比我自己动手做要花费更多的时间?于是,我开始用那项研究的改良方法来测试自己的生产力。去接个任务,估算一下如果我“手写”代码需要多长时间,然后我抛个硬币,正面朝上我就用AI,反面朝上我就自己做。然后我会记录开始和结束的时间。这样我就能得到一个“差值”(delta),我可以用这个差值来画出“使用AI”与“不使用AI”的对比图表,然后我就可以看到一些趋势。这件事情我连续做了六周,记录了所有数据,你们猜我发现了什么?我发现,这些数据在任何有意义的层面上都不具备统计显著性。我需要再记录四个月的新数据点,才能证明AI到底是在让我提速还是在拖慢我。但目前情况实在是太均势了。不过,两组之间缺乏差异性这一点真的很有趣。是,这个样本局限性很大,可能纯属巧合,但到目前为止,AI似乎让我的速度中位数下降了21%,这与METR的研究结果完全一致。我可以明确地说,使用AI编程工具,我没有看到速度有任何的大幅提升(比如2倍)。如果真有那么快,结果早就该具有统计显著性,这项研究也该结束了。这实在是太令人失望了。我多希望AI编程的梦想是真的。我希望能把我所有愚蠢的编程点子都变成现实。我希望我能周一做个指板学习应用,周三做个韩语训练器,周六再做个电子游戏。我会把它们全都发布出去。我会用一场前所未见的“铲件”洪水淹没这个世界。好吧,我本可以这样做的——如果这玩意儿真的有用的话。但事实证明,(而且我为此收集了大量数据)它不仅对我没用,它对*任何*人都没用,而且我将要证明这一点。但首先,我们先来看看这些关于生产力的宣传是多么极端和普遍。Cursor的宣传语是“为你带来非凡的生产力。”ClaudeCode的是“更快地开发更好的软件。”GitHubCopilot的是“像老板一样分配任务。”谷歌声称他们的大语言模型让开发者的速度快了25%。OpenAI也对他们自己的编码效率和研究进行了夸大其词的宣传。而开发者同行们也好不到哪里去,有14%的人声称他们因为AI实现了10倍的产出增长。像老板一样分配任务——GitHubCopilot如果这个话题不那么要命的话,这些宣传本无关紧要。但各地的技术领袖们都在为这种“错失恐惧症”(FOMO)买单,他们深信竞争对手们正在获得他们所错过的巨大利益。这驱使他们将公司重塑为“AI优先”的公司,用新发现的生产力叙事来为裁员辩护,并想当然地认为AI已经从根本上改变了价值等式,从而压低开发人员的薪水。然而,尽管这些工具的普及程度达到了前所未有的地步,它们却根本没用。我的论点是:如果这么多开发者在使用这些工具后生产力变得如此非凡,那么“铲件”洪水又在哪里呢?我们应该看到各种形态和规模的应用、电子游戏、新网站、移动app、SaaS应用——我们应该被淹没在选择的海洋中。我们应该正处在一场独立软件革命的浪潮之中才对。我们应该在Steam上看到10000个《俄罗斯方块》的克隆版。试想一下:凭借你对AI辅助编程及其广泛应用的所有了解,如果我给你看全球新软件发布的图表,你预期那图表的曲线会是什么形状?你肯定以为会看到一条随着AI被采用、人们产出更多而“指数级增长、一路扶摇直上”的曲线吧?现在,我花了好几周和一大笔钱来为这篇文章整理数据,在某些情况下处理了数十TB的数据。所以我希望你们能体会到,在软件开发的每一个主要领域,这些图表是显得多么的平淡无奇、一马平川。来源:Statista来源:StatistaVerisign《域名行业简报》来源:SteamDB数据来源:GHArchive这些图表最有趣的地方在于它们没有展现出什么东西。它们没有显示出突然的飙升或“曲棍球棒式”的增长曲线。曲线充其量只能算持平。没有出现“铲件”的激增。在2022/2023年之后,并没有突然出现独立(软件)的繁荣。光看这些图表,你根本看不出AI辅助编程是什么时候开始被广泛采用的。那个(AI提升效率的)核心前提是有缺陷的。根本没人交付出更多的东西了。这对大家生活的影响巨大。有人因为采用这些工具不够快而被解雇。有人因为害怕跳槽到别处情况会更糟,而被迫留在自己不喜欢的工作岗位上。人们花费所有时间试图掌握“提示词技巧”(prompting),又因为自己做不好而感觉很糟糕。这整件事纯属扯淡。所以,如果你是一名开发者,并且正感受到来自你的经理、同行或整个行业歇斯底里的压力,被迫去使用这些工具——请相信你的直觉。如果这些工具让你觉得很笨重,如果它们正在拖慢你的速度,如果你搞不懂为什么其他人能(用它们)变得那么高效,(别怀疑)你没毛病。数据支持你正在经历的一切。坚持使用你所熟知的、有效的方法,你并没有落后。如果你胆子够大,把这些图表给你的经理看,问问他们对此有什么看法。如果说这篇文章能告诉你点什么的话,那应该是:(A)开发者们交付的东西并不比以往更多(这是唯一重要的指标),以及(B)如果有人——无论是你的CEO、你的技术主管,还是某个Reddit上的书呆子——声称他们因为AI而成为了“10倍”开发者,那几乎可以肯定是假的,(你该)要求他们拿出证据,否则就他x的闭嘴。好了,我太懂互联网了。我甚至在你们这帮傻瓜开口之前,就知道你们要说什么,所以我们就开门见山吧:1、“呃,如果你学会了怎么正确地写‘提示’,你就会像我一样成为10x工程师了。”看看数据吧。根本没有新的“10x哥”出现。如果真有——如果那14%自称的AI“10x哥”真的是效率提高10倍的话——那全球新软件的产出将会翻倍还不止。然而这并没有发生。至于你,就你个人而言,把你今年开发的30个应用拿给我看看。拿不出证据,我懒得跟你废话。2、“呃,这是项新技术,投资了这么多,它需要时间……”是的,数十亿美元已经投给了这些工具。未来还会有数十亿美元继续投给它们。问题是,它们现在正被(当作成品)售卖,相关的决策也正在制定中——这些可是实实在在地影响着大家的生活——就好像它们今天已经(完美)可用了一样。别跟我鹦鹉学舌般地重复“它还在开发中”之类的废话。现在是2025年9月,我们用这些工具已经好几年了,它们仍然烂透了。也许有一天,它们会不那么烂,但我们最好能看到客观的证据,证明它们在*大规模*地“实际交付产品”方面产生了影响。3、“呃,也许它现在是不怎么样,但如果你不尽早采用,你就会被甩在后面。”没有任何迹象表明“提示词工程”很难学。GithubCopilot自己都说,一开始,用户只接受29%的代码提示建议(这本身就是一种效率低下的疯狂宣言,你为什么要公布这个?),但有了六个月的经验后,用户自然会更擅长写提示词,这个数字会增长到*高达*34%的接受率。显然,6个月的经验只会让你在提示词编写方面进步5%。4、“呃,也许是质量在提高,但交付速度未必变快了……”这根本说不通。我们都知道,在代码质量方面,这个行业至少倒退了十年。现在几乎没人做测试了。我上一次听到“持续改进”或“测试驱动开发”这些词,还是在新冠疫情之前。你我心知肚明,如果真有工具能让人成为10x程序员,我们早就被“铲件”淹没了。5、“呃,这都是网站驱动的,现在人们不怎么关心域名了;都是Vercel这类网站上的子域名。”闭嘴吧。人们可喜欢用自己的“自恋域名”了。6、“呃,.ai域名今年可是增长了47%……”是啊,那是因为所有的创业公司都转型去做AI了。这是从投资者的“错失恐惧症”中榨取资金的唯一途径。但是,域名*总量*是否以前所未有的速度增长了呢?不,并没有。去看看那张新域名图表吧。7、“呃,如果你是个真正的工程师,你就会知道,软件开发的大部分工作都不是写代码。”这只在大型公司里才成立。当你单干时,当你既是利益相关者又是开发者时,你根本不用开会。你是在告诉我,现在再也没有人*独立*交付任何东西了吗?再也没有人为了满足个人“小癖好”而发布新的GitHub项目了吗?开发软件怎么可能不涉及代码呢?本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
