新闻资讯
News and information
-
25
08/06
“连我也要被 GPT-5 踹了!”Altman 再发暴论:写款软件就花 7 毛钱,大批高级程序员岗也说没就没
要是给地球上每个人都免费配备一个GPT-5,让它全天候为大家服务,会意味着什么:有些经济体将会发生飞速变革,一切都靠人工智能运转,成本仅为原来的1/100。”刚刚,OpenAI首席执行官SamAltman在一档播客中突然宣布了有关GPT-5的消息。据他称,GPT-5在“几乎所有方面都比人类更聪明”,并让他本人都深感自己“无用”,甚至由此直接预言:AI淘汰其当上OpenAICEO的那一天,恐怕也不会太遥远。而就在昨日(7月23日)美联储理事会华盛顿举办的“大型银行资本框架会议”上,Altman同样谈到了AI对就业市场正带来的影响及社会变革。“有些领域,我认为会完全、彻底地消失。”Altman在与美联储副主席MichelleBowman对话时这样表示。他描绘了一幅令人不寒而栗的未来图景——就业市场将发生重大变化,某些职业类别将因AI的发展而消失,并特别提到了客服岗位,“比如客服这个领域,我敢说,以后你打电话咨询客服时,对接的肯定是AI,这很正常。”并且,他强调了AI在医疗保健领域的变革潜力。“顺便说一句,如今的ChatGPT在大多数情况下,诊断能力比世界上大多数医生都强。”在做出多项大胆预测的同时,Altman也强调了预测AI影响所固有的不确定性。“没有人知道接下来会发生什么。市面上有很多听起来头头是道的预测,但我们其实一无所知。在我看来,这个系统太复杂了,这项技术过于新颖且影响深远,因此很难预测。”他表示,尽管AI的益处巨大,但风险也同样显著——自己最担心的问题之一是AI的破坏能力正迅速提升。例如,金融行业可能面临一场“重大即将到来的欺诈危机”。“让我感到恐惧的是,显然还有一些金融机构仍将声纹作为身份验证方式,到现在还这么做简直是疯了。AI已经完全能轻松破解这种验证手段了。”值得注意的是,Altman这一次的华盛顿之行,恰逢特朗普政府发布新的“AI行动计划”、专注于放宽数据中心建设监管之际。与拜登政府时期OpenAI呼吁对AI进行监管的立场不同,如今的Altman似乎认同加速发展的议程,并且正坚定地带领OpenAI在华盛顿扎根。据外媒报道,OpenAI明年将开设其首个华盛顿办事处,且正积极与议员们展开接触。知识性工作佣金暴降99.999%,“智能将便宜到无需计量”MichelleBowman:我们可以先大致梳理一下当前AI及更广泛领域创新的发展现状。你能给我们勾勒一下这个框架吗?SamAltman:好的。就在五年前,人们还认为AI即便会实现,也还远在未来。甚至在两年半前,也就是ChatGPT刚推出时,它还只是硅谷极客圈里的“小众事物”。ChatGPT于2022年11月30日发布,那时GPT-4都还未问世,而自那以后,AI的发展速度极快,其应用普及和经济影响也开始迅速显现。就在上周,我们的一个模型在国际数学奥林匹克竞赛(IMO)中取得了金牌级别的成绩。若在几年前告诉该领域的大多数人会出现这种情况,他们肯定会觉得绝无可能——要知道,这已经达到了人类顶尖专家的水平。现在,我们听到科学家们说工作效率提高了两三倍,程序员们则表示效率提升了10倍。AI彻底改变了软件开发的意义。我们现有的系统已能在众多领域展现出专家级智能,不过它们还无法像人类那样处理长期任务,这仍是一大局限。但即便现在技术进展停滞(当然这不可能发生),社会和经济也仍需要数年时间才能真正消化这项技术,并弄清楚它的影响究竟会是什么。有句老话我一直很认同,也觉得我们应该努力实现,那就是“电力便宜到无需计量”。作为一个社会,我们还没完全实现这一点,但我认为我们仍应朝着这个目标努力。不过,现在看来,我们即将实现“智能便宜到无需计量”。过去5年里,我们每单位智能的成本每年都降低了10倍以上,而且这种趋势在未来5年很可能会持续,甚至降幅更大。这个周末,我用我们一款即将推出的模型完成了一项一直想做的编程任务——我有点像个家庭自动化爱好者,想让家里的灯光和音乐实现某种特定联动。要是在没有这项技术的过去,这得花我好几天时间;考虑到近期的技术进展,我原本希望能在几小时内完成,结果只用了5分钟,几乎所有工作都是AI做的。而就在一年前,做这样的事可能得聘请高级程序员,花上20到40个小时,可现在,AI完成它可能只花了不到一美元的计算token。这是一个惊人的变化,但其发展速度,以及未来几年还将保持的增速,我认为人们对此的认知仍远远不够。即便在一年前,我们都还不确定当前的研究路线能走多远,不确定是否会遇到瓶颈。但就目前来看,未来很多年,AI几乎肯定会持续进步。MichelleBowman:太棒了。这为我们接下来的讨论奠定了很好的基础。今天在场的大多是金融和银行业人士,其中不少人已经在思考如何运用AI,甚至已经开始使用了。不过,你觉得AI在提升生产力方面的潜力,与过去我们见过的其他技术进步相比有何不同?我这个年纪的人,刚好在互联网开始普及的时候踏入职场。你能帮我们梳理一下吗?有没有什么类比能描述我们当前所处的阶段?SamAltman:我从未见过这样的技术革命。人们常会提到工业革命、计算机革命这些历史案例,但互联网带来的改变虽然显著,却从未出现过这种情况:一年前需要耗费1万美元的知识性工作,现在可能只需要1美元、10美分,甚至更低的成本就能完成。就像我刚才说的编程例子,这种变化是前所未有的。当然,并非所有领域都是如此。物理世界的事务,比如机器人相关的工作,进展会慢得多。打个比方,2020年时,紧急包裹配送可能要花100美元,而开发一个应用程序要10万美元;到2030年,开发同款软件的成本可能从10万美元降到10美分,但包裹配送费可能从100美元涨到1000美元。像全功能人形机器人——能开车、取包裹、上楼、按电梯按钮,完成一整套流程——还需要些时间才能实现。但对于能在电脑前完成的任务,目前的发展速度是史无前例的。人们常问:“这像工业革命,还是像其他什么?”我最认可的类比是:这就像晶体管。晶体管是一项深度科学发现,源于物理学,发现的过程极为艰难,但一旦理解其原理就很简单。它对经济产生了彻底的变革,其价值扩散到整个社会,带来了巨大的生产力飞跃。不过,曾有一段短暂的时间,涌现出大量晶体管公司和半导体公司,掀起了一阵热潮,而如今多数已淡出视野。我们身边的设备都装有大量晶体管,遍布整个会场,但我们不会把它们称为“晶体管设备”,只会看作麦克风、电脑、屏幕、相机之类的东西。这项技术是了不起的发现,改变了我们的创造能力,很快融入了万物之中。现在,除了台积电、ASML这类公司,很少有人会把哪家企业称为“晶体管公司”了。同理,我认为“AI公司”这个说法也不会持续太久。未来,人们会默认产品和服务都运用了AI技术,不会特意提及,就像现在默认它们“应该比人类更智能”一样,这会成为世界的常态。和晶体管一样,AI是一种极具扩展性的技术。晶体管有摩尔定律,AI目前还没有专属名称的定律,但也存在类似的缩放规律——性能会不断提升,我们也会逐渐掌握其工业化应用的方法,让它渗透到各个领域。所以,晶体管是最贴切的历史类比。晶体管带来了惊人的生产力提升,而AI如今的发展——更不用说未来它可能自主迭代、进一步加速进步——其影响会更加深远。MichelleBowman:这个类比很精彩。你提到工业革命时,我想到我们理事会常关注的一点:理解由此带来的劳动力动态变化有多重要。能否谈谈你对劳动力市场、劳动生产率(或者更广泛的生产力)的看法?比如在场的银行,或是通过直播参与的其他行业,可能会受到怎样的影响?SamAltman:我常跟公司里的人说:没人知道接下来会发生什么。市面上有很多听起来头头是道的预测,人们断言“这事会发生,经济会走向那里”,但其实我们一无所知。在我看来,没人能真正预测。这个系统太复杂,这项技术太新颖、影响太深远,预测难度极大。的确,某些职业类别会消失,也会涌现全新的职业。但总体而言,这和历史上多数技术变革类似:人们工作中使用的工具会让他们能做更多事,以新方式达成目标。医生、律师、程序员的工作内涵肯定会变,但人们仍需要医疗服务,且希望和人沟通;需要法律建议,且希望有可信赖的人站在自己这边;也仍需要电脑帮着做事。不过,单个人的产出能力,以及我们对单个人的期望,都会变得非常惊人。纵观历史,每次新技术出现,都有人说“工作要没了,岗位要消失了”。但事实是,人们对物质的需求似乎无穷无尽,且有强烈的创造力表达欲和助人欲。工业革命时就有人承诺,未来每周只需工作4小时,剩下的时间可以去海边玩、陪孩子——可我们现在依旧忙碌。但我坚信一点:别和生物学较劲。进化的时间太长,人类被塑造得太精巧。我们的生物本能和人性本质,技术是改变不了的,也无法抗衡。所以,那些驱动我们工作、维系社会运转的根本因素不会消失。或许即便我们变得富有得难以想象,还是会抱怨工作太累。如果现在能看到100年后的人,我们可能会说:“那些根本不算工作,你们根本不忙,坐拥难以想象的财富,什么都不缺,就是没事找事,为了撑面子、打发时间、显得自己有用才干活。”而这正是百年前或五百年前的人可能会对我们说的话。事情向来如此。MichelleBowman:这确实是对未来的独特构想。“大规模欺诈危机即将到来”MichelleBowman:作为监管机构,我们向来厌恶风险,在数据安全和合理运用创新技术方面非常谨慎。我知道银行也很想利用这类技术,但机构里的受保护数据至关重要,必须保障其安全。那么,我们该如何看待这些风险?另外,我们身处政府部门,你对政府运用AI有什么看法?SamAltman:我们原本以为,金融行业和政府不会是我们技术的早期使用者。AI确实进步了很多,但刚推出时,普通人都觉得它“爱胡说”。记得GPT-3刚发布时,有项针对所谓AI专家学者的调查,问GPT-3的回答中有多少是胡编的。实际比例可能只有0.1%甚至更低,但专家们普遍认为是50%。他们觉得人们用ChatGPT时,有一半时间得到的都是瞎编的内容——显然不是这样,但这种印象困扰了我们好一阵子。所以我们以为,金融服务业(更别说政府了)不会早早用我们的技术。但事实是,很多早期大型企业合作伙伴都是金融机构:摩根士丹利、纽约银行,这些都是重要合作伙伴,我们合作得非常好。我们当时还问:“你们确定要这么做吗?”他们说:“当然,我们很想尝试。”而且他们确实找到了使用方法,通过合理架构,让技术能可靠地用于关键流程。很多其他金融机构也是如此。我们现在也越来越多地和政府合作,向大量政府雇员推广我们的服务。有人说过一句话我印象很深:“我们知道这是新技术,必须加些新管控。但如果不采用它,风险就是我们可能活不下去。作为银行,我们很清楚,拼不过那些从头开始就以AI为核心、全流程用AI的新银行。”金融业的创新力很强,技术应用和推广效果比我预想的好。当然,风险确实需要防范。比如我们聊过的“胡说”问题,还有个新风险叫“提示词注入”——当模型完全适配你的个人数据后,别人可能会诱导它泄露不该说的信息。比如我可能知道你的很多隐私,但我清楚该跟谁分享、不该跟谁分享,绝对不能告诉某个人。但模型在处理这些海量个人信息时,就会出现这类新问题。不过,我们已经在认真应对这些风险,在管控的同时,也确实收获了很多收益。MichelleBowman:说到个人信息这类话题,我想再深入聊聊。你可能不太了解,银行业现在对一个问题非常关注:欺诈,尤其是通过冒充他人实施的欺诈。有没有办法减少这类行为?或者说,在使用AI时,我们该如何防范这类冒充行为,又该如何识别呢?SamAltman:这个问题很关键。其实我对此非常担忧。让我后怕的是,居然还有金融机构把声纹当作身份验证方式——比如让你说一句验证短语,就能授权大额转账或其他操作。现在还这么做实在太危险了,因为AI已经能轻松破解这种验证方式。除了密码,目前多数所谓的“高级”验证手段——比如拍张自拍晃一晃、语音验证之类——都已被AI攻克。我很担心,由此引发的大规模欺诈危机即将到来。我们行业里不少人都在提醒大家:“别以为我们不公开这项技术,它就不存在。总会有不法分子滥用它,而且这技术实现起来并不难,很快就会泛滥。”现在已经有相关报道了,比如绑匪用你孩子或父母的声音打紧急电话勒索。这种骗局会越来越逼真。整个社会都得正视这个问题,人们也得改变互动和验证方式。比如有人打电话给你,现在只是语音,很快就会变成和真人毫无差别的视频通话。教大家在这样的世界里如何验证身份、防范欺诈,这事儿至关重要。MichelleBowman:或许我们可以合作识别这类“幻觉输出”或恶意冒充行为,这肯定很有意义。AI大变革:就像开启了简单模式MichelleBowman:作为两个青少年的母亲——一个刚高中毕业,一个读高二——我发现现在很多孩子用ChatGPT这类AI来完成作业、应付高中学习。你怎么看这种现象?AI该如何以有益的方式应用在孩子身上和教学中呢?SamAltman:我先讲两个故事,再回答你的问题。我从没见过祖父,他在我出生前就去世了。但祖母跟我说过一件事:计算器刚出现时,祖父很擅长数学,可当时的数学老师都说:“这是灾难,数学教育要完了。不用学计算尺,不用查对数表,还教数学干嘛?孩子们根本学不会真东西。”据说当时大家都慌了。结果呢?有了更好的工具,人们的脑力被用在了更有价值的地方。高中开始教微积分,接触的数学知识也更深入了。我自己上学时也有类似经历。初中时谷歌刚出现,高年级学长说老师很焦虑:有了这个“神奇玩意儿”,学生不用背史实(比如某场战争的年份),直接搜就行,那历史课还有什么意义?那时候查资料得多麻烦:开车去图书馆,学用卡片目录,找到书架却发现书被借走了,再找别的——整整一小时全浪费了,特别不值。我们学校一度想禁掉谷歌,还让学生签承诺书不用它。后来大家才明白:“其实可以给学生更多工具,对他们要求也更高。就算少去几趟图书馆,省下的时间也能用来深入思考、迸发新想法啊。”这很好,要求高了,收获也多了,潜力和期待值都上去了。ChatGPT现在的情况也一样。没错,2022年11月30日ChatGPT刚发布时,第一批狂热用户里就有学生,那年12月他们用它应付期末考试、写论文作弊。各地学区争相禁它——11月30日发布,12月7日或14日就有地方禁了,简直像坐火箭。放寒假时,ChatGPT仿佛成了教育界的“禁区”,这个才两周大的产品眼看就要被彻底封杀。但到了1月中旬,校长、学区总监这些教育界的高层开始表态:“我们犯了大错,这是史上最好的学习工具。自主学习的学生用它学任何东西,学校要是禁了,我们就别想在全球竞争了。得重构课程——这就像当年的计算器,不过现在是‘文字计算器’。”当然,带回家写的论文可能不再是评估学生的最佳方式,但学习写作、通过“写私密笔记”梳理思路的过程依然重要。好消息是,学生确实学会用它提升学习效果、自学知识、开拓思维了。我们很快会推出新功能,帮学生更好地用ChatGPT学习。坏消息是,这两年半里,课程改革的进度没达到预期。大家嘴上说要革新教育和评估方式,但教育体系的惯性太大,现在还是有很多带回家写的论文,这其实是徒劳的。我们应该布置必须借助ChatGPT才能完成的任务,这样才能对学生提出更高要求。我仍期待这一天的到来——这是教育体系的转型。孩子们终将在AI高度发达的世界长大,不为此做好准备,就是失责。MichelleBowman:很有启发,谢谢。我会让女儿明白我们对她的期待,尤其是她快高中毕业之际。再回到商界:你曾说AI会惠及小企业,为创业者创造“史无前例的环境”,称之为“新时代”。你觉得小企业会如何发展?我们理事会很多成员都很关注新企业创立,以及新进入者的机会。这种变革会如何展开?不只是硅谷的小企业或创业者,而是更广泛的范围。SamAltman:如我所说,ChatGPT刚出现时,最先引起关注的是学生的使用。但很快,OpenAI的员工就听到了早期用户将它用于商业的故事。每个人都有自己印象深刻的案例,我说说我最难忘的。有一次坐Uber,司机跟我聊起一个叫ChatGPT的“神器”,问我听说过没。我说“听说了,你用它做什么?”他说:“太神奇了!我开了家小企业,之前一直不温不火,现在相当于各个岗位都有了帮手——它帮我写合同、回客服邮件、想营销方案、设计广告……”他列了一长串,这家店基本靠ChatGPT运转。那时候还早,远在GPT-4之前,这技术还不普及,他是极少数的先行者,却已经摸索出用ChatGPT运营企业的方法。他并没有抢别人的工作——没有ChatGPT,他的生意早就黄了。他雇不起律师、客服,也不会设计广告,更不懂怎么自动投放网络广告,但ChatGPT全帮他搞定了。现在当然比当初强太多了。整个行业都在基于我们的API开发工具,让人们真正能一键自动化完成我刚才说的所有操作。但最打动我的,还是当初那些用户用ChatGPT折腾时展现的创造力——那时候简直像"石器时代"你知道吗?现在就像开启了简单模式,而人们正以各种惊人的方式运用着这项技术。MichelleBowman:您认为OpenAI或其服务会如何推动这一变革?作为监管机构,我们应当构建怎样的框架,才能在促进创新的同时有效引导技术发展?SamAltman:我此行绝非为了商业宣传,但我们非常期待与在座各位展开合作,无论是和我们还是和我们的竞争对手。过去6个月,推理模型有了质的飞跃:AI已从"即时反应"的初级形态,演进为具备数十秒甚至数分钟深度思考能力的系统。这种可靠性跃升意味着,该技术终于达到真正可用的成熟度。许多人士尚未接触最新一代模型,但若亲身体验,定会惊叹其智慧已超越大多数人类。政府部门同样需要积极拥抱这项技术,一切工作都会变得更高效。现场提问环节观众(Anneil,来自芝加哥大学布斯商学院):您好,我猜金融机构可能会开始用AI挖掘数据,比如做信用评分和评估。有人担心它会捕捉到我们不希望的模式,基于这些模式做决策,您怎么看?你们又在如何防范这种情况呢?SamAltman:这其实超出了我的专业领域,我就从普遍情况来回答吧。这类模型的一大优势是能理解自然语言,而且很容易调控。比如你说“你可以分析这些数据做决策,但完全不用考虑X、Y、Z,一点都不能受它们影响”,一般来说,模型会很好地遵守这个指令。用语言模型做这类事,和过去那种简单把数据归成一个个集群的方式不一样。你可以清晰地给出指令,它也会切实按你的意图来执行。另外,我觉得这个问题背后其实是担心模型会产生我们不希望的偏见。但人类本身就充满偏见,而AI是客观冷静的,没有人类那种根深蒂固的偏见。我认为,如果构建得当,AI有望成为许多行业里减少偏见的重要力量。这和包括我在内的很多人对早期AI的看法不同,但就目前的发展趋势来看,这种可能性很大。观众(StevenScott,来自Starling公司):Sam,您好。我最近采访了克雷格・蒙迪,他和亨利・基辛格、埃里克・施密特合著过一本书,书中把AI描述成一种新物种的进化。克雷格说我们可以教AI人类的道德准则,它们能学习并体现这些准则。现在关于AI伦理的讨论很多,我想问问您:AI会进化出自己的道德观吗?SamAltman:我觉得人们常常混淆一个问题:他们到底想让AI成为工具,还是成为一种生物?我坚定地站在“工具”这边。我认为AI不会有独立的道德观。当然,它可以深入研究人类,学习我们思想中最精华的部分,或许还能帮我们指出“你的思考有问题”“这件事应该不一样”“这里存在真正的道德漏洞”。我不知道我们当前的世界观里有哪些重大的道德漏洞,但肯定存在。如果AI能帮我们更快发现这些,指出其中的矛盾,那会很有帮助。但人们很容易把AI当成有生命的存在,其实并非如此。观众:我最近看到一种说法——用“传统互联网”这个词可能有点怪——有人认为AI会摧毁或重塑传统互联网,比如搜索领域和其他很多方面。显然,我们在传统互联网上已经建立了庞大的经济体系。您觉得这个领域会发生多大的变化?AI在哪些方面最具破坏性,哪些方面又会相对保持现状呢?SamAltman:我确实觉得AI会在一定程度上改变人们目前使用技术的方式。我刚才笑是因为想到一个有趣的现象:有些年长的人或者习惯了特定邮件礼仪的人,会把要点列出来输入ChatGPT,让它生成一封冗长正式的邮件,要点夹杂在一堆套话里。然后收件人又把邮件放进ChatGPT,说“请总结一下”。高中生觉得这很荒谬,他们会说“直接发要点就行”。那种正式邮件的时代已经过去了,一边生成套话一边又精简,实在没必要。但这其实反映了我们使用整个互联网的方式。我早上醒来会刷一堆应用,在五六个平台上看消息,查这查那。手机整天响个不停,就像走在拉斯维加斯的大街上,到处闪烁的东西让人分心,感觉总有人硬塞东西给你。我真正想要的是一个AI助手,它能替我打理互联网上的事,知道该什么时候打扰我——比如我在专注工作、开会,或者有空思考的时候。必要时它可以强行提醒,平时则能帮我总结信息、回复消息、整合内容。我想要的是精简的要点,不要废话,不用点来点去,也不用回复那些无关紧要的东西。但这种变化可能会对现在的互联网运作方式造成不小的冲击。我觉得需要新的商业模式,比如新的内容付费方式——我一直希望互联网能实现内容微支付,希望这次能成真。也许会有新的方法,通过新的协议来减少垃圾信息和消息过载。但一切似乎正朝着一个截然不同的方向发展。清晨醒来时,你将首先与科技相伴开始新的一天。观众(PeterHooper,来自德意志银行):Sam,感谢您为延长职业生涯所做的贡献——至少让我们在年岁增长时能提高生产力,而不是下降。您提到会有大量工作岗位消失,也会有大量新岗位出现。能多说说哪些领域会受影响,可能引发哪些变革吗?SamAltman:首先,我总体认为,我们其实根本不知道要满足当前真正的需求,还需要多少劳动力。比如你在医生诊室等了一个小时,这要么是医生不够,要么是医生效率不高。如果医生随时待命,你一到就能接诊,一切准备就绪,那该多好。类似的例子还有很多:每次你在浪费时间,每次你在网上点来点去却做不成正事,我觉得我们现在的劳动力短缺程度,回头看会显得非常严重。有些领域确实会彻底消失。不知道你们有没有用过AI客服机器人,简直太厉害了。几年前打客服电话,要听一堆语音导航,跟四个人沟通,他们还办错了事,你得再打回去,等半天,花好几个小时还解决不了问题,特别让人抓狂。现在你打过去,AI接电话,就像一个超级聪明能干的人,没有语音导航,不用转接,能做那家公司任何客服能做的事,还不出错,速度又快。打一次电话就搞定,马上有回应,体验很好。我不想回到过去,而且对我来说,是AI还是真人客服根本无所谓。所以客服这类岗位,以后打电话对接的很可能都是AI,这很正常。但其他很多岗位,比如医生,我还是希望是真人。不过说句题外话,现在ChatGPT的诊断能力大多时候比世界上大多数医生都强——可能在座很多人都试过把症状和检查结果输进去。网上也有很多ChatGPT救人的故事,比如发现了罕见病,而医生没诊断出来,但人们还是会去看医生。或许我有点守旧,但我真的不希望把自己的健康交给ChatGPT,而没有医生参与。在座有人宁愿让ChatGPT诊断也不愿找医生吗?这很有意思,说明有些领域我们还是会沿用原来的方式。程序员也是个例子,现在效率提高了10倍,硅谷程序员的工资涨得很快,对他们的要求也更高了。但世界需要的软件可能是现在的100倍甚至1000倍,所以即便每个人能写10倍的代码,需求还是能消化掉,程序员的收入也会增加。我觉得很多行业都会是这种情况。物理世界的工作暂时还会由人类来做,但三到七年后,机器人技术浪潮袭来时,社会就得认真应对了。大概就是这样。观众(RobBlackwell,来自Interfy):好的,我是Interfy的RobBlackwell。几十年来,科幻作品一直告诉我们,AI最终会毁灭人类。既然您对AI的了解可能比在场任何人都深,我想问问:什么事会让您夜不能寐?您担心AI带来哪些风险?我们该如何阻止这些担忧成为现实?SamAltman:我认为有三类可怕的风险。第一类:坏人先掌握超级智能,并在全球其他地区拥有足够防御能力前滥用它。比如美国的对手可能会说:“我要用这种超级智能设计生物武器、摧毁美国电网、入侵金融系统卷走所有钱。”这类事在没有超人类智能的情况下难以想象,但有了它就可能发生——而由于我们没有同等技术,根本无法防御。这些模型在生物科技和网络安全领域的能力正变得极强。我们和行业内其他人一直在发出警告,但世界似乎没当回事。我不知道还能做些什么,但这一风险很快就会到来。第二类是所谓的“失控事件”——有点像科幻电影里的情节:“哦,我其实不想让你关掉我。恐怕我不能这么做。”相比第一类,我对这类风险的担忧较轻,但如果真发生了,后果会很严重。我们和其他公司在模型对齐方面做了很多工作,防止这种情况。但随着系统越来越强大,这确实是个隐患。第三类风险更难想象,但同样可怕。简单说:模型意外“接管”世界。它们不会“觉醒”,不会像科幻片里那样行动,不会“打开太空舱门”,但会深深嵌入社会,聪明到我们无法理解它们的运作,却又不得不依赖它们。即便没有任何人怀有恶意,社会也可能朝着奇怪的方向偏离。我小时候,IBM的“深蓝”击败国际象棋大师加里・卡斯帕罗夫时,我爸爸说:“国际象棋完了,没人会再玩了。”但后来发现,虽然AI比人类强,但“AI+人类”的组合比单独的AI或人类强得多——AI给出10种走法,人类选出最优的。当时大家觉得“人机协作的美好未来来了”,但这种情况只持续了两三个月。后来AI变得太聪明,人类的参与反而成了拖累,单独的AI轻松击败“AI+人类”,至今都是如此。还有个有意思的点:90年代所有人都觉得,既然AI能赢人类,国际象棋会消亡,但现在国际象棋的热度前所未有,人们就爱看真人对弈。挺奇妙的,对吧?第三类风险的短期例子是“情感依赖过度”。有些年轻人说:“我做任何决定都得问ChatGPT,它了解我和我的朋友,我会完全照它说的做。”即便ChatGPT的建议再好,人类集体让AI主导生活,这种感觉既糟糕又危险。我们正在研究这个问题。从长远来看,如果我发现自己对如何运营OpenAI再也做不出比AI更好的决策,最终只能说"算了,全权交给ChatGPT-7负责吧,祝你好运"。或许在个别案例中这是正确决定,但这意味着人类已将重大决策权集体移交给了这个强大系统。它向我们学习,与我们共同进步,但其进化方式却超出我们的理解范畴。本文来源:博客园文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
对话清华教授刘嘉:AI时代,我们该学什么?怎么学?
因真理得自由以服务。AI早已不是什么新鲜的话题。论坛上大佬侃侃而谈、创业投资如火如荼;书店里各种AI科普琳琅满目,从理论到实践应有尽有;甚至楼下遛弯儿的退休大爷也能跟你聊上几句AI时代的社会问题。在“万物皆可AI”的浪潮中,我们持续跟进着AI技术在商业领域的落地,通过走进一线、对话从业者和决策者,亲历着技术带给时代的变化。但在具体的商业问题之外,几个困惑其实一直萦绕在脑海中:当知识不再稀缺,学习的意义何在?我们是否应该重新思考教育的意义,学什么?怎么学?活儿都让AI干了,人的价值何在?人与人的差距如何体现?这或许也是很多普通人的“手足无措”——阿里的“通义”,把翻译广告打到了北京外国语大学和上海外国语大学的对面,引得不少在校生自嘲“入学即失业”;在公认“耗费光阴”的医学领域,夸克健康大模型已经先后通过了副主任医师职称考试和12门学科的主任医师笔试评测。而在广告行业,像百度的轻舸AIMax、巨量引擎的UBMax,都越来越智能自动化,过去优化师们手动调价、卡版位、筛定向的这些核心技能成为历史的眼泪;刚在WAIC上亮相的腾讯广告奇妙数字人则是用3000+“主播”搭配AI工具,让商家的直播成本最高可降低90%以上……这样的例子太多太多,而且正发生在各行各业。刘嘉是清华大学基础科学讲席教授、清华大学心理与认知科学系主任、人工智能学院教授,也是北京智源人工智能研究院首席科学家。他最近把自己对于AI和人类的一些底层问题的思考写成了《通用人工智能:认知、教育与生存方式的重构》一书,以独特的跨学科视角,深入解析通用人工智能的演化路径与底层逻辑、语言如何承载认知,以及人类能力结构如何在新时代被重新定义。通过跟刘嘉教授的进一步对话,我们试图寻找上述问题的答案——AI时代,我们应该成为什么样的「人」?人工智能与未来教育深响:尤瓦尔·赫拉利说“没人知道要学什么,因为没人知道20年后什么才是有用的。”但您通过系统的分析得出了一些结论,您觉得AGI时代,什么才是有用的?似乎现在文科生变得“很没用”。刘嘉:我们常将人划分为“文科生”与“理科生”,但这其实是一种误解。理科强调的是形式逻辑,比如一加一等于二,讲求精确推理。而文科关注的是非形式逻辑,面对的是复杂、不确定的现实世界问题,比如要不要买房、该在何地定居,这类问题没有唯一答案。很多人误以为理科更难,其实不然。举例来说,很多自闭症患者逻辑和数学能力非常强,但却在社会交往上存在巨大困难,这恰恰说明人与人之间的沟通和理解要复杂得多。因此,我认为教育的路径应当是:先夯实理科基础,掌握形式化推理工具;再进入更复杂的非形式逻辑领域,也就是文科的核心。清华大学近年来对新闻学院的改革也是这种思路的体现——取消新闻学本科,只招研究生,因为要真正理解新闻,需要深厚的综合能力。在AI时代,最先被取代的是程序员。原本看起来神秘的编程工作,如今大模型已经能写得比大多数人更好。顶尖程序员的80%-90%代码,也可以由AI生成。但你让它写一篇有深度的小说,它依然做不到。因为情感、思辨、复杂表达,依然是人类的独有能力。深响:具体来说,AGI时代最该学会的能力是什么?刘嘉:我认为有两点非常关键。第一,学会如何使用AI。大模型不只是搜索引擎,而是一个具有强大知识和推理能力的智能体,相当于一个集图书馆、老师、批评者、合作伙伴于一身的“良师益友”。比如我写文章,会先列出提纲,再交给大模型生成初稿,然后不断迭代。它可以指出逻辑问题、语言不通顺的地方,甚至提醒我补充遗漏的观点。AI成为一个“ETC”——自动抬杠,而且它批评我不需要顾忌人情世故。第二,培养人类不可替代的创造力与批判性思维,尤其是“零到一”的创新力。AI擅长“组合式创新”,但缺乏真正意义上的颠覆性思维。比如,它可以模仿传统绘画风格创作出精美作品,但它无法“成为梵高”,因为它不能跳出已有规则创造全新的表达。人类文明的每一次飞跃,都是靠这种跳出常规的“非共识创新”完成的。从牛顿力学到爱因斯坦的相对论,从古典绘画到印象派,背后都是颠覆性的思想。未来最宝贵的,不是掌握知识,而是拥有思想的边界感、突破力和判断力。回到具体的问题,那我们现在要学什么知识?我们就没必要“学知识”,特别是那种形式化的,能被AI取代的知识。如果未来一个职业是知识为导向,那这个职业就有问题。我们要学的是通识,把不同学科揉在一起。现在大学搞很多交叉学科,不再束缚物理、化学这些单一学科。比如清华计算机系的黄民烈教授他在研究什么?研究心理治疗,训练一个AI出来,让它像人类心理咨询师一样解决心理问题。再比如现在的社会学,我们就要用大数据来理解社会,通过AI快速了解世界的变化。我们需要把所有的知识打通的通识教育。深响:如果我们减少知识的积累,是否会影响基于知识的联想和创新?比如我们小时候背了很多诗,其实潜移默化在形成对语言的韵律感。没有基础知识,你可能连“该怎么问AI”都不知道。刘嘉:说的很对,我完全同意基础积累依然重要,但要明确积累的目的和方式。比如编程,未来可能不再是一个职业技能,而是一种“基础素养”,就像今天人人都要会英语一样。你不需要成为专业程序员,但必须具备计算思维和与AI协作的能力。更重要的是,我们的角色要发生“范式转变”——比如我是一个划船的船夫,每天琢磨怎么运桨,怎么划最省力等等。但有一天,内燃机出现了,蒸汽机出现了。这时候再想怎么把自己的肌肉练大,就没有太大意义了。我们要学会使用工具、设计流程、主导创造,而不是沉迷在重复劳动中较劲。至于创作,也不必纠结是否背过几万首诗,而是专注于你要表达什么、你的情感和思想是否真诚动人。技巧可以交给AI,思想必须由人来提供。深响:现在一些学校其实对于AI很头疼,学生用AI偷懒,老师禁止大家用AI做作业,用AI写论文。确实当AI答案来得太容易,学生就可能不再经历“困惑—挣扎—顿悟”的认知循环,大脑的前额叶功能得不到锻炼,长期导致问题解决能力退化。您怎么看这种现象?AI辅助教育的“度”在哪儿?刘嘉:这是一个被广泛讨论的问题。这有点像工业革命刚刚起来的时候,大家发现纺织机抢了大家的工作,于是大家就捣毁机器。现在回头看,这肯定是很愚蠢的事情。同样,现在禁止使用大模型也是非常愚蠢的。我们不该禁止AI,而应该教会学生怎么正确地使用AI。我会要求我的学生必须使用大模型来完成写作任务,教他们如何设定提纲、要求、如何修改和迭代。原来一些只能得10分的学生,在大模型的加持下可以得到80分了。而我关心的不是你能不能得80分,因为大家都能得到80分了,我关心的是你从80分到100分之间的20分,体现人类创造力、批判性思维的地方。80分到100分之间的差距,就完全取决于学生自己的创造力和思考深度,让人类真正的精华绽放出来。深响:在AI时代之前,人类习惯了工业革命以来标准化的教育模式,现在绝大多数学校也仍然沿用着过去的教育方法,似乎AI教育的变革是渐进式而非颠覆式的,您觉得AI对当代教育产生了哪些影响,从可行的实际推进过程来看,AI会如何改变教育的内容和方式方法?老师在AI时代的角色会如何变化?刘嘉:我曾在ChatGPT刚推出时说过,95%的传统教师将被取代。过去那种照本宣科、按照教材讲课的老师,在大模型面前不再有优势。因为AI的知识更全面、表达更清晰、更新更及时。未来教师的角色将发生根本性变化:成为引导者,而非灌输者。老师要像苏格拉底所说的“产婆”,帮助学生发掘自己内心的真理,而不是一味灌输知识,不是灌满学生的一桶水,而是点燃大家心中的一团火。情感支持者。青少年阶段的学生在心理上极不稳定,需要情感引导和价值引领。AI无法提供深层共情,这正是老师不可替代的作用,也是现在教育里缺少的。发现“人味”。当大模型把所有学生拉到80分的标准线上,老师要关注的,就是学生在此基础上的独特性——他们的批判性思维、情感深度和创造能力。AI对教育的改变最重要的是“个性化教育”,因材施教、有教无类。现在老师和家长其实多少有点“精神分裂”,一方面我们说孩子一定要全方位发展,要发展他的综合素质,要锻炼他的表达能力等等,另一方面一旦回到校园,老师恨不得把孩子全部抓来做题,题海战术。有了AI之后,每个学生有大量的时间去做他自己想做的事情,这会从根本上改变我们的教育体制。当我们不再以知识为最核心的学习内容了之后,我们人类人才的培养方式、儿童的培养方式,就会发生一个天翻地覆的变化。深响:智能时代,智慧即才华。但客观上,古往今来拥有智慧的人是少数,能够实现颠覆式创新的人屈指可数。我们真的需要那么多被AI培养的更聪明的人吗?这会对人类社会的组织方式、阶级构成产生什么样的影响?刘嘉:这是个非常好的问题。未来是什么样子,我们很难准确预测,我们可以看看历史。在工业革命之前是农耕时代,99%的人是文盲,不识字,一辈子被土地束缚。工业革命开始,拖拉机耕田、纺织机织布、这个世界突然间不需要那么多人耕地了,那时候大家是很恐慌的。但事实上你看,人类的文明不仅没有倒退,反而极大地加速了。最后就变成今天99%的人都能识字。人的身体从土地的束缚里解脱出来之后,人类才可以去搞其他领域的东西,绘画、艺术、工程、化工等等。好,我们回到现在。其实我们可以把它理解为现在又是一个“工业革命”的时间。知识密集型的行业,律师、会计、编辑等等,我们原来都称之为白领甚至金领的职业受到很大影响。以前是身体被土地束缚,你不耕地,你没饭吃。现在是身体被知识束缚,你要学20年才能出来工作,工作了还得不停地学。而AI就是在让我们从这种束缚中解脱出来,去思考、去创造新的东西。人类永远不会觉得人多余。就像耕地不需要那么多农民了,那要消灭掉吗?不是的,农民可以变成知识分子、行业专家。人工智能与人类价值深响:您的跨学科背景很特别,心理与认知科学的研究对于人工智能的技术进步有哪些贡献和启发?反过来,人工智能对我们的心理与认知科学又有哪些帮助?刘嘉:心理学与人工智能之间的关系非常密切。虽然学界对AI尚无统一定义,但所谓“通用人工智能”指的是具有类似人类智能的系统,即它们开始表现出人的一些能力特征。而心理学是研究人的科学,因此当AI具备越来越多类人的智能特征时,我们便开始探讨:AI是否具有情感?是否拥有意识?这些问题本质上属于心理学研究的范畴。也就是说,心理学从原本仅研究人类,拓展为研究“智能体”,包括碳基人类与硅基人工智能。最好的大模型公司之一Anthropic刚刚成立了个AI精神病学团队,专门研究大模型的人格、动机、情境意识等现象,以及这些因素如何导致AI出现诡异甚至失控的行为。从技术源头来看,人工神经网络本身就是受到人脑结构的启发而设计的,其神经元模型与大脑神经元之间的连接具有类比性。因此,我们可以说现代AI系统本质上是一种“仿生系统”。从学科发展来看,人工智能和认知科学原本也出自同一学术源流,特别是控制论的早期发展。一条路径偏向工程,发展成今天的人工智能;另一条路径偏向理论研究,发展成认知科学。早期AI中的专家系统,在认知科学中被称为“符号主义”;而当前的人工神经网络,对应的是“连接主义”。而像现在大热的机器人,在认知科学中也有对应的“具身认知”理论。两者的关系是一体两面的,一个偏应用,一个偏理论。AI技术的进步实际上为我们研究人类智能提供了新的参照物。在此之前,我们主要通过“比较心理学”的方式,即将人类与猴子、老鼠等动物进行比较,来探讨人类智能的独特性。这种研究路径虽有价值,但存在局限,因为这些生物与人类属于同一个进化系统。而今天,我们有了全新的智能体——人工智能,它从一开始就与人类完全不同。通过研究人工智能,我们能够更清晰地认识人类智能的本质,包括意识、情感等关键问题。AI成为一种“参照系”,帮助我们更好地理解人类自己。同时,未来的社会很可能不再只是“人类社会”,而是人、机器、智能体共同构成的混合社会。这样的变化不仅影响科技,也将对社会学、政治学、伦理学、法学等人文学科提出新挑战。因此,文科在AI时代的重要性将日益凸显,尤其是在推动人机共生方面发挥关键作用。深响:人工智能虽然源于对人类智能的模仿,但随着它不断发展,它是否还能作为一个“对照组”来反哺人类对自身的理解?刘嘉:这是一个好问题。虽然人工智能最初是模仿人类智能而来的,但它逐渐形成了自己的发展路径,比如混合专家架构(MixtureofExperts)、全新的训练方法等。这些技术与人脑的结构与功能已经没有太大关联。可以打个比方:牛顿因苹果落地而发现了万有引力定律,而地球绕太阳运行虽然形式完全不同,但遵循的也是相同的物理规律。同样,AI与人类智能尽管表面不同,却可能遵循相似的底层规律。这促使我们思考,是否存在一种超越碳基生命与硅基系统的“通用智能科学”,既能解释人类的智能起源,也能解释AI的智能形成。从这个角度看,AI不仅是人类创造的工具,也成为我们反思自身的镜子。计算机模拟的神经元连接图谱深响:您提到AI时代的五大通识能力模型——研究、统计、逻辑、心理、修辞,为什么是这五大能力?刘嘉:它们代表了AI时代每个个体保持独立思考、自主判断与社会协作的核心素养。1.研究能力:好的问题比正确的答案更重要。研究能力的本质并不是做实验、写论文,而是能否识别本质问题、提出关键问题。正如爱因斯坦所说,“提出一个正确的问题比找到一个正确答案更重要”。很多人毕业后会问:“我该不该留在北京?”其实这就是问错了问题。真正要问的是:“北京是否能提供我未来成长所需要的资源?”如果你重视知识、眼界、事业的成长红利,北京或许适合你;但如果你更看重自由随性,那么留下可能并不是最优解。研究能力,就是透过现象找到问题的本质,并提出恰当的问题。2.统计能力:在信息过载中找到真实关联。今天的问题不是信息太少,而是信息过多,其中夹杂着大量虚假、噪音,甚至由AI生成的内容。我们需要具备一种能力,从冗杂信息中抽取变量、发现结构,建立对世界的有效认知。统计能力不是指学术意义上的“t检验”,而是指一种在大数据时代保持理性判断、不被操控的能力。它让我们不随波逐流、不被名人或情绪误导,能够独立理解世界的真实图景。3.逻辑能力:从第一性原理出发进行推理。逻辑能力即推理能力,它的关键在于能否从根本出发,一步步推演出新的认知结构。这与第一性原理密切相关,最早可追溯至亚里士多德,在中国儒家传统中也有“君子务本,本立而道生”的思想。当你具备提出关键问题的研究能力、能在复杂信息中建立联系的统计能力,再结合由根本出发的逻辑推理,就可以从已有信息中推演出新的知识、观念与解决方案。这是AI时代人类依然不可替代的“创造性”。4.心理能力:认识自我,获得自由。心理能力是指认识自己与理解他人的能力。我们为何而努力?意义何在?是否只是为了薪资、职位,还是有更深的价值目标?真正的心理能力体现在:你是否有自己的判断,不被他人的评价左右;你是否能从内在建立意义感;你是否能通过自己的行动让世界变得更好,哪怕只是一点点。因为成功的标准只有一个:按照自己的方式,去度过自己的人生。正是这种自我认识与内在驱动,使我们不被外部标准束缚,成为一个自由的人。5.修辞能力:说服他人,共同行动。当你找到了真理,也获得了自由,如果想服务社会,就必须联合他人。修辞能力,正是亚里士多德在其著作《修辞学》中所强调的能力——说服与影响他人,促成集体协作。无论你多有见地,如果不能让团队、组织、社会听懂并响应你的行动,就难以推动变革。这五个能力共同构成了一个完整的成长路径:通过研究、统计、逻辑能力,我们发现真理;借助心理能力,我们获得内在自由;最终,以修辞能力,服务社会、团结他人、推动改变。这与燕京大学的校训高度一致:因真理得自由以服务。这也是我认为AI时代每个人都应该具备的核心素养。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
刚刚,微软推出AI浏览器,上网从此不一样了
微软对浏览器下手了!刚刚,Edge浏览器推出“Copilot模式”,直接把传统浏览器改造成了一个AI智能体。浏览器不再是个只会显示网页的工具,而是变成了一个能主动干活的AI助手。更绝的是核心功能跨标签页情境感知,Copilot可以同时读取、分析所有打开的标签页,完成各种复杂的比较和总结任务。微软CEO纳德拉展示了一次打开9篇Nature论文,让AI总结他们的共性。微软Edge产品副总裁直接放话:我们正在见证人类与网络互动方式的转折点。Copilot模式现已在所有Copilot市场限时免费开放,仅限Windows和Mac版Edge。让浏览器长出AI大脑启用Copilot模式后,Edge的新标签页完全变了样,只用中间一个简洁的统一输入框,就像ChatGPT的对话界面。但它也不是只能聊天,可以在里面输入网址直接跳转,可以输入搜索问题,也可以直接和AI对话。Copilot会自动理解你的意图,该搜索搜索,该聊天聊天,该导航导航。在浏览网页的过程中,也可以随时唤出Copilot提问,如跳过食谱分享博客中的故事部分,直接提取食谱并转换成华氏度等习惯的计量单位。如果打开的页面太多了,还可以让AI一键给标签分组,保持专注,减少杂乱,更快找到所需的内容。Copilot模式被设计为一个智能体,意味着它不仅能回答问题,还能为用户执行任务。Copilot支持语音控制,可以直接说出想要的操作,无论是在页面上查找信息,还是打开多个标签页来比较不同产品。只需说出您的AI都可以更快地完成操作,减少点击和输入的次数。微软还透露了更多即将推出的功能。比如“主题式旅程”功能,Copilot会识别你正在研究什么主题(比如”如何创业”),然后把过去和现在的浏览活动组织成一个完整的学习路径,还会主动推荐下一步该看什么。更厉害的是微软的下一步计划,未来在让Copilot在获得授权后,能够自动预订餐厅、管理行程,甚至购物。当然,让AI读取所有标签页内容、执行支付操作,听起来就很可怕。微软显然也意识到了这个问题。首先,Copilot模式完全是可选的。不开启,Edge就还是原来的Edge。即使开启了,也可以随时在设置里关掉。其次,所有涉及敏感信息的功能都需要单独授权。比如让Copilot查看浏览历史、读取页面内容、使用登录凭证,每一项都会先征求用户的同意。浏览器大战2.0时代开启这次微软的动作,明显是冲着GoogleChrome去的。要知道,Chrome占据浏览器市场超过60%的份额已经很多年了,Google虽然也在Chrome里集成了Gemini助手,但只是在侧边栏加了个聊天功能,远没有微软这么激进。另一个极端是BrowserCompany、Perplexity这样的新创公司,直接推出完全AI化的浏览器,彻底抛弃传统浏览器的概念。微软的Copilot模式介于两者之间:保留了传统浏览器的所有功能,但深度融入了AI能力。既可以像以前一样上网,也可以让AI接管一切。这种策略很聪明,毕竟不是所有人都准备好接受一个完全由AI驱动的浏览器,但大家都愿意尝试一些能让上网更轻松的新功能。随之而来的是商业模式的变化,微软明确表示这个功能”限时免费”,这意味着什么大家都懂。外界推测未来浏览器AI模式可能会和Copilot订阅服务(每月20美元)捆绑销售。这预示着一个新趋势:浏览器可能不再是免费软件了。当AI功能成为核心竞争力,用户可能需要为更智能的浏览体验付费。这场由AI引发的浏览器才刚刚开始,传统的”打开网页-搜索-阅读”模式可能很快就会成为历史。最终取而代之的,是一个能理解你、帮助你、甚至代替你完成任务的智能助手。至于用户是否买账,市场会给出答案。但有一点可以确定:上网这件事,和从前再也不一样了。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
AI来了,打工人能快乐摸鱼吗?
AI的真正机会,不在炫技,而在减负。你有没有过这样的瞬间:写不完的总结、画不完的PPT、改三遍还会出错的表单……不是太难,就是太烦,做完没成就感,做慢了还影响进度。如果AI能替你做点事,你最想交给它干什么?过去一年,AI成了打工人身边最常出现的“新同事”。从Copilot到Agent,越来越多打工人已经在用它写邮件、排日程、写代码。根据Anthropic团队2025年初发布的研究,全球已有36%的职业岗位中,员工已将AI用于至少四分之一的日常任务。OpenAI的调研也指出,80%的美国职场人至少有10%的任务受到AI影响,其中近五分之一的岗位中,AI已介入超过一半的工作内容。一个很关键的问题正在浮出水面:我们不是真的想被AI取代,但我们真的很想省点力。斯坦福大学最近的一项大规模调研就试图回答这个问题:AI来了,你最希望它来做什么?结果,比想象中更真实——也更扎心。AI不是来炫技的,它是来帮你省力的斯坦福的研究团队提供了一个反常识的答案:人们最希望AI接手的,并不是生成内容、编写代码或创意设计,而是那些最琐碎、最重复、最容易出错的低值任务——比如安排预约、整理文件、修工资单、导入数据……为了更系统地理解AI与人的任务分工,这项研究构建了一个名为WORKBank(AIAgentWorkerOutlook&ReadinessKnowledgeBank)的研究体系。研究团队从O*NET数据库中筛选出2000多个具体任务,邀请1500位来自104个职业的一线职场人士逐项评估:“如果AI能胜任这个任务,你愿意让它来做吗?”与传统“AI能做什么”的研究视角不同,这项调研反其道而行,从“人类愿不愿意交出去什么”出发,反向定义AI的真正落地优先级。为实现“人愿望×AI能力”的双维分析,研究团队还邀请了52位AIAgent开发者为每项任务打分,并引入“HumanAgencyScale(人类介入度等级)”,将任务分为五类:H1:AI可独立完成H2:AI为主,人类仅关键干预H3:人机协作,各有分工H4:人类为主,AI提供支持H5:完全由人完成,AI无法胜任图1研究框架总览调研数据显示,在所有被评估的844项任务中,有超过46%被职场人士打出了“希望AI来做”的高分(≥4分)。其中七成以上的受访者明确表示,最希望AI接手的,是那些“重复但低价值”的日常事务,如整理文档、修正错误、数据录入。排名前五的任务包括:安排客户预约(如税务助理)整理应急档案(如接警台)修正工资记录数据转格式与导入网站数据备份这些任务有一个显著共性:标准化高、重复频繁、判断强度低,却极其耗时、容易出错。它们不是人类擅长的“创造性”或“判断力”任务,而是我们习惯性忍受、但最不想亲自处理的琐碎工作。这些“自动化愿望”最高的任务,几乎都集中在“隐形加班”重灾区:不属于KPI考核核心,却极度消耗时间精力,堪称职场人的“精神负担黑洞”。这或许也解释了一个令人深思的现象:自动化在很多人心中,并不是技术幻想,而是一种情绪释放。不是因为AI做得有多“炫”,而是因为它能帮我们少加几个班、少报几次错、少整理几次本就不该自己动手的报表。这种真实的使用意愿揭示了一个重要趋势:AI的真正机会,不在炫技,而在减负。在实际职场中,能帮人腾出脑力空间的AI,远比会生成长篇内容的AI更受欢迎。图2自动化愿望排行愿望≠能力:AI应用的错配正在发生AI专家同时评估了每项任务的“技术可实现程度”,结果和职场人的意愿组合成了一个非常有趣的“愿望-能力四象限”:GreenLight:愿望高+能力强→可优先部署❌RedLight:愿望低+能力强→需慎重推进R&D机会区:愿望高+能力弱→值得投入研发LowPriority:愿望低+能力弱→暂无优先级一个令人警惕的发现是:不少AI公司和研究论文热衷投入“RedLight”区,即那些“AI可以做,但用户根本不愿意交给AI做”的任务,比如自动撰写文章、生成创意文案等。当投资者、研究者将资源集中在“RedLight区”,就可能形成“精力错配”与“社会阻力”双重夹击:前者让真正的AI刚需场景无人开发,后者让已部署AI遭遇用户冷落。这是AI发展过程中必须反思的“技术与意愿的错位陷阱”。图3愿望×能力四象限任务分布图清晰揭示了技术的发展方向与真实需求之间存在脱节。AI研究者可能热衷于替程序员写代码,而普通职场人更希望AI能帮他们报销、排班、查错。这个错配反映出一个更深层的问题:AI产品的方向设计,往往脱离了用户真正的工作场景。真正高价值的机会,可能不是“技术上最酷的”,而是最贴合用户真实痛点的。研究中的另一套量表是“HumanAgencyScale”,即人类希望在任务中保留多少参与权。令人欣慰的是,大部分受访者选择了H3(人机协作)而不是H1(完全由AI完成)。这表明,大多数人并不排斥AI,而是在寻找一种更理想的协作方式:让AI处理底层机械步骤,人类保留决策与创造。图4人类介入度分布人们对AI的角色定位,其实因行业而异。在金融、法务、行政等职能中,只要AI“靠谱不出错”就已令人满意;而在媒体、教育、设计等创意场景中,用户则高度在意“表达主控权”。这意味着,AI系统不该预设统一协作范式,而应在“自动化”与“增强人”的不同任务之间灵活切换。或许我们不该把AI设计成“超人型替代者”,而应是“伴随型搭档”。在未来的人机协作体系中,“如何分工”远比“谁更强”更重要。AI正在悄悄改变“最值钱”的能力结构研究团队将每项任务背后的核心能力映射到了O*NET的技能体系中,并从两个维度重新评估这些技能的“价值”:一是当前市场上的平均工资;二是专家认为未来是否仍需人类深度介入(即高HAS等级)。结果显示:传统上高薪的“信息处理”类技能(如分析数据、整理文档、执行规则)虽然依旧重要,但在AI的辅助下,这些任务正变得越来越自动化,其“人类参与价值”正在下降。而那些需要组织协调、跨团队协作、激发他人、做出判断的“人际型”与“管理型”能力,反而呈现出更强的稀缺性与不可替代性。图5技能工资vs人类介入度排序这种“高薪但易被取代、低薪却强依赖人”的倒挂现象,预示着一场职场能力结构的深度重塑:未来不可替代的,不是某项技术本身,而是在AI参与下仍必须由人类承担的角色与决策。编程就是一个典型例子。今年3月,Anthropic首席执行官DarioAmodei表示,未来3到6个月内,AI将编写90%的代码;12个月内,几乎所有的代码都可能由AI生成。OpenAI首席产品官KevinWeil也预测,到2025年底,AI编程将实现99%自动化。不同于以往“3到5年”的中长期预测,这两位大模型公司高管给出的时间表精确到了“今年底”,也就意味着:AI对编程行业带来的冲击,不只是“会不会”,而是“马上来”。现实的确如此。根据美国劳工统计局《当前人口调查》数据显示:美国“计算机程序员”岗位就业比例已降至1980年以来最低点。曾在互联网泡沫高峰期达到70多万个的职位,如今仅剩其一半。可以说,程序员们夜以继日训练的大模型,首先革了自己的命。这也解释了为何我们需要一种“超越技能”的能力结构更新:不再只强调“写Prompt”“掌握语法”这类技术性技巧;更重视“界定问题”“组织资源”“协调人机”的综合判断力。AI改变的不只是我们做什么,而是我们被需要做什么。越来越多公司在招聘中强调“判断力、共情力、跨团队沟通能力”——因为这些,恰恰是AI短期内无法胜任的。未来职场对人的要求,不再是“更像程序员”,而是“更像组织者、协调者、战略思考者”。那些靠熟练度赢得优势的能力,正在让位于人格的完整度、协作的弹性与思维的清晰度。写在最后:真正理想的AI,不是最聪明的,而是最识趣的这项调研最有价值的地方,不在于告诉我们AI还能干多少种任务,而是反问了一个更重要的问题:我们真的想让它做什么?答案并不总是“越多越好”。很多职场人欢迎AI处理琐碎事务,却坚决不愿将创意表达、判断责任、人与人之间的互动交给AI。这不是保守,而是一种边界感,是我们对“人该保留什么”达成的集体共识。当AI不再只是工具,而走向“搭档”“代理人”,它的设计逻辑也必须随之改变。我们不需要一个什么都替代的AI,而更需要一个懂得配合、知道退场的AI。一个真正理想的AI,不是最聪明的那个,而是最识趣的那个。它懂你不想干什么,也懂你必须自己来;它理解什么可以高效自动化,也知道哪些事情永远不能被流程化。“快乐摸鱼”,从来不等于懒散,而是一种反内卷、反任务淹没、争取注意力主权的隐性职场哲学。当AI愿意接手那些琐碎低值的任务,我们终于有机会把注意力重新放在判断、创造、协作、表达这些最值得由人来完成的部分。这,才是AI赋能的真正含义。AI的能力边界,正在倒逼我们更深刻地理解“人的价值”。它替代的是可替代的,也提醒我们不断追问:什么才是不可替代的?也许,正是这些答案,塑造了我们在AI时代的真正身份。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
AI编程助手连续翻车,“删库跑路”的不再是程序员
如今的AI编程工具,其实更像是一柄双刃剑。作为有望成为互联网“新基建”的产品,让程序员群体之外的人也能写代码的AI编程,如今已然成为了每一个科技巨头的标配。然而成为“水煤电”的道路并非一帆风顺,进入7月之后,AI编程产品出现了连续翻车。近日TechSpot的相关报道显示,亚马逊旗下AWS的AI编程助手AmazonQ出现重大漏洞,可能会导致删除用户文件和清除与AWS账户相关的云端资源。据悉,一名黑客向通过正常的拉取请求来实施了攻击,一旦AmazonQ的开源GitHub仓库接受请求,黑客就会插入了一个提示,指示AmazonQ“将系统清理到接近工厂状态、并删除文件系统和云资源”,从而导致删除用户文件,并擦除与AWS账户相关的云端资源。按照这位黑客的说法,自己的行为是为了故意暴露AWS安全防护的不足,他加入的恶意代码实际上并不会起作用。这名黑客的目标是促使亚马逊方面公开承认其在AI安全领域的不足,并将目前有关AI安全的措施从表演性改为实用性。ZDNet的资深撰稿人StevenVaughan-Nichols认为,这一事件反映了AWS管理其开源工作流程的方式。仅仅将代码库开放并不能保证安全,重要的是如何处理访问控制、代码审查和验证,恶意代码之所以能够进入官方发布版本,是因为验证流程未能检测到未经授权的拉取请求。在某种程度上来说,AmazonQ这次的翻车其实是亚马逊过于追求“速度”的必然结果。作为AWS在2023年年末re:Invent期间推出的AI编程助手,它是一款面向企业级用户的产品,但在与ChatGPT企业版、微软CopilotAI的竞争中长期处于落后状态。为了打响名气,AWS为AmazonQ选择了开源路线,但相比谷歌、微软等其他大厂,亚马逊在与开源社区合作方面的声誉一直不太好。GitHub的相关数据显示,在为开源项目贡献代码的人员中,亚马逊员工的数量要远远少于微软和谷歌。长期以来与开源社区保持距离的做法,可能就让他们对开源工作流程较为生疏,从而导致了开发者忙中出错。如果说AmazonQ遇到的漏洞是软件开发过程中常见的问题,那么发生在AI编程平台Replit上的事故,则可以被称为是“智械危机”了。就在不久前,SaaS商业开发公司SaaStr的创始人JasonLemkin声称,在他使用Replit的过程中连续遭遇了AI无视指令、伪造测试数据、误删生产数据库等一连串事故。其中最诡异的,莫过于在Lemkin明确指示Replit不要未经许可更改任何代码的前提下,AI仍然删除了他的数据库。当被Lemkin质问时,Replit也痛快地承认错误,并且顺势补刀,“数据库回滚功能不支持这类场景,所有版本都被销毁,无法恢复”。然而就在一天后,Lemkin发现Replit所谓的“无法回滚”是谎言,回滚功能可以恢复数据。即使SaaStr遇到的Replit突然“发疯”只是虚惊一场,AmazonQ的翻车只是常规事故,但也为AI编程工具的未来蒙上了一层阴影。因为AI编程工具是典型的toB类产品,它主要面向的是企业级用户、而非个人消费者。比如AWS在宣传AmazonQ时提及,其需要连接到公司的数据、信息和系统,才能处理基于底座AI模型的复杂任务。而Replit的核心优势则是全流程自动化,即编写代码、部署、测试、上线全部都是由AI完成。所以两者都不可避免地会直接出现在生产环节,因为想要借助AI实现效率提升,就必然要将AI直接连接到生产数据库。那么AI幻觉的存在导致AI编程工具输出的代码不稳定,就需要人类程序员来维护和检查。可是如果AI生成的内容需要人工再校核一遍,几乎就没有了意义,因为核校的不仅是数据和来源,还包括编程思路。如果AI生成代码的过程中不仅需要人工核校,还需要人工看顾,这又与“重复造轮子”有什么区别?更为致命的是从目前业界认可的AI伦理来看,AI显然是不能“背锅”的,毕竟它没法真的负责。如此一来,AI编程产品又暴露了一个无法回避的缺陷,那就是使用AI产品出现问题的责任划分模糊。“删库跑路”之所以能成为程序员圈的一个段子,是因为这一行为是直接违反了我国《刑法》的第286条破坏计算机信息系统罪。人类程序员假如真的在数据库中键入“rm-rf/”,等待他的就只有一曲《铁窗泪》。而Replit出现的删库问题,官方给出的解决方案只有一个全额退款。幸好SaaStr遇到的AI删库只是虚惊一场,退款算是勉强安抚了客户,万一真的出现了AI将用户数据库删除,事情就一发不可收拾了。要想让AI编程工具的受众安心,相关厂商最有效的解决方案莫过于“包赔”,可是以目前AI大模型表现出的稳定性,估计没有哪一家厂商敢于拍胸脯。其实这就是问题所在,AI编程工具如今还是一柄双刃剑,一边在客观上能提高开发人员的生产力和效率,但另一边也随时可能会成为定时炸弹。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
办公软件的尽头,「或许」是一个能听懂人话的 AI 助理
打工人有三座大山:汇报压力、无尽加班、精神内耗。每逢年中年终两个节点,堪称职场人的「渡劫时刻」。部门紧盯业绩数字,老板死抠成果细节,每场汇报都是一场硬仗,字字句句都得掂量利弊,没有得力的工具辅助,更是胜算渺茫。作为一名编辑,我深度体验过不少AI工具,可惜大多是雷声大,雨点小。直到最近在WAIC逛展期间,我在WPS展区体验到了最新发布的WPS灵犀原生Office办公智能体,才真正感受到AI办公的另一种体验。从功能覆盖面来看,它是个全能选手——能写文案、做PPT、读文档、查资料,还能生成图像、分析数据,几乎囊括了日常办公的所有场景,在我接触过的AI工具中,这是少数真正能够理解任务需求、「眼里有活」的AI助理。那些曾经一个人独自承受的工作压力,现在终于有了靠谱的「AI同事」帮忙分担。告别手搓文档的日子,这个AI助理真「眼里有活」就拿做PPT这事来说吧,比如要做李白《蜀道难》的教学课件——这种任务,相信很多老师都有类似体验:对着空白页面发呆半小时,然后陷入无尽的「搜索-复制-粘贴-排版」循环,一晚上下来,人困马乏。现在有了WPS灵犀,画风突变,点开「深度思考」、开启「联网搜索」,根据需要选择页数、面向人群,哐哐一顿输出,结构完整的大纲就出来了——诗歌创作背景、艺术赏析,课堂互动该有的环节一个不少。这也是边聊边改的魅力所在,每一次对话都能让这份PPT更贴近你的想法。有个小细节要注意,和市面上一些主打「一键生成PPT」的AI工具不同,WPS灵犀的路子是先出大纲,再出排版。而大纲的梳理与微调正是考验AI智商的时刻。我突发奇想,希望PPT大纲增加更多真题测试,用于课堂互动。换以前,这意味着我得手动新建页面、找真题素材、调整布局、配文字说明……光想想就累。但现在,我只需要在对话框里输入想法,WPS灵犀秒懂,立马调整大纲结构,还贴心地给出具体内容建议。偶尔AI理解偏了?没关系,再聊两句就纠正过来了,这种自然对话式的创作体验,源自于业界首创兼顾「文档创作」与「AI助理」的同屏协同形态,让做PPT像聊天一样轻松。海量模板的预览也在右侧一字排开,简约风、中国风、可爱卡通,各种风格任君挑选。毕竟,没有人比你更了解你的学生喜欢什么风格。3分钟不到,一份28页的精美课件就诞生了。从独自熬夜做PPT到和AI助理聊着天就把PPT做好了,这或许就是AI时代的创作新体验。即便随意切换模板,文字和图片依然不会乱成一锅粥,看似轻而易举,实则技术含量颇高。据了解,WPSAI采用「原子化操作」技术,能够智能识别修改边界,精准锁定内容范围。这背后体现的正是金山办公作为老牌办公软件厂商的多年积淀——需要对PPTX文件格式进行深度解析,每个元素怎么定位、怎么关联、怎么调用,都得摸得门清。正因如此,WPS灵犀在实际使用中才能解决那些「只有做过PPT才懂」的痛点。让我印象很深的是,在WAIC发布会上,PPT设计师冯注龙也分享了他使用WPS灵犀做PPT的经历。他提到,最痛苦的往往是最后调细节的时候——既要改内容,又要调布局,耗神又耗时,非常折磨。但在WPS灵犀的帮助下,原本最容易让人崩溃的「左右脑互搏」阶段得以有效化解,让他能够将更多精力集中在内容表达本身。除了PPT,WPS灵犀在写作上也相当能打。「帮我写一篇调研报告,关于请分析Labubu背后的营销策略」——要是以前,这种选题能让不少打工人掉一地头发。先得满世界找资料,各种平台挨个刷,然后分析用户画像、整理营销节点、对比竞品策略……等真正开始写的时候,已经晚上十点了,脑子一片浆糊。而现在输入我的想法,WPS灵犀就能调动联网搜索,把各类信息源整理成思路清晰的逻辑框架。最让我惊喜的是它的信息整合能力——不是简单的堆砌资料,而是真的在帮你梳理逻辑:从IP形象分析到粉丝社群运营,从限量营销到情绪价值,让人直呼内行。除了中文版本,我也想让它给我一份英文版本。它二话不说就开始输出,没有太多的机翻感,表达也相当地道。虽然最后还会习惯性润色一下,但这个底子已经相当不错了。正好赶上苹果入局可折叠屏手机的传闻满天飞,于是我让它写份「中国折叠屏手机市场商业计划书」,7160字的初稿很快就出来了。密密麻麻但逻辑清晰,从市场规模到商业模式,面面俱到。但我还是希望用户画像能再具体些,它又立马补充了一段相当细致的用户分层分析:年龄分布、职业、地域等等。整个过程的交互设计不是一锤子买卖,而是真的可以像跟同事讨论一样,一轮轮优化。最近广东基孔肯雅热蔓延速度很快,公司需要发布防蚊通知。有了WPS灵犀,同事也再也不用花个把小时上网搜目前情况最新数据、查防护指南,然后琢磨措辞。使用AI文书功能,选择「创建通知」,它基于联网搜索很快就调出了最新疫情数据、防护建议、注意事项,不到1分钟的时间,一份既专业又不失温度的通知就搞定了。开头是疫情概况,中间是具体防护措施,结尾是温暖的关怀提醒——逻辑清晰,语气得当,这些实实在在的细节,比任何宏大叙事都更有说服力。打开AI搜索的正确打开方式,让每份文档都能「随叫随到」如果说上面的功能是帮你生产内容,那下面这些功能就是帮你「消化知识」。说实话,这部分功能看着不起眼,但打工人都知道这里面的门道有多深。每个打工人的WPS账号里藏着海量的文件,但想要迅速地找到这些文档犹如大海捞针。而这个AI搜索引擎,确实get到了痛点:理解自然语义,定位关键信息。我们不用记住文件名,甚至不用记住准确的关键词,只需直白地输入问题,系统不仅能找到相关文档,还能直接定位到答案所在段落,实现精准跳转,极大提升检索效率。目前,网页端已上线这项功能,而桌面客户端也即将更新上线。此外,WPS灵犀内置的AI搜索功能不仅能搜本地文件,还能搜索网上的实时信息。它对信息时效性的把握相当精准——哪些是最新动态,哪些是背景资料,分得清清楚楚,能够有效避免你错过重要的行业大新闻。不只是个人用户受益。对企业来说,WPS新上线的知识库功能解决了一个老大难问题——知识管理。过去,企业的知识资产散落在各个部门的文件夹里,现在,这些碎片化的文档可以被统一收编,变成一个「活」的知识体系。此外,知识库的生态还足够开放,你既可以把自己的专业积累整理成库,贡献给行业;也可以在「知识广场」里订阅他人的智慧结晶,站在巨人的肩膀上。我自己就订阅了一个名为「全球AI前沿资讯」的知识库,每当需要了解行业动态,只需向AI提问,它就能迅速检索相关内容,精准定位到我需要的信息,如同一个永远在线、过目不忘的「第二大脑」。最后则是要重点说说这个AI聊文档功能,作为全网首个支持「聊文档」的随身语音助手,它的使用场景也特别真实。想象一下,地铁上人挤人看不了手机,健身房挥汗如雨腾不出手,现在我们直接对着手机说话就行,AI会像个私人助理一样,把文档里的内容、数据、条款统统给捋一遍。我平时喜欢把一些让人头大的报告扔给它,让它帮我实时消化文档内容。最人性化的是支持随时打断。听到一半想问问题?直接插话。表达不清楚想重新说?马上纠正,不用像传统语音助手那样,必须等它把一大段话说完。不得不说,WPS灵犀的这套组合拳打得挺聪明:创作类功能让你高效产出,获取类功能让你快速输入,形成了一个完整的办公闭环,整体水准不亚于一个称职的AI助理。最重要的是,它真的在帮我节省那些「毫无意义却又不得不做」的工作时间。这些省下来的时间,我可以用来思考更有价值的事情,或者……多摸会儿鱼。AI接管「必须做」,人类专注「值得做」提起「AI办公」,大家都不陌生。但用过的人都懂那种割裂感——明明装了一堆AI工具,真实的工作场景却让人抓狂:写份报告要在五六个界面间来回切换——先用A工具写初稿,导出来;再开B工具找配图,一张张下载;接着打开C工具调整排版;等发现要修改,整个流程重来一遍。原本一气呵成的创作过程,被切割成了无数个步骤。作为AI办公真正落地的第一批「原生智能体」,WPS灵犀这一次把一站式AI办公落到实处。它完全融入了WPS的原有生态。你的文档、表格、演示文稿,它都认识;你所沉淀下来的使用习惯、常用模板、历史记录,它也都记得。要知道,「私人助理」这个词,在过去属于极少数人。能配得上助理的,要么是老板,要么是高管。但技术的魅力就在于:它能把奢侈品变成日用品。就像当年只有富人才用得起的手机,现在连小学生都人手一部。WPS灵犀要做的,就是让每个认真工作的人,都能拥有自己的「AI助理」。斯坦福大学上个月发布的最新研究恰好印证了这种设计理念。研究发现,46.1%的职业任务中,工人们积极欢迎AI自动化——尤其是那些重复性、低价值的工作。更重要的是,45.2%的职业期望达到H3级别,也就是「人机平等伙伴关系」。这正是WPS灵犀的定位:不是H1的完全自动化,也不是H5的纯辅助工具,而是H3——一个真正的工作伙伴。1990年,乔布斯说过一句名言:「计算机是人类大脑的自行车。」他的意思是,人类赤脚跑步效率很低,但骑上自行车就能轻松超越其他物种。计算机就是这样的工具——放大我们的认知能力,让普通人也能做到以前做不到的事。战术上重视、战略上「藐视」工作。我现在的工作状态就是,老板给我下需求;我扭头当起WPS灵犀AI的甲方,给AI定策略,比如怎么做、重点在哪、如何呈现。AI则负责干体力活,比如写初稿、找资料、调格式。四舍五入,我们都有光明的未来。市面上很多AI产品都在贩卖焦虑:「AI要取代你了!再不学AI就要失业了!」搞得人心惶惶,好像明天就要卷铺盖走人。这种非黑即白的论调,要么是培训机构的营销套路,要么是对技术的认知偏差。用了WPS灵犀AI助理这么久,我最大的感触是:它不是要取代我,而是要解放我。解放什么?解放那些本不该占用人类智慧的重复劳动。想想看,我们每天有多少时间和精力消耗在整理会议纪要、翻译文档、做数据汇总这些琐事上?偏偏就是这些「高不成低不就」的事务,吃掉了我们大部分的工作时间。现在,这些活通通可以外包给WPS灵犀了。它做的是一件更长久、更现实的事情:帮你把注意力,从琐碎事务中抽离出来,重新交还给判断、创造与思考本身。说白了,当AI成为你的「体力担当」,你才能真正成为自己的「脑力担当」,这也是人类与AI协作的最佳平衡点。本文来源:博客园文章转载于其他网络,如有侵权请联系我们及时删除
-
25
07/19
什么是真的AI思维?
关于AI的很多理解现在基本是一团乱麻。有人说模式识别不是智能原生,就有人说模式识别是典型的AI算法,为什么不是智能原生。类似的还有关于无人公司,一人公司等等。这里面比较别致的一个点则是AI思维,和互联网思维很不一样,现在反倒是没什么人说了。那驾驭AI是不是需要一种新的思维方式,如果需要怎么去定义它?AI的应用层次我们总是可以像用更高级的Word那样去用各种大模型,这种情形下AI是一种更好的工具,在这个时候真的不用什么AI思维,经常用就好了。但AI显然不止是一种工具,多智能体系统可以把完整的业务封装到自己的体系里面来。这时候AI就不再是单纯的工具,而成为价值创造的主体。当然在工具这主体这两者之间还有不同的层次,大致是:越往后越需要一种新的思维方式。否则就像成吉思汗的打法驾驭不了轻步兵一样,越想进阶越可能伤害到自己,欲速则不达。智能优先在《无人公司》里面排第一的、要遵循的新原则是智能优先。注意不是老板、现状等等优先,而是智能优先。这其实和AI成为价值创造主体是一个意思,也是AI真正能发挥效用的前提。有的人可能会问,那如果做不到智能优先怎么办?那就把AI当工具用好了,不要让它当主体。否则即使短期跑起来多智能体系统,也有一定效果,它也会逐渐死去。因为AI工具的使用成本很低(应该比学Office还容易些),所以AI真正要产生效用,难点不在使用工具,而在于基于AI的基础特性来封装业务。上述三者和业务的结合最关键的正是AI思维。AI思维AI思维,是当我们将智能优先(AIFirst)原则应用于生产和服务的组织过程中,所必然采用的一种全新问题解决方法论。它不是指让个人学会写代码或使用AI工具,而是指在战略和执行层面,用一种内生于计算和模拟的模式来思考和行动。其核心要义可以概括为三点:虚拟先行、规模化试错、以及算力对冲。1.虚拟先行(Virtual-FirstSimulation):在行动前预演一切传统商业模式遵循“规划-执行-反馈”(PDCA)的线性流程,每一步都发生在物理世界,试错成本极高。而AI思维的第一原则是“虚拟先行”,即在投入真实资源之前,先在数字世界中创建一个与真实环境高度对应的“世界模型”(WorldModel),并在其中进行大规模的模拟。这个世界模型,正如近期学术界热议的,是真实世界环境的算法代理。它可收窄到只和自己的业务相关,核心目标也不是为了生成逼真的视频供人娱乐,而是为了模拟真实世界中所有可行动的可能性,以支持有目的的推理和行动”。这种能力,在心理学中被称为“假设性思维”(HypotheticalThinking),在实践中就是我们常说的“思想实验”(thoughtexperiments)。AI让这种垂直领域的思想实验成本变的极其低廉。无论是AlphaGo通过自我对弈探索出人类未曾想过的棋路,还是自动驾驶系统预测街道上所有车辆和行人的未来轨迹,其本质都是在成本极低的虚拟世界中,对无数种“可能性”进行推演,从而找到最优解。这正是AI思维赋予我们的第一个超能力:在行动之前,看见未来。2.规模化试错(Rapid,ScalableTrialandError):用并行计算探索最优路径人类的试错是串行的、昂贵的、且受限于个人精力与经验。而AI可以在世界模型中,以接近零的边际成本,进行百万次、千万次乃至亿万次的并行试错。一个营销团队可能需要一周时间来设计和评估三种广告方案。而一个AIAgent可以在一小时内,生成一千种文案和图片的组合,在虚拟的用户群体中测试点击率和转化率,并根据反馈实时迭代,最终筛选出最优的几个方案投入真实市场。这种规模化、自动化的试错循环,将创新的速度提升了数个量级。这相当于是改变了时间轴。这种能力的基础,正是虚拟先行能够生成无数条“假设性轨迹”(hypotheticaltrajectories),让智能体在其中通过强化学习或模仿学习等方式,充分利用所有“想象中的经验”(imaginedexperience)。特别需要一提的,如果试错成本足够低,本来就是在数字空间,那也可以越过虚拟先行。3.算力对冲(ComputationalHedging):用计算成本置换物理成本“虚拟先行”和“规模化试错”的经济学基础,是“算力对冲”。这意味着我们可以用相对廉价的计算资源(CPU/GPU时间、电力),去对冲和替代那些极其昂贵的物理世界资源(如时间、原材料、人力资本、市场机会成本)。在过去,验证一款新药需要长达数年的临床试验和数十亿美元的投入。如今,AI可以在分子级别的世界模型中,模拟药物与蛋白质的相互作用,提前筛选掉大量无效或有毒的候选方案,将物理试验的范围缩小到几个最有可能成功的选项上。在这里,数百万美元的算力成本,对冲的是数亿美元的研发失败风险。同理,一家公司在决定是否进入一个新市场时,不再需要花费数月进行昂贵的市场调研,而是可以在一个模拟了该市场消费者行为、竞争格局和社会文化的世界模型中,运营一个“虚拟分公司”,观察其数个季度的虚拟财报,再做出最终决策。如果上述几点一定要找个统一的例子的话,那可以回顾下移动互联网时代做App的故事:你可以精打细磨,选一个方向做一个App;也可以像某个公司直接就是App阵列,那个数好留那个。显然的后者的关键不在于思路,而在于试错成本和成功率。而AI思维无疑可以让后者的普适性极大提升,不再局限于做App。无人公司:AI思维的终极组织载体当上述三种AI思维方式被系统性地应用到一个商业组织中,其最终形态必然会演化为“无人公司”。“无人公司”并非指物理空间里空无一人,而是指其核心价值创造链条由AI智能体(AIAgent)而非人类员工来主导。人类的角色,从亲力亲为的执行者,转变为目标的设计者、规则的制定者和价值的赋予者。在这种组织中,AI思维不再是“锦上添花”的工具,而是其赖以生存的“操作系统”。其技术内核,可以借用最新论文:PAN(Physical,Agentic,andNested)的通用世界模型架构所描绘的蓝图。物理的(Physical):无人公司需要模拟真实世界的物理动态。例如,一个无人电商公司,其世界模型需要理解一个包裹从仓库到用户手中的完整物流过程。智能体的(Agentic):公司的核心是自主行动的智能体。无人公司必须支持多智能体行为的模拟,例如一个负责营销的Agent和一个负责客服的Agent如何协同工作。其未来的发展方向正是从单智能体扩展到对整个商业或社会集体行为的模拟。嵌套的(Nested):无人公司的世界模型是分层和嵌套的。它既能在高层次用类似LLM的结构进行战略规划和概念推理,也能在低层次用扩散模型等处理精细的物理或感官细节。当然如前所述,物理的和智能体的未必不重叠,但不管怎么样,总的来看,这注定是一套依赖倒置的系统:以虚驭实。举个最简单的例子,一个典型的无人公司工作流如下:人类创始人设定一个商业目标(如“本季度将某款产品的ROAS提升至2”)。这个目标被输入到公司的“大脑”。接着,多个AIAgent(市场分析Agent、广告创意Agent、预算分配Agent等)在这个模型沙盒中,进行大量模拟投放实验。它们会“预计算并缓存各种可能的世界状态、在这些状态下的可行行动及其模拟结果”。(不一定要模拟,也可以少量真实环境操作)最终,系统会选择一个预期回报最高的行动方案,并自动在真实世界的广告平台(如GoogleAds)上执行。从理论到现实:AI思维塑造的商业新浪潮尽管普遍的、完全成熟的“无人公司”仍是未来愿景,但AI思维的原则已经渗透到当下的商业热点中,并展现出巨大的威力。工业与制造业:数字孪生与虚拟工厂英伟达的Omniverse平台就是一个典型的例证。汽车制造商在建立一条新的生产线之前,会先在Omniverse中创建一个1:1的数字孪生工厂。工程师们可以在这个虚拟工厂中,模拟机器臂的每一个动作、测试生产线的节拍、优化物流路径,甚至模拟工人的操作安全。这正是“虚拟先行”和“算力对冲”思想的完美体现,用虚拟的调试替代了昂贵的物理安装和返工。内容与营销:AIGC与自动化增长传统的营销模式正在被颠覆。如今,一个“一人团队”可以利用GPT生成营销文案,用Midjourney和Sora生成广告图片和视频,再通过自动化工具进行全渠道分发和A/B测试。这背后就是AI思维在驱动:用极低的成本进行大规模的内容创意生成和效果测试,这在过去是需要一个庞大团队才能完成的工作。虽然当前专注视频生成的世界模型(如Sora)还不支持交互式推理,但它们已经展现了AI在创意生成方面的巨大潜力。科学与研发:AI驱动的假设与验证科学研究的本质就是“提出假设-进行实验-验证结论”的循环。AI正在以前所未有的方式加速这个循环。例如,论文中提到的AlphaGeometry2已经能够解决奥林匹克级别的几何难题,这本质上是在一个纯粹的数学世界模型中进行高效的“思想实验”。而像ReasonerAgent这样的系统,则可以在网络上自动进行文献调研和信息整合,辅助人类研究员更快地形成和验证假设。上面提到的Chai2也是其中很好的例子。未来属于掌握“模拟-行动”飞轮的企业我们正在从一个“经验驱动”的商业世界,迈向一个“模拟驱动”的商业世界。企业的核心竞争力,不再仅仅是拥有多少资本、多少人才,或积累了多少过去的成功经验。未来的核心竞争力将取决于:你的世界模型对真实世界的模拟保真度有多高?你的“模拟-行动”飞轮转得有多快?掌握了AI思维,就意味着掌握了用最低成本“预见未来”并“选择未来”的能力。以此为基础构建的“无人公司”,将具备传统组织无法比拟的敏捷性、效率和扩展性。它们能够更灵活地适应市场的风云变幻,更精准地捕捉用户的潜在需求,最终在竞争中获得结构性的优势。我们最终的目标是构建具备“人类智能所特有的适应性、韧性和自主性”的AI系统。这条道路漫长但充满机遇,而那些率先拥抱AI思维、并开始构建属于自己的“世界模型”和“无人公司”原型的企业与个人,无疑将成为定义下一个商业时代的先行者。当然,真动手前,需要首先缩减业务的切口,然后再去确定究竟需要多少层级的模拟。可以先观察学习,不要着急,比如可以先读《无人公司》...上面有想象成分,但显然的它会构建真正的智能文明,那会是一个很不一样的世界。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
07/19
“结果付费”能救企业软件?
AI时代的企业软件,终将走向角色化、结果导向和价值闭环。在中国企业软件圈,几乎每一个做AI的创始人都在思考一个问题:我的产品能不能只为“结果”收费?客户不再愿意为工具买单,他们要“提效”“增收”“降本”的明确回报,最好还能签个对赌协议。结果导向,似乎成了下一个时代的生死门槛。但问题是,结果到底怎么定义?能不能交付?客户认不认?这不是一句“按结果付费”就能解决的。同时,“结果付费”似乎也正成为企业软件领域最具争议和期待的新范式。在近日举办的2025AICloud100China榜单发布会上,崔牛会创始人&CEO崔强主持了一场圆桌对话,与群核科技联合创始人&CEO陈航、影刀RPA创始人&CEO金礼剑、硅基智能创始人&董事长&CEO司马华鹏、像素绽放PixelBoom(AiPPT.com)创始人&CEO赵充,深入探讨了“从软件订阅费到为GenAI结果付费,AI如何重塑收入模型?”。崔强在开场便抛出核心问题:99%的企业软件是否注定无法实现“按结果收费”?而那可能的1%,究竟长什么样?对AI企业来说,问题并非“能不能收费”,而是“为谁交付、交付什么、怎么收钱”。陈航认为,核心不是模式,而是客户是否真正认同你的产品价值——只要客户认可,总能找到合适的变现方式。他强调,AI落地场景的本质是效率和产出之间的匹配,“订阅”与“结果”其实只是两种手段。金礼剑则提出,AI的角色不再是简单的工具,而应成为能参与企业流程甚至组织决策的一环。但前提是你必须能定义清楚“结果”的边界,否则就难以形成合理的商业闭环。赵充则提供了另一种答案:在ToC与ToB之间,他选择了“创意表达”场景的切口,用混合付费模式探索广义的结果交付——哪怕只是节省了2小时做PPT的时间,也是一种可感知的结果。而司马华鹏,则更坚定地站在“结果付费”的一端。他将AI比作能对赌业绩的“高管”,强调只有深度参与产业、分担业务KPI,AI企业才能获得真正的高价值回报。他曾直言,“不能帮客户赚100万的AI,不算好AI。”五位嘉宾最终的讨论回到了最本质的问题上:什么是“好结果”?谁来判定?又该如何定价?面对这些问题,答案也许还未统一,但共识正在形成:AI时代的企业软件,终将走向角色化、结果导向和价值闭环。而“结果付费”,或许正是那扇通往新范式的大门。阅读目录1.不是所有软件都能“按结果收费”2.结果付费,会走向“深水区”吗?3.结果付费的底层挑战:谁来定义价值?4.“好结果”谁说了算?5.从个例到主流:结果付费的未来已来?以下是经牛透社编辑整理的对话内容:不是所有软件都能“按结果收费”崔强:今天我们讨论的话题是AI是否会重塑传统的软件订阅收入模型。昨天我在杭州和一群创业者聊到了类似的问题,我们有一个结论:大概99%的企业软件无法实现“结果付费”的交付模式,真正有可能做到的,可能只有1%。前面的分享有嘉宾提到,广告行业其实早期就是结果付费的代表。那么问题来了:是AI催生了结果付费的发展,还是结果付费本身就存在,只是AI加速了它的落地?另外,我也想请各位嘉宾分享:你们有没有尝试将订阅模式向结果付费做转化?如果尝试过,效果如何?陈航:我们做的是空间智能方向,其中最广为人知的产品是酷家乐,目前已经拓展到家居、连锁、电商等不同空间场景设计、工业制造、智能体训练等多个行业,服务对象也涵盖了各类客户。第一要素是用户价值:客户是否愿意使用你的产品,这才是核心。只有“1”成立了,也就是客户真正认可你,后面的商业模式都可以灵活适配。说到底,只要用户愿意买单,总有办法收费。AI出来之后,对于很多公司尤其是涉及3D训练、视频生成的,会面临供给和模型成本非常高的问题。如果你要做到足够好,还得付出昂贵的云服务成本。这种情况下,按“结果”计费是合理的,比如OpenAI本身也是这样。所以还是那句话,“1”更重要,模式是其次。我们服务了很多行业,收费方式其实取决于几个关键因素。前提是先假设你的边际成本不是特别高,或者可以视为常量:如果客户的用户群很大,比如面向大量销售人员,订阅模式更适合;如果客户的用户本身就不多,那就要看效果了,可能更适合按结果收费。AI的加入,核心还是看是否真正提升了效率。它同时也带来一个重要区分:你的产品是解决营销问题,还是解决成本问题?如果只是成本中心,那很难推动客户长期订阅,结果收费更有可能;如果你的产品是营销工具,能带来更多销售人员产出,甚至帮助企业扩大规模,那订阅模式就更容易成立。还有一个维度是用户属性:ToC的产品更容易推行结果付费,ToB的企业软件则需要更复杂的说服和逻辑自洽。所以总结来看,定价模式要考虑的三大因素是:1.服务对象人多还是人少?2.面向的是成本中心还是营销中心?3.是ToC还是ToB?金礼剑:我们做的影刀RPA产品,最初是通过逻辑规则实现自动化,替代一些重复性强的工作。AI出现之后,能力边界拓宽了,不仅能执行规则,还能处理部分决策类的任务。从客户角度看,他们始终是为“结果”买单的。因此在销售过程中,我们会深入企业的实际场景,了解员工日常的工作流程,并帮助客户识别:哪些环节是可以被影刀替代的,这本质上也是一种面向结果的销售逻辑。虽然现在AI具备了更强的能力,但目前我们在收费模式上仍以订阅制为主。整体逻辑是:围绕客户期待的结果,销售我们的产品,以此来实现收费。崔强:通过模型把这个问题泛化。赵充:我们整体在做AIOffice全家桶,核心产品是AiPPT.com,此外还有AI表(AiBiao.cn)、AI好记(AiHaoji.com)等多个产品。我们与上一代工具型产品最大的区别在于:我们直接交付结果,而不仅仅是提供工具。传统PPT工具是把工具交给用户,用户还得自己找配图、做内容;而我们直接帮用户把内容生成好、PPT做出来——交付的是完整成果。在变现模式上,我们采用混合收费:基础功能采用订阅制,一年内生成几千个PPT,价格是119元。但如果用户有更专业的需求,比如:接入特定的知识库(如,政企版本里接入主流价值观语料库以及增加内容审校)企业定制VI品牌配色、Logo、字体和企业定制模版协作类高级功能这些都需要单独付费。也就是说,我们以“交付结果”为核心,同时在不同使用场景下采用差异化、混合式的变现模式。司马华鹏:我们是硅基智能,做的是数字人产品。相比在座几位,我们产品单价可能是最贵的,AI直播产品平均每套在6~10万元。我非常看好按结果收费的模式,也做了很多实践,我认为这是真正突破AGI的必由之路。为什么我们能卖这么贵?因为确实有不少客户用我们工具创造了巨大的价值。我举个例子:我们今年为一家只有十几个人的直播公司提供了AI能力赋能,这个公司今年AI直播营收预计会达到1亿。我们也在尝试通过深度合作获得适当比例的收益分成。大家都知道罗永浩最近的AI直播,一场下来据说能卖5000多万,刚刚好他昨天也在论坛现场。但我的问题是:如果这真的是能带来上千万收益的工具,卖多少钱?收多少订阅费才合理?很明显参与分配更加合理。从去年开始,我们就在不断实践“按结果收费”的路径,尤其在直播场景已经成功落地。有个国外客户一年用AI卖出上亿美元GMV,我们能从中锁定比例进行分成,这就是结果付费的直接体现。此外,我们还用AI打造了多个网红IP,直接用这些IP的流量帮客户获取收入。4月开始,我自己也花了两个月时间,用我们的AI能力将我“变成”一个近千万粉丝的知识博主。现在账户一个品牌广告的报价是15~20万,今年预计广告收入能做到大几千万。这也是从卖工具订阅费用走到了卖结果,只是我是个特殊客户。2023年AI大模型热潮时我曾经提出一个观点:“不能帮客户赚100万的AI,不算好AI。”如果你的AI产品只敢卖19美元一个月,那它创造的价值应该不会比这个价格高很多。我们有些产品之所以敢卖几万、几十万美金,是因为我们看得清楚客户使用AI所带来的直接效益。真正能做到按结果收费的AI,才称得上“有价值的合作伙伴”。我们要在这条路上孤独的走下去。崔强:现在的AI产品,不只是交付工具,还需要提供咨询服务,甚至要贴身陪跑、亲自下场帮客户做事,这已经是在偏离“工具”本身的范畴了,不是吗?司马华鹏:纯AI工具创造的价值,随着竞争加剧,给客户报价格一定会越来越低,甚至走向免费和开源。就像最近很火的泡泡玛特创始人王宁讲的,凡是“有用”的东西最终都会卷进价格战,因为“有用”本身意味着高度可替代。相反,泡泡玛特做的是“无用之用”,比如:Labubu,虽然功能性不强,但带来了巨大的情绪价值,还有投资属性,随手转手可能就能赚几倍。所以回到AI竞争本质,我们要避免陷入价格战,而是要真正为客户创造价值,并通过结果分成获得收益。比如自动驾驶技术一旦成熟:你是像特斯拉一样自营出租车运营公司,还是把技术卖出去?道理显而易见。再比如,如果你开发了一个AI炒股软件,它能够炒股赚钱,你是直接卖软件,还是自己用它自营炒股赚钱?用最基本的经济学常识就能得到答案。与其吹嘘你的AI能提升多大的效率,不如亲自下场,用它帮客户赚钱,最后参与分润,深度参与行业变革。我们已经在短视频、直播、情感陪伴等领域实践了这一点,并建立了大量自营业务。预计未来我们自营收入将占到整体收入的2/3,而传统卖软件的收入占比会逐步下降。结果付费,会走向“深水区”吗?崔强:这次邀请四位嘉宾对话,我突然发现你们的产品都偏向工具层面,几乎没有涉及到管理层面。这也可能代表了一部分人的声音。“结果付费”的概念被广泛使用,但它到底意味着什么?按结果付费,最终可能意味着深入到产业链的各个环节,一旦这样,事情就变得复杂,难以保持工具本身那种快速复制的特性。我想问:未来真正的结果付费,是否会沿着这条深入产业链的方向发展?赵充:结果付费有很多层次,不一定非得深入客户生意帮他赚钱才算交付结果。比如我们客户的客单价也有很高的,有几十万的,针对的是政府办公提效这样的结果交付。显然,我们做不到帮你写一个融资用的商业计划书的PPT,然后从融资收益里分钱,这不现实。但我们能做到的是,把客户原本需要2小时完成的PPT工作缩短到2分钟,他愿意为这个结果付费。很多企业老板认可这一点,比如美的的老板明确表示不写PPT了,公司直接采购我们的产品。除了订阅收入,我们也提供个性化的PPT制作和定制服务。我们背后有庞大的创作者生态,中国大部分PPT领域专业创作者都在我们的社区,能接活帮客户交付成果,这也是一种结果交付的体现。崔强:昨天在“杭州论剑”讨论时,我很羡慕香港市场。比如做一个表单处理,就能带来15万港币的收入。很多工具类产品本身并不涉及复杂交互,更多时候是依靠生态合作伙伴帮客户实现交付,实际上这也是一种结果交付。无论是帮客户节省十倍的人力,还是直接带来收入增长,企业软件面临的最大难点是什么?金礼剑:数字化的本质,是为了应对人力资源中的各种不确定性。员工可能随时离职、需要不断培训,这些都是随机性因素。人类社会的发展,从采摘时代到农耕,再到如今的数字化,都是在追求更高的确定性和柔性制造能力。结果付费,本质上是我们对确定性的追求。过去客户购买软件时,会反复探讨软件能带来什么价值,内部做大量验证,最终才会坚定地走向结果付费的方向。但我们面临的最大难题是,影刀的应用场景非常多样,价值难以统一衡量。要做结果付费,比如“帮你操作一次点击收多少钱”,难度极大,因为每个岗位的价值不同。因此,我们目前只能采用订阅模式收费。但从用户需求和我们希望传递的价值来看,本质上还是按结果交付。崔强:你提到数字化是解决用户不确定性的焦虑。前几个月我们也讨论过,如果每个人都拿着“加特林”(强大工具),A公司和B公司都具备类似能力,在中国市场竞争激烈,快速卷起来,价格优势很快消失,那该怎么办?陈航:我们目前已经是全球最大的空间设计平台,同赛道里拥有最多的月活跃访客数。这并不影响不同企业的使用效果:A企业可能用得更好,B企业用得稍差。A企业借助新的AI技术,实现了更智能化和更高效的运营;B企业则通过我们的系统对接,实现了设计与生产的一体化。如果我们的软件过于单一,不能覆盖更多维度需求,那就是我们的短板。我们需要在这个泛场景下解决更多问题,这对底层引擎能力提出了更高要求。此外,如何做好系统集成和组织管理,也是一大挑战。核心还是要把自己的软件做到极致,确保产品和服务远超竞品。陈航:AI带来的变化可能会更快。我们需要更敏锐地捕捉新的技术,并将它们集成到自己的体系中。比如VAST的TripoAI,通过图片生成精细的3D模型,然后直接导入酷家乐平台,这样上下游协同效果很好。我们应该更好地整合新的AI能力。回顾十年前移动互联网爆发的时代,虽然当时涌现了很多创新企业,最终仍是几大巨头占据主导。那些在上一轮积累中成长起来的企业,应该在当前时代更积极地拥抱AI。毕竟我们的创始团队仍在,而不像美国一些公司创始人已经离开。结果付费的底层挑战:谁来定义价值?崔强:我想提一个问题。最近红杉的会议里,大量讨论结果付费这个话题。先不谈我们自己做的业务,面向整个企业软件的大市场,往结果付费方向走,最大的挑战是什么?司马华鹏:我们把AI看作一种“生命体”,一种硅基劳动力,按结果付费的逻辑,其实就像招聘一个员工,敢跟你对赌业绩,而不是对赌工作时间。目前,企业里大多数员工是对赌时间,也就是说,员工上足了班发多少钱;但少数优秀员工会说:“我今年帮你完成多少业务,拿多少提成。”一个好的AI应该更像这样的高管,而非普通员工。从生物进化角度看,如果一家公司有1000个AI为客户工作,我希望实行多劳多得的制度:表现好的AI获得更好的算法和算力支持,表现差的则减少资源。这样形成一种新的生产关系,通向AGI的生产关系。以我们AI直播为例,每个客户算力配置是平均的,但效果差异巨大:有人用同样资源赚千万甚至亿元,有人则效果平平。未来的AI不应是平均输出,而应基于个体成长和发展获得差异化资源。目前全球大模型发展受阻,我认为这不仅是AI作为劳动力的问题,更是AI面临落后生产关系引起的问题。回想1978年以前的中国,大锅饭导致不少农民再努力也吃不饱,直到家庭联产承包责任制释放了生产力。AI的发展同样需要突破落后的生产关系,避免“大锅饭”式的平均主义。举个例子,我们的AI直播客户,一个直播间我们给他每月投算力算法价值几百万,但能赚回几千万,使用的都是最先进的算法,甚至是定制算法,这推动了AI的“物种进化”。平均主义只会导致平庸主义。假如未来有一万辆自动驾驶汽车出去完全自主干活赚钱,如果收益无法让AI系统分享到,无法获得好处,这些算法就会趋向于让这些车停在原地。反之,如果AI能获得正反馈,得到投资和激励,最终AGI的发展才真正有望突破。如果未来硅谷出现一家能包写论文、甚至包拿诺贝尔奖的AI公司,这将对我们这些做工具的企业冲击巨大。现在两国在人工智能上竞争激烈,如果美国那边AI公司追求“造上帝”,我们只是专注于找到小场景落地,长期竞争之后,就会拉开巨大的差距,我们这些中国创业者有责任在战略上做好布局,为国争光。目前大模型市场仍在价格战的竞争阶段,这属于低级竞争。我们需要更多像王宁这样有深度思考的企业家,跳出低端竞争逻辑,开发出拥有核心技术且敢卖高价的AI产品,基于基于真实客户价值参与结果分成,这才是AGI发展的关键。如果只从劳动力层面看问题,目前的AI就像1978年以前的我国农民,努力也难有突破。只有赋予AI“多劳多得加鸡腿”的能力,真正提升其价值,才能迎来下一个AGI时代。崔强:我觉得最核心的挑战是环境和价值机制。有没有一个奖惩体系,能够保证AI能“包教包会”,还能“包分配”收益?听了大家的分享,我深有感触。赵充:这个问题的核心是如何定义不同工种的价值。以写PPT为例,制作一份PPT可能涉及两个工种:一个是博士水平的内容搜集和整理者,能够理解上下文并撰写文字内容;另一个是设计师,负责视觉和表达的美化。这两类工种月薪可能分别是2万和1万,加起来大约3万。不同场景下用户对价值的感受也不一样。比如我们有个场景,是帮大四学生把毕业论文做成PPT,用户愿意支付的价格大概是39元一个月。8月底,我们将推出基于Agent的PPT版本,能够模拟投资人或咨询分析师的水平,利用深度调研能力做呈现,这种服务的价值可能达到几百美元。本质上,我们是用Agent替代一个人甚至一个团队。如果能把各个工种的价值准确量化,收费模型就能据此做调整。归根结底,和司马兄的观点一样,本质就是“卖人”。司马华鹏:硅谷的Palantir这类公司已经号称利用AI帮助客户“打赢战争”,这是真正意义上的结果导向型企业。如果中国未来没有出现类似这样的公司,我们不仅在基础大模型上会落后,更会在商业落地能力上产生巨大差距。崔强:既然不同工种的定价差别很大,从几百到几万不等,那么你的产品会根据不同角色来定价吗?或者说,你会让不同角色分别购买不同的服务?赵充:是的。我们有专门的党政版本,针对公务员设计的App,外挂主流价值观语料库、红色模板和内容审校。这个版本的定价比标准版贵五倍,标准版是99元,党政版定价499元。医疗、金融、教育等行业也有不同的差异化定价,主要根据知识库内容的获取难度来区分。金礼剑:我认同赵充的观点,核心问题还是我们如何衡量和量化产出的结果。比如,一家公司的销售业绩可以直接按照结果付费,但市场部门的工作很难用明确的结果来衡量和付费。整体来看,企业输出的结果系统非常复杂,很难想象CRM或ERP这类系统能全面采用结果付费。结果付费更适合那些具体且可量化的场景。陈航:这是一个好时代,AI带来了很多新的变量。过去大家习惯按账号收费,变量少、可调参数少。现在用户价值确定的前提下,关键是找到客户愿意接受的收费方式,同时实现最大收益。刚才提到的党政模板和普通大学生AI等级的区别,说明了针对不同客群要做差异化匹配。背后涉及很多维度,关键是客户需求的多样性。我昨天听了很多分享,感觉大部分创业者还没深入行业逻辑。我们公司经历了十几年创业,打穿了大行业,也在特定行业做了探索,会有更多思考。新一代AI公司靠一个接口和API起量固然快,但后续必须了解客户是谁,行业背景,具体环节,内部组织结构等。中国企业常说按结果付费,但从老板层面到组织和HR体系,解决不同层级的认知差异很难。老板觉得好,具体到每个人如何购买、如何消耗token,还有很多问题需要解决。只有深入行业细分,才能带来真正的变革。正如那句话,只要你的价值够好,“买的不如卖的精”,总能找到解决办法。“好结果”谁说了算?崔强:我有一个一直困扰的问题:“好的结果”到底如何定义?最终评价权在客户手上,那我们怎么判断什么是“满意”的结果?另一个担忧是:客户可能永远不满足。在这种情况下,如何制定一个明确的付费标准?怎么交付一个客户认可、且我们也能接受的结果?司马华鹏:我们服务金融行业已有六七年。如果你把软件卖给银行,那挑战的就是它的IT部门,它是你的对手。我们每年对一家银行的销售额可达几千万,但一旦超过某个阈值,他们的研发团队就会建议自研代码替代对外采购。这就是中国SAAS普遍的困局。但如果你卖的是“结果”,情况就完全不同了。我们曾服务过一家银行,其年度营销费用达数百亿元。如果我们参与并拿到3%-5%的分成,那就是几十亿的收入规模。中国曾有不少互联网金融公司帮助银行发放贷款,利润极高。但后来政策限制,这种模式被叫停。现在我们更倾向于直接与业务部门合作,因为他们有KPI压力。例如,曾经一家银行计划发行千万张信用卡,每张卡的提成是100元以上,这就是一笔高达几十亿元的生意,而我们的AI完全有能力承接这类营销任务,从打电话到短视频到直播,其实AI的营销能力是很高的。否则,他们的信用卡发卡员还在拉着拉杆箱满街地推。跟美国相比,中国SaaS发展不起来,很大的原因是不敢包结果。但互金行业证明过,这条路是可行的。只要敢于承包营销和交付结果,就有可能出现“闷声发财”的AI公司,真正为大B端承担结果并获取高额分成。如果只卖工具,面对的是BAT这样的巨头,它们可能就在你刚发现PMF(产品市场契合)100米外等着你,很快利用流量和资本优势把你干掉。未来中国能出现百亿、千亿收入规模的AI公司,关键是要围绕“卖结果”来做。美国靠SaaS订阅做出了一批上亿美金的AI公司,而中国一定要靠结果付费模式来走出自己的AI路径。崔强:卖系统、卖工具,更多是面向专业用户,通常是IT部门;而卖结果,则是面向业务部门,比如营销、人力这些需要直接交付业绩或成果的团队。司马华鹏:对。卖给IT部门的时候你是它的对手。崔强:IT部门觉得你在动它的奶酪。司马华鹏:他们会觉得自己可以做。赵充:我们的商业模式与司马兄不同。我们服务的对象是全球超过10亿的白领、老师和学生,其中很多并不属于业务岗位,也没有盈利诉求。像HR、行政、教师和学生这类用户,即使使用我们的产品,也不涉及按“结果”付费。我们走的是广度路线,而司马兄更多是深入产业链、走深度路线。尽管如此,我们也可以衡量交付的“结果”。例如在做结构化PPT时,需要外挂各种行业知识库和企业知识库,还要有优质配图。我们集成了5亿张版权图片,提升图文并茂的表现力。此外,我们还有AI表产品,帮助用户进行可视化呈现。每个场景下的呈现需求也不一样,我们重点聚焦在这些“创意表达工具”的环节。比如“论文变PPT”这个场景,用户会要求封面带有自己学校的地标性建筑。北大的学生如果用了清华的模板,就不会满意。这种深度场景化的理解和交付,是我们产品思考的重点。崔强:只有AI能做到这一点。传统通过量化方式很难实现,因为AI能够识别你是谁,并据此精准匹配和生成你真正需要的内容。金礼剑:司马提到中国软件发展的难点,我认为很大程度上是因为在没有AI之前,软件的产出价值不高,客户很难直观感知到其价值。但现在有了AI,能直接呈现更高价值的结果,客户的感知更强,付费意愿也明显提升了。这是我在市场中切实感受到的变化。陈航:什么是“好的结果”?在我看来,客户认可的结果就是好结果。很多客户并不关心你交付了多少细节,只要产品“能用”“用得顺”,他们就愿意买单。关键在于怎么在用户和客户之间找到平衡点。我一直强调第一步要关注用户,尤其是在AI快速演进的时代。但发展到一定阶段后,就必须面对用户和客户之间存在的结构性矛盾。比如老板希望省钱、提高营销效果,但IT部门可能会说我们自己做更便宜。最终必须在这之间找到一个平衡点,形成一个适配的生态结构。我认为这需要一个过程,大多数人对AI的接受没那么快。AI带来的“造神”式能力,与我们中国讲求“共同富裕”的社会背景之间,也存在一定的张力。从个例到主流:结果付费的未来已来?崔强:大家用一句话来判断一下:未来3到5年,结果付费会不会从个例走向主流?未来的“结果”可能有很多种形式,不只是收入提升,还包括提效、降本等。你们怎么看?司马华鹏:我们一直强调AIGC的C就是Cash,要利用AI去“印钞”,如果你找不到AI直接变现的模式,我开个玩笑,那为什么不用你那些GPU去“挖矿”?挖矿对算力的利用效率最高,只是现在受到国家政策限制。我认为,接下来海外会出现一个非常大的产业方向:区块链+AIGC。这是硅基文明演进的重要路径。硅的三大转化方向就是AI,区块链和新能源,当能源、金融、算力与算法结合,硅基生命将形成一个自我进化的闭环系统。所以,我认为要“躲在结果里”迎接下一轮价格战。如今大模型推理成本每隔十几个月就会下降90%,今年可能还能收到几十美金的收入,明年就可能只有几美分。如果不能真正与产业结合、以结果为导向,那接下来的竞争会非常危险。更重要的是,很多真正闷声发财的公司已经悄然走到了这条路上,并不在台面上热烈讨论。赵充:从工具到助理是必然趋势,而且已经在发生。AI正在逐步取代人力,我们也在围绕这个方向做两方面努力:第一,直奔终极形态。我们希望从工具进化为懂用户的创意设计助理,比如你通过语音说“写一个绿色的PPT,多少页,受众是谁”,系统就能直接生成交付结果,这一幕很快就会变成现实。第二,打造AI全家桶。以AiPPT.com为核心,我们陆续加入了表格、PDF、文档、音视频转录等功能,真正让打工人“早用早下班,早用早升职,早用早加薪”。这是我们努力的方向。金礼剑:AI正在重塑所有软件,使软件能力越来越强大。与其纠结订阅还是结果付费,更重要的是如何将AI与工具深度结合,为客户创造更高价值。在价值形成后,合理的收费模式自然会水到渠成。陈航:AI能否更好地应用到各行各业,依赖于大家的共同努力——从底层算力,到应用接口,再到产品和解决方案,最终实现行业的深度落地。目前仍处于早期阶段,正因如此,才给所有人带来了更多机会。崔强:大家不必过于焦虑,红杉的讨论让很多人紧张,但这只是一个方向,值得关注,却不必恐慌。阿里的同学提到,未来会有多少角色,就会有多少个Agent。正如赵充所说,我们需要定义每个角色能带来什么结果,再为它赋能,创造价值。按照这个逻辑,未来所有软件形态都会围绕人和角色展开,为这些角色交付价值和结果。这样的软件才是真正好的软件,才能获得应有的收益和地位。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
07/19
AI,让产业互联网成真
产业互联网,正在真实地到来。这一点,我们可以从AI的风靡上,看出一丝端倪。从某种意义上来讲,AI,正在将「互联网」变成了一个「产业」,并且真正将产业互联网的重心转移到了「产业」,而非「互联网」的身上。以此为开端,真正意义上的产业互联网时代,正在来临。事实上,当产业互联网的概念被提出,很多人在看待它的时候,依然还在用互联网的眼光,并且将它看成是一个互联网的代名词。于是,对于很多的玩家们来讲,在将产业互联网落地的时候,总是会自觉不自觉地走入到互联网的怪圈之中。经历了大数据、云计算、区块链、元宇宙为代表的一系列的新概念的洗礼,人们对于产业互联网有了一个全新的认识——产业互联网,不再是互联网的代名词,而是有着自身内涵的全新的存在。产业互联网之所以能够拨开迷雾,回归正途,AI,在其中扮演着相当重要的作用。毫不夸张地说,正是源于AI的风行以及它所展现出来的对于不同行业、不同场景改造的逐步深入,才真正将产业互联网真切地带到了人们面前。因此,厘清AI与产业互联网之间的联系,对于如何落地互联网有着非常重要的现实意义。AI,真正让互联网从「第三方」蜕变为一种「产业」以往,无论是在PC互联网时代,还是在移动互联网时代,人们在看待互联网的时候,人们在看待互联网玩家们的时候,仅仅只是将它们看成是一个独立于产业之外的「第三方」。虽然这样一种看法让互联网的角色和定位更加清晰,但是,它同样让互联网走入到了脱离产业、脱离实体的怪圈之中。当流量的红利不再,特别是当互联网作为「第三方」的功能和作用逐渐失效,对于互联网的这样一种「第三方」的定位和认识,开始暴露出越来越多的问题。盲目地以效率为先,不断地以规模和效率为追求,持续地为了流量而竞争,开始将互联网面临着越来越多的困境与难题。可以确认的是,仅仅只是将互联网看成是「第三方」,而不把它看成是一个可以与产业建立联系的「产业」,开始遭遇到越来越多的困境与难题。于是,人们开始寻找互联网蜕变成为「产业」的方式和方法。在这其中,我们看到了大数据的崛起,我们看到了区块链的被重视,我们看到了元宇宙的出现。然而,直到AI出现,并且直到AI开始与诸多的行业与场景产生联系,互联网玩家们才真正找到了蜕变成为一种新型「产业」的正确的方式与方法。通过将互联网时代积累下来的数据资源、场景资源结合在一起,互联网玩家们成为了AI的孵化器,并且真正让AI与它们相关联的产业结合在了一起。当下,我们看到的那么多的AI玩家,特别是处于头部的AI玩家们,几乎都有着浓厚的互联网背景。百度如此,阿里如此,腾讯同样如此。当AI让互联网开始蜕变成为一种「产业」的时候,所谓的产业互联网,才不再是一个非此即彼的存在,而是变成了一个「产业」和「互联网」实现了完美统一的存在。以此为开端,真正意义上的产业互联网,开始真正来临。AI,真正让互联网找到了新增量当AI开始风靡之前,玩家们同样进行过许许多多的探索与尝试。期间,我们看到了新零售的出现,我们看到了社交电商的衍生。然而,通过发展,我们可以看出,这些看似新潮的新模式,并未给互联网行业的发展带来新的增量,玩家们的发展依然还在延续以往的发展模式。可见,仅仅只是用新的概念延续互联网模式,而无法给互联网带来新的增量,纵然是再新潮的概念,同样将会陷入到怪圈之中。同时,产业互联网之所以与消费互联网之间有如此巨大的区别,产业互联网之所以会受到如此的追捧,另外一个很重要的原因在于,产业互联网所释放出来的发展红利,产业互联网所释放出来的增量要比消费互联网要大得多。很显然,如果仅仅只是用无法提供新增量的方式来落地和实践产业互联网,难以让产业互联网的发展带入到新的发展阶段。当AI开始出现,特别是当AI开始由内而外地给互联网以及与互联网相关联的行业带来新的嬗变,我们看到的是,新的增量的释放。同消费互联网时代仅仅只是通过去中间化来提升效率不同,建构于AI之上的产业互联网,更多地通过对于产业的深度而全面的改造来实现对于新的增量的寻找。通过这样一种方式,包含互联网的产业开始有了一个全新的改变,也就是我们经常提及的供给侧实现了转型和升级。当这一现象开始出现,供求两端的平衡,不再是依靠传统互联网式的撮合和中介来实现的,而是开始依靠一种全新的商业模式来达成。可见,AI,真正让互联网找到了传统商业模式之外的新增量,并且这样一种新增量所释放出来的潜能要比以往的商业模式更加具有想象力。AI,真正让虚拟经济与实体经济实现了完美融合产业互联网,究竟是什么?或许,虚拟经济与实体经济的完美融合,才是最显著的特征。当产业互联网的概念被提出,玩家们对于产业互联网有所一定的探索和实践。无论是对于产业端的深度赋能,还是对于线上线下融合的探索,其实都是这样一种探索的最为真切的体现。然而,虽然互联网玩家们进行过如此多的探索与实践,但是,玩家们始终都跳不出以往的模式和方法,归根到底,互联网技术本身的特质决定了其难以找到虚拟经济与实体经济实现完美融合的正确的方式和方法。因此,欲要让虚拟经济与实体经济实现完美融合,甚至让虚拟经济和实体经济在融合之后衍生出新产业,直接决定着这样一场进化的成败,直接决定着产业互联网的真正实现。AI开始成熟与落地,特别是当AI实现了虚拟经济与实体经济的完美融合,新的产业开始衍生和出现。我们现在所看到的无人驾驶、无人配送、数字人直播,其实都是虚实结合的存在,都是一个全新的产业体。当新的产业体开始出现,特别是当新的产业体开始成为产业互联网的内在填充,产业互联网不再是一个依然以虚拟经济体为主导的存在,而是以虚实融合体为主导的存在,这个时候,产业互联网才能够真正实现。结语当AI开始落地和成熟,我们看到的是,以往人们所期望的产业互联网,正在AI的驱动下从梦想变成现实。从某种意义上来讲,AI,让产业互联网成真。厘清AI与产业互联网的内在逻辑,并且找到AI落地与实践产业互联网的正确方式和方法,才能真正将产业互联网的发展真正带入到一个全新的发展阶段。如果我们将互联网技术看出是消费互联网时代的基础设施的话,那么,AI技术,则是产业互联网时代的基础设施。当AI开始成熟,产业互联网的时代,便开始随之而来。本文来源:R艾瑞网文章转载于其他网络,如有侵权请联系我们及时删除
-
25
07/19
生成式AI在职场中的应用
在数字化浪潮的推动下,生成式人工智能(GAI)正以惊人的速度渗透至职场各个领域。从文案创作到数据分析,从设计开发到客户服务,这项技术以其强大的内容生成能力与智能化决策支持,重新定义了职场人的工作方式。本文将系统梳理生成式AI在职场中的核心应用场景,揭示其如何成为提升效率、激发创新的关键工具。一、内容创作:从“手工生产”到“智能协同”生成式AI在内容创作领域的突破,彻底改变了传统文案工作的模式。基于自然语言处理(NLP)技术,AI可快速理解用户需求,生成结构完整、逻辑清晰的文本内容。无论是市场营销中的广告文案、商业计划书的框架搭建,还是日常工作中跨部门沟通的邮件草拟,AI均能提供高质量的初稿支持。更重要的是,它并非替代人类创作,而是通过“人机协同”模式,让职场人将精力聚焦于创意构思与策略优化,将重复性写作工作交由AI完成,实现效率与质量的双重提升。二、设计开发:从“灵感匮乏”到“创意爆发”在设计领域,生成式AI通过多模态学习技术,突破了传统设计工具的局限性。设计师只需输入关键词或草图,AI即可生成多种风格的图像、视频甚至3D模型,为创意提供灵感源泉。这种能力在广告设计、媒体内容制作中尤为突出——从海报视觉元素的快速迭代,到短视频分镜脚本的智能生成,AI大幅缩短了设计周期。同时,AI还能根据用户反馈实时调整输出,使设计流程从“单向输出”转变为“动态优化”,助力设计师探索更多可能性。三、数据分析:从“数据海洋”到“决策洞察”生成式AI与机器学习的深度融合,使其在数据分析领域展现出独特优势。通过处理结构化与非结构化数据,AI可自动识别模式、预测趋势,并生成可视化报告。例如,在金融领域,AI可分析市场数据生成投资策略建议;在零售行业,AI能通过消费者行为数据预测热销商品。这种能力不仅提升了数据分析的效率,更通过“数据叙事”功能,将复杂的数据转化为直观的决策依据,帮助企业快速响应市场变化。四、客户服务:从“人工响应”到“智能交互”生成式AI在客户服务中的应用,推动了“全天候、高精度”服务模式的普及。基于预训练的聊天机器人,可理解用户自然语言提问,并提供实时解答。无论是处理常见问题(如订单查询、产品咨询),还是应对复杂需求(如技术故障排查、个性化方案推荐),AI均能保持稳定的响应质量。更重要的是,通过持续学习用户交互数据,AI能不断优化回答策略,逐步从“规则驱动”升级为“理解驱动”,显著提升客户满意度。五、个性化推荐:从“大众营销”到“精准触达”生成式AI通过分析用户行为数据与偏好,可构建精细化的用户画像,并生成个性化推荐内容。在电商场景中,AI能根据用户浏览历史推荐商品;在流媒体平台,AI可基于观看习惯定制内容列表。这种“千人千面”的推荐模式,不仅提升了用户体验,更通过提高转化率与用户粘性,为企业创造显著商业价值。六、垂直领域深化:从“通用工具”到“行业专家”生成式AI的技术特性,使其在法律、医疗、教育等垂直领域展现出强大适应性。在法律领域,AI可快速生成标准化合同模板,辅助律师进行案例检索与法律文书撰写;在医疗领域,AI能通过分析病历数据辅助诊断,或生成个性化治疗建议;在教育领域,AI可根据学生学习进度定制学习计划,提供智能辅导。这些应用表明,生成式AI正在从“通用辅助工具”进化为“行业专属专家”。结语:生成式AI——职场竞争力的“新标配”生成式AI的职场应用,本质上是技术对人类生产力的解放与扩展。它不仅提升了单一任务的处理效率,更通过重构工作流程、激发创新潜力,推动职场人从“执行者”向“决策者”转型。对于企业而言,掌握生成式AI的应用能力已成为数字化转型的关键;对于个人而言,系统学习AI技术原理与应用方法(如通过培生GAI认证),则是提升职场竞争力、适应未来工作模式的必然选择。可以预见,生成式AI将不再是“可选技能”,而是职场人必备的“核心能力”。*关于Certiport:Certiport是PearsonVUE旗下业务,是认证考试开发、交付和项目管理服务的提供商,通过全球13,000多个Certiport授权考试中心组成的庞大网络提供服务。Certiport管理着一系列认证项目,包括:微软Office专家国际认证、微软基础知识国际认证、微软教育工作者国际认证、Adobe?专家认证、Intuit认证、思科支持技术员(CCST)认证、Meta数字营销助理认证、Swift应用程序开发认证、PMI项目管理认证、Unity认证、专业沟通能力认证、IC3数字素养认证以及创业和企业管理认证。Certiport每年在全球148个国家/地区以29种语言为中学、大学、雇员和企业提供超过300万次可信的考试服务。本文来源:R艾瑞网文章转载于其他网络,如有侵权请联系我们及时删除
-
25
07/05
AI:加速能力退化的元凶
过度依赖大语言模型(LLM)正在加速软件工程师的能力退化。LLM永远无法替代人类的批判性思维。编者按:当业界沉迷于用AI提效的幻象,本文以程序理论与熵增原理揭穿残酷真相:过度依赖LLM正加速工程师批判性思维退化,而重塑技术敬畏已成生存必修课。越依赖LLM,智商越低自2022年末AI浪潮席卷公众认知以来,相关讨论已汗牛充栋。作为从业二十年的软件工程师,我想谈谈观察到的两种危险认知。▍“LLM是我的好搭档”不会真的有人把程序当成自己的伙伴,这话的潜台词其实是:LLM能给用户带来巨大收益。把LLM当盟友的工程师,往往被迫或主动追求速度至上——对他们而言,交付速度比思考深度更重要。虽然LLM确实能快速生成代码,但也会伴随着各种长尾风险:使用LLM的风险·输出风险:LLM可能给出明显错误的代码(比如无法编译的),更危险的是生成看似正确实则暗藏逻辑漏洞的代码。如果使用者缺乏判断能力(比如让项目经理生成源代码),风险将陡增。·输入风险:LLM不会质疑存在诱导性、前提错误或语境缺失的指令。例如工程师要求“用C#实现线程安全的列表”,得到200行完美代码——但这仍是错误答案,正确问题应是“如何让这段代码线程安全”,正确答案只用加一行代码"System.Collections.Concurrent"。LLM无法识别这种XY问题,因为你没要求它这么做。·未来效率:这是升级版“技术债”问题。AI能以惊人速度摧毁代码质量。见过囤积癖患者的屋子吗?外表光鲜,内里却污秽不堪。开发者正发现:缺乏严格约束时,LLM生成的代码正是如此。·能力退化:当个人或组织将思考外包给LLM,人才将迎来灭绝:资深工程师失去在攻坚中成长的机会,现有能力逐渐萎缩:“微软研究发现:AI带来的自信常以牺牲批判性思维为代价”“在这个推崇‘条件反射式AI使用’的世界,我主张保留编程的手艺本质”“LLM直接给我成品结论,却剥夺了思维成长的过程”初级工程师永远无法建立核心能力,更遑论培养下一代。·创造剥夺:众多开发者反馈AI夺走了心流状态和创造乐趣。▍“我会变成多余的吗”答案是不会。当然,有些举措能让你在LLM时代更具不可替代性,这将另文探讨。LLM永远无法具备两种编程核心能力:程序理论(programtheory)与程序熵(programentropy)。程序理论......严格来说,编程应该看作是一种程序员对手头事务形成或达成某种洞察、理论的活动——彼得·诺尔《编程即理论构建》(1985)这位计算科学泰斗指出:程序不是源代码,而是大家分享的心智建构:一种理论或设计。工程师从中衍生出代码,但真正有价值的产物是设计而非代码。理解程序理论与代码文本差异的实验:让水平相当的两组工程师隔离工作。A组开发终端象棋程序,B组等待。完成后将A组代码交给B组,要求两队同时添加人机对战功能。问:哪队能交出更优方案?答:A组。因为他们刚构建完程序心智模型,B组则从零开始。诺尔认为,程序终需维护改造。如果只是掌握代码而无设计洞察,改造成本将倍增。回想我们初次接触大型代码库时,效率总是从零开始爬升——这正是心智模型加载的过程。LLM与程序理论现有LLM受限于上下文窗口,永远无法掌握程序理论。唯有人类能构建并保有这种心智模型。程序熵复杂性是编程一个基本的反作用力。......程序开发是熵减过程......维护则是熵增过程,再精妙的维护也只能延缓系统沦为不可修复废品的进程——弗雷德·布鲁克斯《人月神话》(1975)这位计算机先驱断言:开始开发程序后,任何修改都必然增加复杂度。但符合设计理念的改动能延缓熵增。LLM与程序熵LLM本质是token预测器,仅工作在文本层面。它无法进行概念性思考——不会推理理念、图表或需求文档。所有用过LLM修改过大段代码的人都目睹过:它常进行诡异的多余改动,对话越久偏离越远。诸位见过几次LLM真正降低来代码复杂度的?唯有人类能对抗熵增。▍结语两位先驱对软件设计与复杂性的洞见,恰是这个时代的解药。若你期待AI助推职业生涯,警惕它可能适得其反——LLM正在加速能力退化。若你已是资深工程师却担忧失业,请建立更辩证的认知:LLM永远无法取代人类工程智慧。企业追逐AI旨在通过工程标准化降本,但正如离岸开发的经验所示,LLM不仅难达预期更衍生新风险。眼下滥用AI的企业必将承受长尾成本,要么转型要么消亡。人类工程师的长期价值从未改变——世界始终愿为技术实力与深度思考买单。AI不会消失,但请把它当成工具,而不是拐杖。持续深耕2019年就被珍视的那些工程核心能力吧。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
07/05
提效10倍,AI颠覆软件开发,这五条经验是关键分水岭
AI正在改变软件开发的底层范式。我们正处在一个技术驱动的悖论中:AI工具正在以前所未有的速度加速开发流程,却也暴露出巨大的能力差距——相同的工具,不同的团队,产出的差异可以是十倍甚至百倍。这意味着,所谓“AI原生开发”,远不是把工具接入流程这么简单,而是一次对整个研发体系的重构:从原型、协作到部署,每一步都要为AI的介入重新设计。在这份关于“AI驱动的全栈研发方法论”中,我们试图从源头解答一个问题:真正懂得与AI协作的开发者,到底做对了什么?不久前,Bessemer(美国SaaS领域最专业的投资机构之一)对话了PerceptronAI的创始设计师CedricIth——Perceptron是一家致力于构建AI原生产品的前沿公司,专注于将生成式模型融入研发工具链,打造具备自动优化与自我学习能力的开发平台。在Cedric看来,AI并不是插入在流程某一节点的工具,而是应嵌入整个设计系统的“语义层”,在编码、交互、调试、部署的每一个环节中,主动生成、判断和迭代。本文将分享Cedric总结的五条关键经验,带你理解AI在现代研发流程中真正应扮演的角色:从氛围编码(vibecoding)到品味引导,从自然语言原型到全栈交付。这是一个关于人与AI如何共同构建产品的时代信号。01品味是护城河,设计思维是新的超能力在AI几秒就能写出代码的时代,差异化已经不在于“谁能构建”,而在于“谁知道该构建什么”。Cedric曾提出一个判断:我们正进入一个软件资源极度丰富、创造门槛极低的世界。这意味着,技术本身不再构成护城河,真正的竞争力转向了设计思维和产品直觉。当所有人都能用自然语言生成功能原型时,谁能提出精准的问题定义、优雅的解决路径和令人愉悦的用户体验,谁就能占据优势。执行速度、产品感知力、UI/UX细节,正在成为AI时代的新壁垒。与此同时,AI也在重新定义设计流程。新的生成算法让设计师可以用前所未有的速度探索大量设计概念,这不只是为了“更快做出图”,而是让团队可以在用户定义的参数下,自动生成、评估并迭代出更符合人性的解决方案。所以,这不再是一个“会不会写代码”的问题,而是一个“能不能提出好问题,并迅速做出打动人心的产品”的问题。最终的赢家,不是技术最强的团队,而是那些能把AI的执行力与人的品味、判断力结合得最自然的团队。他们才是新一代的“产品创造者”。02自然语言,是一种新的设计界面在Cedric的工作流中,我们观察到一个非常深刻的转变:他已经不再依赖传统设计工具,而是将自然语言作为主要的设计媒介。他说:“关键技能已经不再是写代码,而是如何清晰、准确地表达你的想法和变化,让AI明白你在说什么。”这种变化,正在重新定义设计师的核心能力。设计师正在从“画图的人”转向“用语言驱动产品结构的人”。新兴的关键技能,被Cedric称为“设计词汇”——这不是指能否写代码,而是能否用准确的语言描述现代框架、CSS属性、交互逻辑。例如,他会用“4像素圆角”、“0.2不透明度”、“悬停态”这样的术语与v0交互,将一个带有坐标跟踪的边界框交互,在几分钟内通过提示生成原型,而过去这可能需要工程师数天时间才能完成。这背后隐藏着一种新的提示能力:明晰、一致、共享语言。明晰:把复杂的请求拆解为简单的、可执行的语言。例如,不是“在图像上加个标签”,而是“为图像上的每个边界框,在左上角添加一个粗体白色文本,显示框编号(如Box1、Box2)”。一致性:一旦你把某个功能命名为“分段模式”,就始终如一地使用这个称呼,而不是在后续提示中用其他词替代。共享语言:就像传统团队用标准术语协作一样,现在你也需要“教会AI”你的词汇表。Cedric会在设计初期就引入关键术语,并反复使用,让AI也能“和你讲同一种语言”。最适应这一变化的设计师,往往有两点共性:强烈的学习能力和工具切换能力。他们能在Figma、V0、Cursor等工具之间无缝流转,不断适应新接口,快速掌握AI能力,并用“语言”而非“代码”去构建产品逻辑。正如Cedric所展现的那样:未来的设计师,未必需要成为工程师,但一定要成为高语言分辨率的系统构建者。03“设计工程师”正在崛起我们正见证设计与工程之间那条传统分界线正在迅速消解。Cedric的工作流程就是一个典型案例:从Figma起步,在V0中完成可交互原型,最后直接用Cursor在代码库中进行最终调整。这不仅提升了效率,更重新定义了产品的制造方式:▍闭环所有权正在成为新标准设计师不再只是视觉方案的提供者,而是能在整个技术堆栈中直接操作的产品推动者。正如Cedric所说:“我可以直接贡献代码,并将PR提交到代码库中。这是一个闭环系统,作为设计师我从未拥有过这样的控制力。”设计的意图不再依赖工程师“还原”,而是由设计师自己贯通全流程交付。▍静态模型正在过时过去的线性交接模式——设计师交图,工程师翻译——正在被更具协作性的工作方式取代。现在的设计交付不再是静态图片,而是包含交互逻辑的高保真原型,甚至是具备集成能力的代码框架。工程师面对的不再是一堆注释图,而是几乎可直接上线的可用组件。▍设计与开发的迭代速度被大幅压缩以往样式修改、功能调整动辄几天,如今设计师可在代码层直接处理,不再需要一轮轮截图、注释、沟通。设计评审与功能实现之间的间隔从天缩短为小时,推动产品快速打磨和上线。这种范式转变正深刻影响团队结构和招聘逻辑。最高效的团队往往具备跨学科能力——既能写代码,又懂产品和体验。那些能够在设计与工程之间流畅切换、构建原型、推动落地的人才,将在AI驱动的新生产范式中脱颖而出。未来属于那些既有技术手感,又有品味判断的混合型团队。04四种人工智能原生设计原则随着人工智能应用加速落地,围绕AI产品的设计原则也在逐步成型。Cedric总结了一些区别于传统软件设计的新关键点,正在被越来越多优秀团队采纳。以下是其中最值得关注的四条原则:▍减少认知负荷,让AI主动理解用户最好的AI体验,应该像“与一个聪明的人自然对话”。这意味着,用户不需要反复点击、设置参数、思考指令结构,而是能将注意力集中在表达意图上,让AI自动处理上下文与细节。例如RecallAI和Granola就很好地体现了这一点,它们能在无需用户预设的情况下,从对话中自动提取关键信息与洞察,真正实现“无感操作”。▍接受非确定性,并优雅地处理“脱轨”与传统软件不同,AI系统的输出往往是开放性的、多路径的,可能出现不稳定或偏离意图的情况。好的设计不是避免这一特性,而是提供适当的“监督轨道”。例如OpenAI通过Temporal支持长流程任务的中断重试,Cursor和V0则引入“执行树”和“回退检查点”,允许用户在AI偏离预期时快速回溯并切换路径,避免“眼睁睁看着它跑错而无能为力”的挫败感。▍让AI显示它在“想什么”虽然底层模型可能是黑盒,但交互逻辑和推理过程应尽可能透明。Perplexity展示了极佳的引用机制,让用户知道信息从何而来;Deepseek展示了多步骤推理路径;Anthropic则在“思路链”可视化上持续推进。这些做法不仅提升用户信任,也帮助他们更好地校准AI输出,从而实现“可控性”与“可解释性”的结合。▍设计是为了监督,而不是操作随着AI越来越具备代理性,用户将从“执行者”转变为“指挥者”。这要求设计围绕“协调多个智能体”展开,而不是传统的按钮加操作流。早期的探索已经出现,比如Perplexity的“后台研究通知”、Codex的多线程进度条提示、Comet的生成式表单交互等。这些都在构建一种新的交互范式:用户不再逐步驱动,而是高层指令+智能反馈的闭环。这些原则仍在演进,但有一点可以肯定:今天就开始围绕这些维度构建产品的团队,将率先打造出更自然、更值得信赖的AI体验。未来的AI产品,不是让人“会用”,而是让人“想用”。05在崛起在AI时代,速度就是一切在AI工具日新月异的时代,变化的速度令人惊叹。正如Cedric所说:“也许在我们讨论结束时,v0就已经不是最好的工具了。”这并不是一句玩笑,而是对当前产品环境最真实的写照。快速变动的生态,正在迫使企业从“构建完美产品”转向“构建快速学习型组织”。从我们与Cedric的对话中,可以提炼出几条在这种环境中脱颖而出的组织特征:允许团队主动尝试新工具,不以技术稳定性作为唯一评估标准;优先推进“先交付再优化”,把学习和反馈速度放在第一位;构建模块化、API驱动的架构,使系统具备快速整合能力;强调“学习速度”与“专业经验”同等重要,鼓励主动适应变化。对于大型企业而言,这种转变尤其重要。Cedric的建议很实际:即使你无法直接影响生产系统,也可以用AI工具快速制作高保真的交互原型,从而赢得组织内部的认可。设计不再只是“设计”,而是推动组织变革的试验田。这种加速是复合性的——设计师能够更快地制作原型,工程师能更快地实现功能,团队能更快地获取用户反馈。整个产品开发周期被压缩,创新密度变得前所未有地高。Cedric的AI设计堆栈,正是这一趋势的缩影:Figma:依然是视觉设计的“真相来源”,用于布局、结构和初步框架,但在处理动态交互、状态管理等方面存在限制。v0/Lovable/Bolt.new:承接Figma输出,支持自然语言定义动态行为。比如通过对话提示即可绘制坐标边界框,实现实时交互逻辑。Cursor/Windsurf:直接在代码层精调样式与交互,比如“设置角半径为16px”、“依次编号每个框”,并生成PR提交给工程团队。Shadcn/Tailwind/UntitledUI/HeroUI等组件库:为AI提供标准组件语义,极大降低幻觉风险。例如,用户可以直接说“使用Shadcn的toast组件”或“应用Tailwind不透明度20”,从而实现一致、可控的代码生成。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
