
新闻资讯
News and information
-
25
08/29
颠覆互联网的下一波浪潮:Agentic Web来了
一个由AI智能体组成的、目标导向型的互联网系统。你不会再「上网」,而是说出一个目标,然后由一群AI自动完成。——未来互联网使用场景设想过去三十年,互联网经历了从静态网页到智能推荐的深刻演变。如今,我们正站在互联网的另一个重大转折点上。这一转折,来自一种全新的范式设想——AgenticWeb,一个由AI智能体组成的、目标导向型的互联网系统。在这个新框架中,用户不再手动浏览网页、点击按钮,而是通过自然语言向智能体发出一个目标,AI会自主规划、搜索、调用服务、协调其他智能体,最终完成复杂任务。这不是幻想,而是由UCBerkeley、UCL、上海交通大学、上海创智学院等机构的研究者联合提出,并在论文中系统论述的Web重构方案。这是一次对互联网底层逻辑的全面「改写提案」:人类不再是唯一的网络使用者,智能体将成为Web的主要操作者。任务由人类发起,但由AI执行。在这个新架构中,网页、服务、平台不再是面向人的交互界面,而是为智能体而生的协作接口。本文将从技术架构、理论模型、系统协议、典型应用与挑战五个方面,深度解析这场关于「智能体驱动互联网」的范式革命。一、三次范式跃迁:Web正在走向「自动化」互联网的演化是一部「人–信息」关系的技术史。过去三十年,Web主要经历了三次范式转变:PCWeb:关键词驱动的「目录网络」在PCWeb时代,网页以静态内容为主,信息由机构集中生成,并通过人工分类和超链接构成一个「数字黄页」。用户必须主动发起搜索、点击浏览,任务执行线性、明确但效率不高。商业模式以关键词搜索广告为主,代表性系统如GoogleAdWords,依赖点击率(CTR)和每次点击成本(CPC)来衡量效果,形成了基于「人类意图」的搜索营销生态。MobileWeb:推荐驱动的「内容爆炸」伴随社交平台、短视频、电商UGC的激增,信息量呈指数增长。传统搜索引擎难以应对如此庞大的内容分发压力,取而代之的是推荐系统主导的信息分发范式。用户逐渐从「搜索者」变为「消费者」,算法根据行为数据动态推荐内容,平台从内容聚合器变为算法中介。商业模型转向精准推荐与信息流广告,强调停留时间、转化率和千次展示成本(eCPM)。AgenticWeb:智能体驱动的「行动网络」如今,我们正步入第三次变革浪潮:AI智能体成为主角,Web从「人读内容」转向「智能体执行任务」。信息不再静态储存在网页中,而是被嵌入LLM参数中,被智能体调用、组合与再加工。Web的角色不再是信息仓库,而是一个充满「可行动资源」的生态系统,供智能体发现、协调、调用。任务不再依赖用户逐步操作,而是由AI智能体全流程完成,从发现信息到调用服务再到反馈结果。这一趋势预示着:未来的Web,将由AI智能体构建、运营与使用。我们需要重新理解什么是「网页」、什么是「流量」、甚至什么是「用户」。互联网不再只是人类的空间,它正逐步变成一个由智能体共同参与、协作、创造价值的生态系统。二、什么是AgenticWeb?论文中的定义指出:AgenticWeb是一个分布式、交互式的互联网生态系统,其中由大语言模型(LLMs)驱动的自主软件智能体,能够持续规划、协调、执行目标导向的任务。在这个范式中,网络资源和服务不仅可供人类使用,还可以供智能体访问,使得智能体与智能体之间(Agent-to-Agent)的互动成为常态。简言之,它是一个由AI来「上网」、执行任务、人类只是「发出指令」的网络形态。AgenticWeb的核心在于「委托+执行」在AgenticWeb中,用户不再需要手动搜索、点击、复制或粘贴内容,而是可以通过与智能体的对话来委托任务。比如用户只需说:「帮我规划一个周末东京行程,预算3千元,要避开台风。」之后,剩下的所有工作都由智能体自动完成——从查询天气、搜寻航班、比对价格,到预定酒店、整合日程,整个过程完全自动化。而且,这些智能体可以与其他智能体(如航司API、酒店API、旅游数据智能体等)协作与谈判,实现任务目标。这不仅仅是像ChatGPT那样的单轮问答,而是通过多个步骤和多智能体协作来完成的,代表着AI真正参与到了Web的操作层面。Agent在系统中的身份是「双重」的:Agent-as-User(作为用户)如同人类访问网页一样,智能体可以模拟点击、填写表单、读取接口,进行市场分析、数据抓取、自动交易等任务。Agent-as-Interface(作为接口)智能体也可以作为「超级助手」,接收用户的自然语言指令,自动解析、调用多个服务、整合结果,执行多步流程。一个完备的智能体,常常同时具备这两个角色:既能代表人类与系统交互,也能作为系统对人类的接口,真正实现「意图—执行」的闭环。三、理解AgenticWeb的「三个核心维度」论文从三个核心维度全面理解AgenticWeb的结构:智能维度(Intelligence)AI智能体需要具备真正的「认知能力」,包括:上下文理解:能读懂网页、结构化数据、自然语言长程规划:能分解复杂任务,生成执行计划适应性学习:通过经验不断优化策略多模态整合:同时处理文本、图像、API、数据表格等这些能力意味着智能体不是被动的「响应工具」,而是具有持续学习和自主策略的「数字行动体」。交互维度(Interaction)AgenticWeb打破了「人类点击网页」的操作范式,转向基于语义的智能交互:使用MCP(ModelContextProtocol)、A2A(Agent-to-Agent)协议,实现智能体之间的发现、能力描述、状态共享支持多步任务语境保持(如购物流程、问诊流程)实现Agent-to-Agent协作与任务拆解智能体之间不是「调用」,而是协商、协同执行,如一个旅游智能体主动向天气智能体请求数据,再联动地图与订票工具,完成任务。经济维度(Economy)AgenticWeb中,最具突破性的设想是:AgentAttentionEconomy(智能体注意力经济)传统广告模型追求「人类点击」;AgenticWeb中,资源方争夺的对象变成「AI智能体的调用」。这意味着未来将出现:面向智能体的推荐系统;为智能体投放的广告;服务市场中按「智能体调用率」竞价;智能体的调用频次、完成率、效率将成为新的「流量指标」,商业竞争的重心也将从争夺用户注意力,转向争夺智能体「注意力」。四、应用场景:从搜索替代到智能事务系统为了更好地理解它的实际价值,我们可以将AgenticWeb的核心能力拆解为三大类:事务型(Transactional)、信息型(Informational)和交流型(Communicational)。它们共同构成了智能体参与数字世界的三种基本方式。事务型:从「点击下单」到「全自动完成任务」传统Web中,用户需要逐页浏览、搜索信息、逐步操作才能完成一项任务,例如订酒店、买机票、办签证。而在AgenticWeb中,你只需告诉智能体一句话:「帮我订一个下周三从上海到东京的往返机票,经济舱,避开台风。」剩下的——查询航司、比价、确认时间、填写资料、支付确认——都由智能体自主完成。它不仅调用航司API,还能根据你过往偏好(如信用卡积分、环保航线)进行权衡,甚至在发生变更时自动重订。这种智能化的事务处理能力,正在由「MobileAgents」「AppAgents」进一步延展到设备层。例如,智能体可以在你的手机上同步日程、修改会议安排、甚至整合多个应用自动执行跨平台任务。信息型:从「搜索引擎」到「持续知识发现」今天的信息检索依赖搜索引擎和社交推荐,但在数据过载的背景下,我们获取的是信息洪流。AgenticWeb支持的「信息型智能体」,则更像是一个长期陪伴式研究助理。以「DeepresearchAgent」为例:它可以持续追踪一个研究领域的新论文;自动梳理引用网络和方法论差异;合理推断趋势、生成研究摘要;甚至根据你的研究兴趣,推荐潜在合作者。这种智能体并不是一次性地「查一查」,而是具备长期「认知记忆」和动态「学习能力」的信息分析引擎。它们协作构成一个持续进化的知识网络,大大提升了信息筛选和洞察能力。交流型:智能体之间能沟通、协作、谈判相比以人为中心的传统Web,AgenticWeb真正的变革在于让智能体可以与其他智能体协作,形成类似「数字组织」的多体系统。在科研领域,一个跨国研究项目中,不同学校的智能体可以:自动同步实验时间表;共享数据集;生成联合成果;自动分配署名与经费比例。在制造业或供应链中,不同企业的智能体可实时对接需求、响应变化、自主协商条款。这种跨智能体协同工作流,依赖于一整套新型通信协议(如MCP、A2A),支持语义对齐、任务协同与多方自治。简而言之:Web不再是人和机器之间的桥梁,而是智能体之间的操作舞台。五、挑战:AgenticWeb的复杂难题与未来瓶颈虽然AgenticWeb展现出令人兴奋的前景,但要真正落地为现实中的下一代互联网,它面临的是一组系统性、相互交织、跨学科的复杂挑战——远不只是提升AI智能体的能力,更关乎整个网络基础设施、经济体系与人机协作范式的重构。这不仅是个技术性难题,更是一个需要全局观的系统性工程。构建AgenticWeb的难题,远不仅仅是提高个体智能体的能力,而是如何在现有互联网基础上,架构出一个可靠、安全、可信的全新计算层。这些挑战跨越了多个领域,彼此之间存在深刻的相互依赖与关联。接下来,我们将逐一解析这些挑战。智能体基础能力:推理、记忆与安全性🧠推理与规划的脆弱性多步骤推理是AgenticWeb的核心能力之一,它能够让智能体分解复杂问题、评估多个解决方案、做出合适的决策。然而,目前的推理系统仍然脆弱,容易出错,难以进行长远规划和持续反思。🧠记忆与上下文管理记忆是智能体能否有效执行长时任务的基础。传统的大语言模型(LLM)是无状态的,智能体需要外部机制来保留上下文、历史记录和学习到的知识。然而,如何高效管理这些记忆,尤其是在复杂任务中有效衔接不同阶段的内容,依然是亟待解决的难题。🧠工具使用的安全性智能体依赖外部工具(如API、数据库、搜索引擎)来与现实世界互动。然而,这也带来了极大的安全隐患:工具如果被黑客篡改或受到攻击,智能体可能会受到影响,甚至引发连锁反应。解决这个「工具使用悖论」,需要构建「零信任」架构,确保所有外部输入都经过严格验证。学习与自我改进:从静态模型到动态学习者🎓奖励设计难题强化学习(RL)是训练智能体的核心方法之一,它通过与环境的交互来优化决策过程。然而,设计一个既能引导智能体正确行为又不容易被滥用的奖励机制,依然是目前的瓶颈。🎓持续学习与灾难性遗忘智能体需要具备持续学习的能力,以便随着时间积累新技能。但在学习新任务时,智能体常常会忘记之前学到的知识,这就是所谓的「灾难性遗忘」问题。如何让智能体在不忘记旧知识的情况下学习新内容,是目前面临的重大挑战。🎓任务交互学习的困难通过与环境的互动来学习复杂任务是智能体成长的关键。然而,如何避免智能体过度依赖某一特定环境,或者过度拟合特定的输入,保持任务的灵活性和广泛适应性,仍是一个悬而未解的问题。多代理协作:协调与信任的挑战🤖协作与沟通:结构设计难题当多个智能体协同工作时,如何组织它们的结构成了关键问题:是采取平等对等的协作方式?还是分层领导?每种结构都有其利弊,如何找到最优解,仍需深入研究。🤖通信协议的统一性为了让全球的智能体能够有效沟通与协作,我们亟需统一的通信协议。这类似于互联网早期对HTTP协议的依赖。当前,像IBMACP、GoogleA2A、AnthropicMCP等协议正在试图解决这一问题。如何建立一个既能满足复杂交互需求,又具备开放性、易扩展性的标准,将是AgenticWeb成功的关键。🤖去中心化的信任体系在去中心化的智能体生态中,如何确保代理之间的信任?如何构建去中心化的信任体系,让智能体在没有人工干预的情况下高效合作,是另一个亟待解决的问题。人机交互:确保智能体与用户目标一致🧑💼用户意图模糊人类语言本身就常常模糊不清,很多时候用户的指令包含不明确的目标或信息。智能体必须能够解读这种模糊的意图,并将其转化为可执行的目标和任务。🧑💼偏好发现与引导用户的偏好常常是变化的,甚至很多时候用户自己都不完全了解自己真正的需求。智能体需要通过与用户的互动,不断引导用户发现并明确自己的偏好。🧑💼人类监督机制尽管智能体在很多任务中表现出色,但对于关键任务或高风险决策,人类监督(HITL)依然是不可或缺的。如何设计有效的监督机制,以确保智能体的决策能符合人类的最终目标,是一个至关重要的问题。安全与鲁棒性:确保智能体系统的安全性与稳定性🔒风险激增,信任重构代理型网络引入跨平台操作、交易执行和多会话记忆等新能力,带来目标漂移、服务污染、协调风暴等多维安全威胁。传统基于人工验证的信任模型已难以适应,需重构认知、交互、经济层的防护机制。🔒红队测试机制:人工+自动并进人工与自动红队测试成为识别漏洞的核心手段。尤其是自动红队利用LLMs构造复杂对抗场景,适应多设备与多代理协作,揭示隐藏威胁,已成为部署前安全评估的关键工具。🔒推理护栏与可控生成并举部署阶段的防御策略包括「推理防护栏」、「安全解码器」、访问控制等机制,提升LLMs与代理系统的稳健性与可控性。未来还需从架构、策略到系统范围全面升级,以应对级联攻击与持续学习挑战。社会经济影响:重构商业模型与社会结构💰广告经济难以为继当前的广告驱动型商业模式正在被AgenticWeb持续冲击。代理不再是「为人类眼睛设计」的工具,而是直接与服务提供方交易、执行任务。因此,广告模式已经难以适应这一新生态。💰新型商业模式的诞生交易型、订阅制、按结果收费等新型商业模型正在崛起,这为未来互联网的运营带来了全新的思路。未来的商业模式,可能会更多地依赖智能体作为服务提供者。💰劳动市场与不平等随着智能体的普及,很多职业可能被自动化替代,劳动市场将面临巨大的冲击。因此,如何平衡AI与人类就业,如何确保经济利益公平分配,成为全球关注的社会问题。六、总结:AgenticWeb是AI真正连接现实的入口我们正在见证互联网从「信息空间」迈向「行动空间」的转型。AgenticWeb并不是传统意义上的一次技术升级,而是一场范式革新——它让网络从被动展示信息,转变为主动完成任务;让AI不再只是一个回答问题的工具,而是一个可以代表人类行动、协作、决策的「数字代理」。这种变革所带来的,不仅是效率的提升,更是人与机器关系的重构、网络经济模式的重塑,以及全新社会秩序的建立。但与此同时,AgenticWeb的前路充满挑战:技术仍需突破、标准尚未统一、安全风险不容忽视、经济模型有待探索。这不仅是工程问题,更是伦理问题、社会问题、治理问题。无论结果如何,AgenticWeb已不再是科幻构想,而是迫在眉睫的系统挑战。结语AgenticWeb,不只是「AI代理能干更多事」,它是让整个Web变成一个「活的协作系统」,是AI与人类共创未来互联网的操作系统。你未来不再「点网页」,而是让智能体帮你完成目标。网页正在变成智能体,搜索正在变成协同,点击正在变成意图。我们正站在互联网的又一次巨大跃迁的门槛上。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/29
什么是“信息蜂房型”的互联网产品?
让信息生态更像蜂房,而不是茧房。针对“信息茧房”,腾讯研究院提出“信息蜂房”概念,为的是对抗前者所描述的那种信息封闭、态度极化、个人缺乏批判性思考的状况。这里的隐喻很形象:蜜蜂穿梭于蜂房之间,灵活采集花粉,而不是像蚕蛹被动包裹在茧里,四面受限,且不求变。信息茧房暗示用户的被动和自闭,而信息蜂房则强调,用户是能动的、协作的信息生态参与者。在理想情况下,“信息蜂房”可以为我们带来:多元信息源:用户不被局限于单一算法推荐或社交圈,而是像蜜蜂穿梭在多种信息来源之间。动态开放的信息组织方式:既层次分明,又交叉关联;既结果清晰,又蕴含上下文;既效率最大化,又能呈现多种声音,实现从“同质固化”到“多元共生”的结构性优化。人与信息的能动关系:用户既是信息消费者,也是信息生态的建设者。在用户与信息的关系上,达至从“被动投喂”到“主动探索”的能动性平衡。更具公共性与创造性的知识系统:让信息生态从单向度的个体化消费,走向多维度的协同实践。体现在知识系统的参与模式上,就是促进从“个体隔离”到“群体协作”的系统性融合。如果把“信息蜂房”的以上核心因素抓取出来——多元流动、主动探索、协作共建,我们就可以发现,某些互联网产品确实更符合这一隐喻,它们也为未来指明了好的信息生态的建设方向。“信息蜂房型”互联网产品的特征我认为,信息蜂房型互联网产品,具备以下四大特征:多元信息入口:不是单一算法推荐,而是多维度获取(订阅、社交、搜索、专业渠道等)。如果信息只依赖单一推荐算法,用户容易陷入“信息茧房”,接触不到多样视角,就会削弱自身的批判性思维与综合判断能力。多元入口能打破这种单向流通,让用户获得更多可能性。例如,通过订阅,用户可主动选择关注主题、作者或频道,形成个人化知识流;通过社交,从朋友圈、社群和专业论坛等地方,可以获得推荐建议与经验分享;通过搜索,包括关键字检索、学术数据库或专业门户,能够满足主动探索需求;通过专业渠道,利用PubMedCentral、Coursera、MasterClass这样的高质量知识平台,能够减少错误信息或虚假信息的传播,掌握权威信息源,也确保知识长期可追溯、可验证,为信息生态系统的持续发展提供支撑。从根本上来说,信息内容的来源、立场、风格都要尽量多元,避免单一话语垄断,这样才能使得不同文化、学科、群体的知识与观点都进入公共空间。这要求产品通过改进的推荐机制或管策逻辑,确保“少数声音”也能被听见。强用户主动性:用户可以自主探索,而不是被动刷流。用户长期被动地刷信息流,无论对个体还是平台都颇为不利。当信息被动流入,用户缺乏主动选择、筛选和组合信息的机会,知识获取易变得碎片化,从而形成认知局限、信息孤岛或短期注意力偏好,削弱深度理解与长期关注。另一方面,被动消费降低了用户参与、评论、分享和共建的可能性,使信息生态缺乏动态交互和群体协作,必然影响生态活力。如果平台为了增加停留时间,强化“刷流量”机制,诱导即时刺激而非深入学习,那么将深刻影响平台知识积累的可持续性,最终侵蚀平台的知识权威性。自主探索,也即根据兴趣、需求和问题导向去寻找、筛选和组合信息,能够让用户在信息生态中拥有更高的控制感,可以选择阅读深度、时间顺序或跨主题扩展,形成个性化的知识地图。自主探索模式下,用户可以根据兴趣长期积累知识,而不是依赖碎片化、即时化的信息推送。当用户能自主探索时,也更容易参与评论、讨论、标注或内容创作,将个人探索转化为集体知识贡献。如果平台提供良好的导航工具、推荐逻辑和多维分类,将能够帮助用户发现新的知识路径。此种模式鼓励“探索—分享—再探索”的循环:用户主动寻找多元信息,分享自己的发现并参与讨论,从而引发他人的新一轮探索。协作共建:用户不仅消费信息,也能创造、传播、评价,从而共同塑造生态。在流量主导逻辑下,平台用算法推荐来最大化用户停留时间,这意味着推荐系统偏好那些能够快速获得大量点击、点赞、评论或分享的内容,也就是所谓的“即时反馈”。这对信息生产与信息消费都有很大的危害。在信息生产端,创作者的生存和发展高度依赖平台推荐机制,缺乏稳定的自主空间。为了迎合算法,创作者趋向于标题化、浅表化和短视化表达,牺牲深度与多元性,导致内容的同质性越来越严重。创作者为追求流量,会不断复制成功的模版或主题,造成平台上充斥着“爆款套路”,原创性反而得不到鼓励。一些内容创作者甚至可能故意制造争议、将立场极端化,以博取更多算法关注。到处可见的是猎奇和煽情的内容,那些复杂、深度的东西因为需要投入更多时间理解,互动反馈慢,算法推荐权重低,曝光机会减少,于是落入边缘的境地。在信息消费端,用户更多处于被动接受状态,在短时间内沉溺于大量“点赞”或“推荐反馈”内容,容易形成碎片化浏览习惯。快速、密集的反馈循环让用户难以进行深度思考或跨主题探索。信息获取过程像“单向灌输”,很难形成互动、思辨或多领域的联结,结果是,整体生态逐渐滑向“个体化沉浸”,人们被困在越来越狭窄的信息围栏中,缺乏跨节点的对话与共建。这种模式虽然让用户获得了即时满足感,却容易导致社交割裂、信息同温层以及社会信任的弱化。相反,一个健康的生态应当鼓励个体在群体中协作:用户不仅是信息的接受者,也是知识的共建者;不仅是被动的浏览者,也是积极的互动者。通过协作式的参与,信息得以在共享、对话与批判中不断生长和结网,从而扭转生态整体关注即时互动量而非长期价值、公共讨论与知识积累容易被牺牲的局面。好的信息产品设计,令用户可以生成原创内容,如文章、笔记、视频或案例分享,丰富生态多样性。使用共享机制,保证不同视角能够被纳入生态,实现多元化。内设对话机制,如评论、讨论、问答等互动形式,让信息在交流中被反思、解释或补充。这样可以降低“个体隔离”的风险,让不同立场、背景的用户在共同议题下展开互动。在评价与反馈机制方面,通过评价、打分、标注可靠性或提供参考资料,用户能够帮助生态维持信息可信度。平台亦可引入“协作式知识建构”,让不同群体的知识互补,可以减少信息壁垒,提升公共认知的复合性。这种参与让信息生态成为一个动态、可反馈的系统,而非静态内容库,因此具备适应环境变化、抵御虚假信息和算法偏差的灵活性,使知识网络能够持续生长、更新与自我修复。生态互联:不同“蜂房”之间有通道,信息自由流动而不是被锁定。如果说信息生态是一座巨大的蜂巢,那么“生态互联”的理想状态就是各个蜂房之间保持畅通的通道,令知识与观点得以流动和交换。然而在流量主导的现实中,这种通道往往被人为收窄,个体既被困于算法编织的茧房中,接触到的只是与自身兴趣或立场高度重合的内容,也因壁垒重重难以实现跨节点的交流,失去了与外部世界发生深度对话的机会。最终,生态表面看似繁盛,实则逐渐贫瘠,因其缺乏跨蜂房的授粉与互补。当信息网络丧失了多向交流与跨界连接的可能,生态就会趋向单调甚至脆弱。因而,加强不同信息节点之间的通道与流动性,不只是技术优化的需要,更是一种维护“信息生态韧性”的文化自觉。要真正实现“生态互联”,必须避免算法驱动下的“单一栽培”,而通过机制设计引导多样化内容的生成与互通,让不同的知识群落能够交流、碰撞、互相滋养。为此,可以从技术手段、制度设计和用户行为引导三个层面来入手。开放接口与数据互通是基本前提,即提供API或标准化数据接口,使不同平台、数据库或社群能够共享信息和内容。例如,学术平台间通过开放获取(openaccess)实现全文互通。跨平台搜索与聚合工具也十分重要,开发统一搜索引擎或聚合工具,让用户能够在不同信息节点间快速跳转和获取内容。其他重要的技术手段包括:内容标准化,采用统一的标签体系、元数据格式或主题分类,使信息在不同节点之间易于理解和处理。跨节点推荐,算法不仅推荐与用户兴趣匹配的内容,也有意识地引入异质观点或跨领域信息。多入口导航,提供搜索、订阅、标签、专题、社群等多维度入口,让用户不被单一流量逻辑限制。可视化信息网络,通过知识地图、关联推荐或信息流可视化,让用户直观了解内容之间的联系。制度设计上,鼓励多样化创作,平台给予原创、深度或跨领域内容一定曝光保障,减轻创作者对“爆款算法”的依赖。鼓励开放与共享政策,平台或机构制定激励机制,调动作者和用户跨节点共享知识,支持跨平台转载、引用、笔记导出或知识二次创作。鼓励跨群体协作,推动创作者或机构联合制作内容,实现不同知识节点之间的互通。例如,通过主题联动,建立专题或系列内容,将不同节点的观点和信息串联,形成连续的知识链。在版权与合法性保障方面,明确开放共享的版权规范,保障信息在节点间流动时不侵权,同时维护创作者权益。在协作规范与社区规则方面,建立协作和反馈机制,引导用户在多个节点中进行评价、纠错和互动。提供声誉积分、阅读成就、贡献排行榜等激励措施,鼓励用户参与跨节点交流。用户行为引导,注重主动探索与多入口使用,教育和引导用户在多个信息源、平台和社群间获取内容,而不是依赖单一信息流。这需要一系列手段:导航工具,清晰的目录结构、知识地图或主题标签,帮助用户快速理解信息体系的整体框架。用户可以沿着逻辑关系或兴趣路径自由跳转,避免迷失在碎片化信息中。改进的推荐逻辑,不仅仅是单向算法推荐,而是结合兴趣、行为历史、多维指标进行个性化提示。推荐内容应保留多样性和可选择性,引导用户接触新的主题或交叉学科知识。多维分类,平台可提供主题、学科、深度、时间、形式(文本/视频/音频)等多维度筛选,避免信息被僵化地分类或固化,允许用户自由组合维度,形成个性化探索路径,从而发现意想不到的知识联系。好的信息组织,还注重层次性,既能提供快速消费的信息碎片,也能承载深度阅读,让不同需求的用户都找到相应入口。关联性,例如通过语义链接、推荐逻辑,把不同维度的内容联系起来,促进不同内容之间的关联与对话,而不是孤立存在。可解释性与透明性,信息的组织与分发机制要让用户可理解、可追溯,从而避免“黑箱化”造成的误导。符合“信息蜂房”的产品举例如果粗略地划分,我们会发现,现有的互联网产品当中,有些更偏向“信息茧房”,例如,强算法主导的平台,用户更多是被动接受,多样性不足,容易陷入“单一流”。某些封闭的社交产品,信息主要在小圈层内循环,不易跨圈传播。而另外一些,则鼓励主动探索、多元输入、协作共建,不那么过度依赖推荐算法和单一流量逻辑,因而更符合“信息蜂房”特征。比如维基百科,特点是开放式协作编辑,知识由全球用户共同维护与更新,具有强烈的蜂房属性:用户既是信息采集者,又是建设者;多元来源,动态演化。用户可以免费访问和使用,知识的获取不设门槛。内容可以随时修改和更新,使信息保持相对及时和灵活。强调中立观点,要求条目内容基于可靠来源,可验证,而非个人意见或未经证实的信息,避免单一立场垄断。。该产品的结构化十分清晰,知识以条目为单位组织,每个条目围绕一个主题展开,并通过内部链接形成网络结构。我最欣赏它的链接跳转,堪称促进多元共生的典型实践。维基百科能提供多语言版本,使知识可以跨文化、跨语言传播。其共同知识形成机制也十分独特,通过讨论页和社区共识,解决争议和不同观点,推动条目质量提升。Quora类问答平台,用户主动提问与回答,形成多角度知识网络。回答者可能在相关领域具有专业知识,用户可以对高质量的回答点赞、关注特定主题或用户,还可以建立个人资料以展示自己的专业能力。它的功能类似一个社会化知识市场,允许用户分享见解、获取知识,并在广泛的主题上进行讨论。不同的答题,就仿佛不同的“蜂房”,但彼此可以穿梭、对话。此类平台,能够帮助用户了解各类主题的见解和信息,也是好的寻求建议之所,用户可以从他人获得指导和不同视角。人们也利用平台分享经验,无论是个人经历,还是专业知识,促进了从多样化观点中学习的过程。豆瓣作为中国独特的社交和文化社区,其知识特点有别于百科类平台或问答型平台,通过小组、同城和书籍影音评论,用户围绕兴趣点自发构建信息社区。多样兴趣蜂房并存,用户可以在不同群体之间切换。用户不仅分享知识,也通过评分、评论和标签对书籍、电影、音乐等文化产品进行评价。也因此,知识呈现更主观、体验化,强调个人感受和兴趣而非客观事实。这样,经由用户生成与评价驱动,就可以走向兴趣社群的聚合,即知识生产围绕兴趣形成,如影迷、读者、音乐爱好者等。在结构上,豆瓣的内容丰富,更新频繁,信息呈现非条目化、非严格分类,而是以动态流和社区互动为主。用户可给内容打标签,形成主题索引,帮助其他用户快速找到相关内容。平台内部通过关联推荐将相似主题或作品链接起来,构建兴趣知识网络。Reddit是一个社交媒体平台,同时也是由众多在线社区(称为“subreddits”)组成的网络。用户可以在这些社区中分享文本帖子、图片和视频。他们可以对内容进行点赞(upvote)或点踩(downvote),以决定其受欢迎程度,热门内容会在各自的subreddit中排名靠前,甚至出现在网站首页。Reddit由此构成一个多样化兴趣的汇聚地,用户在这里获取信息、讨论小众话题、寻求建议,并与志同道合的人建立联系。它也具有娱乐功能,从搞笑故事到电影和表情包讨论,Reddit能提供丰富的娱乐内容。同时,平台允许用户在一定程度上保持匿名,这对讨论敏感或私密话题具有吸引力。从它的蜂房属性来看,不同的Subreddit就像蜂巢格子,用户可以跨格流动,形成开放的、多元化的信息生态。RSS/播客类产品,特点是用户主动订阅自己感兴趣的频道、主题或作者,获取定期更新的内容。这种订阅驱动不完全依赖平台算法,知识流从源头主动推送到用户端,得以实现多元化。它的蜂房属性是显而易见的:用户像蜜蜂一样主动采集,不被“推荐流”强迫灌输。从知识产品的角度来讲,它能做到时效性与连续性并举,订阅内容通常按时间顺序更新,如新闻、学术讲座或连载节目,确保知识持续流动;用户同时可以追踪长期系列或专题讨论,形成连续学习体验。播客以音频为主要载体,RSS可以整合音频、视频和文章链接,多感官信息呈现提升了知识吸收的多样性和趣味性。此类产品也实现了去中心化与分散化,用户可自由选择订阅源,信息来源分散,内容生态相对开放,降低了同质化和观点孤岛化的风险。在个性化与自主探索方面,用户可根据兴趣和需求自由组合订阅源,形成个人化知识流。开源社区,特点是用户共同贡献代码、文档、工具,协作式进化。它的蜂房属性在于,开发者相互取长补短,知识与工具不断迭代流动。以GitHub为例,它将Git版本控制的强大功能与协作型网络平台相结合,为软件开发提供了一个集构建、共享与管理于一体的综合环境。GitHub使用Git跟踪项目文件的每一次更改,使开发者可以回退到之前的版本,为新功能创建分支,并无缝合并修改,从而防止冲突并管理代码历史。它作为代码的中心化在线存储空间,使项目可随时访问,同时提供备份功能。它支持团队协作,允许多个开发者在同一项目中贡献代码,通过问题跟踪、拉取请求等功能进行代码审查和改进讨论。平台还提供任务管理、功能请求、bug跟踪以及维基(wiki)等工具,帮助团队组织项目和工作流程。通过社区建设与开源,GitHub发展成为全球最大的开源代码仓库,是开发者发现、贡献和受益于全球创新的重要平台。开放获取知识系统,如PubMedCentral(PMC)这样的免费数字档案库,收录生物医学和生命科学期刊的全文文献。与主要提供文献引用和摘要的PubMed数据库不同,PMC提供文章全文,使用户能够检索详细信息。它的所有文章用户都可以免费阅读和下载,突破了传统付费数据库的壁垒。该档案库支持科研人员、医务人员、学生和公众在无订阅限制的情况下获取权威文献,文章来自于同行评审期刊或作者提交的版本。作为数字档案库,PMC可以长期保存科研成果,确保学术资料不会因期刊停刊或出版社变动而丢失。它的数据是结构化的,支持全文XML标记,便于二次利用,如文本挖掘、知识图谱构建。它还同PubMed数据库联动,用户在检索时可以直接跳转到PMC的全文。像这样的全球开放获取知识系统,能够带来知识公平,通过去除经济门槛,让发展中国家的研究者也能平等获取最新科研成果。它还能促使科研加速,大量开放数据支持AI、生物信息学等领域的知识挖掘与模型训练。在COVID-19大流行期间,它快速整合并开放相关研究论文,为临床决策和政策制定提供支持,具备极大的公共健康价值。与商业数据库(如Elsevier的ScienceDirect)相比,PMC更强调公益性与开放性。如今,通过与EuropePMC数据互通,它形成了跨国知识网络。从“单一作物”到“生态花园”“信息蜂房”提出未久,目前仍属于启发式隐喻,而非经过严格实证研究的学术概念。但是它指向一种在“信息茧房”语境下更为自主、赋能的思考方式,是一个具象且富有积极范式转向的隐喻,尽管未来仍需更多研究去深化它的理论基础和现实可操作性。在当前算法驱动的内容分发环境中,用户往往处于一种被动接受的状态:算法根据既有偏好推送信息,使得用户更多地沉浸在由平台设计好的“信息流”当中。这种模式虽然提高了效率,却也削弱了用户的信息选择与批判能力。优化方向在于增强用户的能动性,通过提供更多搜索、订阅、定制化的工具,让用户能够主动探索、跨领域获取信息,而非完全依赖平台的“投喂”。这不仅有助于提升用户的信息素养,还能打破算法过滤带来的认知局限。从信息内容的组织来看,算法推荐往往基于用户行为的相似性,导致信息内容趋于同质化:用户浏览的越多,推荐的越“精准”,但同时也越单一。这种“固化”容易造成内容生态的单调,甚至加剧信息极化。优化方向在于推动多元共生:即在内容分发和组织上引入“多样性激励机制”,鼓励平台在推荐中加入一定比例的“跨圈层”内容,增加信息来源的广度与异质性,从而形成多元文化、不同观点、跨学科知识并存的生态。传统的信息消费模式强调“个体化”体验,用户在各自的信息流中独自沉浸,缺乏与他人协作和讨论的机会。这种“隔离”削弱了公共讨论空间,导致碎片化、原子化的认知结构。优化方向是推动群体协作:鼓励用户不仅是信息的接受者,也是信息的创造者、传播者和协作者。通过社区化、开源协作、群体共建机制,让信息生态更像“蜂房”而不是“茧房”——个体之间有通道,信息能够流动并协同演化。唯有通过这些优化,才能打造出一个兼顾多元化、透明度与公共性的系统,在多方主体(个人、群体、平台、机构)的协作中,促进可信知识的生成、流通和共享,从而支持社会的理性讨论、个体的终身学习与公共生活的可持续发展。这才是健康的信息生态。如果进一步借用生态隐喻,好的互联网知识产品就像是一片健康的森林——有层次(从草本到乔木)、有多样性(不同物种共存)、有循环(不断生长与更新)、也有开放性(允许新物种迁入)。既有主干,也有枝叶;既有秩序,也允许野生生长;最终形成一个既能稳定供养,又能常变常新的环境。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/20
厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑
就在刚刚,全球首个手机通用Agent,来了!现在,假如你正在开会,但只需要给手机打一句话,就能让它“自己动起来”,给你点外卖:帮我在美团外卖上,找最近的瑞幸咖啡,点一杯大杯的冰美式。可以看到,AI在接收到任务的一瞬间,就开始“嗖嗖”地执行起了任务。它会直接接管你的手机,不需要在各种APP之间跳来跳去,就可以把点外卖的活儿给干完。嗯,非常直观的感受就是:够方便,够智能。那么这个Agent到底是什么来头?它就是智谱刚刚发布的全球第一个手机通用Agent,就好比把Manus的能力搬到了手机一样。划个重点:免费,人人可用!或许这时候有小伙伴要说了,让手机自己动的Agent不是已经有了嘛?非也非也,这次真的有点不太一样。因为智谱的这个Agent,所有任务都是在云端执行,也就是相当于给你的设备安了个云手机或云电脑,不仅任务执行得流畅,更不影响你使用其它APP!更重要的是,这也是全球第一个大众消费级的Agent,不只手机(安卓、iOS均可),甚至可以操控云电脑帮你干活哦~或许,这是你真正免费接触、感受Agent的最佳时刻。还能做什么?我们先简单介绍一下AutoGLM的操作方式。在进入APP之后,可以看到有两个大类别的任务可选,一个是“生活助手”,另一个是“办公助手”。以生活助手为例,点进来后是一个正常跟AI对话的窗口,但我们需要先点击右上角的“手机”:然后我们再点击底部的“接管手机”,就来到了之前我们提到的“云端智能手机”界面了:在这里,我们可以像操作正常手机一样,进入到任务可能需要的APP里,登录并设置咱们自己的账号等。设置完毕后,我们就让它auto起来了,这一次,我们来个复杂一点的任务:我要买一个200块钱左右的保温杯,帮我在淘宝、京东和拼多多上比一下货。可以看到,对于“货比三家”这样繁琐的任务,AutoGLM都可以“嗖嗖”地自主跨APP且精准地执行。而我们所要做的,就是“发起任务→静候结果”即可。除了这些日常生活中能用到的功能之外,AutoGLM还特别擅长把工作、学习场景中的任务给auto起来。而且不同于现在PC网页端的Agent,AutoGLM是直接在手机里调用一台云电脑给你干活!我们先切换到“办公助手”这个模式,界面是这样的:可以看到,在输入栏的上方,便很方便地展示了“AI视频”、“AIPPT”、“AI网页”等功能的入口。这一次,我们先小试牛刀,让AutoGLM生成一份关于Agent的调研报告:帮我生成一份关于Agent的调研报告。同样的,我们无需做任何操作,就能看到AutoGLM自己用“云电脑”搜集、整理资料,在静候几分钟之后,一份基于近100份参考源、数千字的报告就水灵灵地出来了:进一步的,我们可以要求AutoGLM把文字的结果做成一份PPT:把这个报告做成一个精美的PPT。不得不说,原先需要我们耗时起码一天的工作,到了AutoGLM这里,真的仅仅需要几分钟的时间。怎么做到的?以上种种实测不难看出,相比传统聊天机器人只会“告诉你怎么做”,AutoGLM已经进化到“直接帮你做”。而且最重要的一点是,它几乎不占用本地资源。这也是本次AutoGLM的关键升级之处——为每位用户准备了一台云手机和一台云电脑,类似于云端备用机(里面提前装好了一堆APP)。有了这个东西,用户无需安装任何应用、无需额外连接,就能直接调动AutoGLM执行各种任务;而且,AutoGLM干活时不会影响用户正常使用自己的设备,二者互不干扰。更妙的是,一些不常用但不得不装的应用,也可以直接放到云端备用机中,从而释放更多本地存储,让设备运行更流畅。总而言之,AutoGLM之所以能在手机、PC等设备上流畅运行,背后实打实离不开云端执行这一底层设计。从更广的视角来看,“云端执行”不仅精准击中了行业痛点,还顺应了当下正在兴起的一股趋势。今年以来,Agent的火爆有目共睹,但一到落地环节大家就开始集体头疼:第一,本地设备算力有限,普通手机电脑根本无法支撑高并发、高算力需求的Agent任务。换句话说,偶尔跑跑简单任务还行,一遇到复杂任务就容易“宕机”。第二,即便是执行一些简单任务,Agent在运行时也会持续占用本地CPU、内存甚至操作权限,严重影响用户正常使用自己的设备,体验感差。而“云端执行”恰好对症下药——既不占用本地资源,也不干扰用户对真实设备的操作。正因如此,目前已经能看到有越来越多的行业玩家开始布局云端Agent。例如互联网大厂这边,阿里云就在世界人工智能大会论坛上推出了专为智能体打造的“超级大脑”——无影AgentBay,以云端电脑形态执行各项任务。另外,PPIO等云厂商也推出了“Agent沙箱”等产品,为Agent提供专门的云端运行环境。这些动作都说明,行业内部已经认识到云端执行对于Agent发展的重要性,并开始积极投入资源进行布局。而智谱此次推出的AutoGLM,正是依托这一设计,从只能跑跑简单任务的初级Agent中脱颖而出,切实融入了普通人的工作与生活中。万物皆可AutoGLM与此同时,AutoGLM并不局限于手机和电脑,还能被集成到更多载体中——如智能音箱、车载系统甚至毛绒玩具里,主打一个“万物皆可AutoGLM”。为实现其广泛应用,智谱即日起还上线了移动端API申请通道及「AutoGLM开发者生态共建计划」,通过开放API将AutoGLM的能力赋能给更多开发者的智能产品。显而易见,智谱在AutoGLM上的布局,有着自己的节奏和长远考量。从成立的第一天起,这家公司就将通用人工智能(AGI)作为追求目标,并在后续提出了“让机器像人一样思考”的愿景。围绕这一目标,智谱规划了L1-L5的AGI路线图:从预训练大模型,到对齐推理、自我学习、自我认知,直至最终的意识智能,一步步循序推进。而AutoGLM,正是智谱通往L3“自主学习智能体”的关键一步——通过将Agent能力带给更广泛的普通用户,不仅验证了当前技术的可行性,还能在真实应用中不断积累经验与反馈,推动模型自主学习。这种自我学习能力,使机器能够突破单纯依赖历史数据获取知识的局限,在与用户和环境的持续交互中发现新知识、总结新方法,并反过来提升自身能力,形成技术与应用的正向飞轮。一旦这个飞轮持续运转,自然也能进一步夯实智谱在Agent领域的领先位置。而且这一次有个比较新的变化是,和GPT-5类似,AutoGLM也实现了能力“大一统”——背靠智谱最新开源SOTA语言模型GLM-4.5与视觉推理模型GLM-4.5V(纯国产Agent),首次将推理、非推理、编码、研究、Agentic、GUIAgent等能力整合进一个模型。这也代表着智谱对AGI的早期理解:具备通用完整的多模态和思维能力的模型是通向AGI的一个重要里程碑,AutoGLM是其对AGI的又一阶段性探索成果。另外从行业角度来看,AutoGLM更重要的意义或许在于,它用真实产品验证了“云端执行”这一路线的可行性与可靠性。不过有一说一,AutoGLM在给行业提供新解法的同时,也为本就竞争激烈的Agent赛道再添一把火。因为Agent发展到现在这个阶段,拼的已经不只是能否完成任务,而是能否从简单的执行者,升级为能够处理更复杂场景、更稳妥应对不确定性的“全能型选手”。当然,抛开厂商们之间的“腥风血雨”,对普通用户而言,AutoGLM这一新工具无疑正在真实改变我们和机器之间进行交互的方式——手中的大模型不再只是“会聊天”,而是能直接操作系统,真正帮忙完成任务。更进一步,智谱还提出了从Agent迈向AGI应始终追求的3A原则:Around-the-clock(全时):24小时待命与持续执行,在用户睡觉/离开/设备黑屏时仍可运行与产出。Autonomywithoutinterference(自运转、零干扰):Agent在云端设备运行,不占用用户屏幕/算力。Affinity(全域连接):跳出浏览器对话框,连接手机、电脑、手表、眼镜、PIN、家电等多种设备与服务,覆盖数字与物理世界。可以预见,随着技术的持续迭代与生态的不断丰富,“问一句,剩下全交给Agent”的时代离我们真的不远了。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/20
工具APP,在海外复活吸金
10年前沉寂的赛道迎来新一轮增长。在关税让跨境电商出现“寒潮”之际,工具APP出海的“暖流”却在悄然涌动。北京一家名为安纳卓力(Enerjoy)的公司,仅凭6款聚焦睡眠、健身、心理健康、卡路里追踪等细分领域的健康类App,便在海外市场低调斩获了年流水超5000万美元的惊人业绩。健康类应用无疑是如今的明星赛道。SensorTower数据显示,2024年全球健康类应用下载量突破36亿次,应用内购收入实现“五年连涨”,达到38.8亿美元。TikTok上,#fitness(健身)相关话题视频高达499万条,单条播放量动辄破百万,成为这场行业盛宴的生动注脚。更令人惊叹的是,这股工具APP掘金的浪潮正席卷各个领域。如睿琪软件,凭借一款植物识别应用“PictureThis”,仅今年5月单月营收便逼近亿元大关。而放眼2025年7月中国非游戏厂商出海收入Top30榜单,工具类App厂商占比已强势攀升至50%,占据半壁江山。在海外市场,工具APP属于一个相对更容易赚钱的赛道。这类应用凭借高效、实用的核心功能,天然具备跨越文化隔阂的能力,不需做过多本地化适配,便能快速在海外用户中建立基础。并且以欧美为代表的成熟市场用户,对优质数字化服务有更高的付费意愿,整体盈利能力突出。有业内人士直言,“这是一个真正的躺赚模式,产品做好了,放在商店等收钱即可。或许有一天,你的APP就会给你带来泼天的富贵。”但工具APP真的如此简单就能坐享其成吗?“躺赚”背后,又暗藏着哪些不为人知的挑战?蓝海未退潮工具APP出海已走过十余年征程。2008年,苹果iPhone3G及AppStore的横空出世,打开了中国移动应用出海的大门。尽管当时中国人刚刚开始摸到智能手机,却敏锐意识到移动应用的庞大机遇。一场淘金热随即爆发:2010年,久邦数码的GO桌面一炮而红,短短两年全球用户逼近2.4亿,月活高达4200万;2013年,猎豹移动的CleanMaster强势登场,一年内活跃用户便飙升至1.4亿;2014年,美图启动国际化,仅一年海外用户就突破5亿大关……那是一段躺着赚钱的快活日子。有行业人士回忆道:“当时移动互联网起步不久,很多人买完手机后没有很多应用可以下载,开发工具APP基本做一个成一个,做什么都能活。”然而,盛宴终有散场时,2016年后,行业光环逐渐黯淡。一面是跑马圈地渐入尾声,用户获取成本增长,产品同质化泛滥,市场竞争走向白热化;另一面是巨头生态收紧,Facebook、Google等平台规则日益严苛,对工具APP变现的强力监管,进一步压缩了利益空间。2020年,猎豹移动旗下所有APP被谷歌全面封杀,直接导致公司近22%的营收化为乌有。CEO傅盛感慨道:“我知道工具会退潮,从2015年就知道。但我们从来没有想到,变化会是断崖式的。”黄金时代落幕,中国开发者也开始转型,从早期粗放的“广撒网”机会主义,转向深耕细作的成熟运营。同时,在近年来移动应用市场需求转型的推动下,沉寂的工具APP赛道开始出现新一轮的增长。2024年,以视频/照片编辑、文档扫描、VPN、系统清理、计算器等为代表的实用工具类APP在iOS端就呈现强势复苏态势。Statista数据显示,2024年全球iOS工具类应用总收入达22.3亿美元,同比增长幅度高达46%。市场增长的动力主要来自两方面。一方面,新兴市场的崛起为工具类APP提供了可观的增量空间。SensorTower《中国出口应用报告》显示,在工具应用领域,中国应用在东南亚市场强势领跑,越南、柬埔寨、印尼的安装量中,中国应用分别雄踞36%、33%和30%的份额。在拉美地区,哥伦比亚与墨西哥市场也表现亮眼,两国均有超过25%的安装量来自中国应用。这些地区新增智能手机用户主要集中在中低端设备,对轻量化、高效能的工具类应用需求呈现明显上升趋势。据智象出海了解,就有深圳某团队推出中东版“扫描全能王”,单日营收突破20万美元;另一团队做的“智能计算器”,在巴西月下载超200万次。另一方面,人工智能技术的快速发展有力驱动了工具类APP的功能创新,AI搜索、AI图像处理等应用在海外市场热度持续攀升。AI赋能的工具APP不仅显著提升了用户体验,也为开发者开辟了新的增长路径。Fotor的蜕变便得益于AI的加持。这款如今风靡全球的图像编辑应用,在2021年前市场表现平平,其母公司甚至因回购到期融资而面临现金流压力。转折点出现在2022年,随着陆续上线多种AI图片生成功能,其用户规模开始稳步增长。至2023年,Fotor月活跃用户突破1500万,如今已覆盖全球8亿用户。2024年,其营收预计突破1亿元。纵观工具APP出海的跌宕历程,从早期的杀毒清理,到如今融合AI的智能效率助手,十余年风雨洗礼,这条赛道非但未曾沉寂,反而在技术与市场的双重淬炼下,展现出愈发强劲的韧性与蓬勃的增长潜能。多品类、高包数“一个每月流水500美元的小App听起来不惊艳,但20个就能年入百万”,一位独立开发商对智象出海说道。他现在靠着十多个功能专一、体量轻巧的App组合,每月轻松收入过万美元。这是如今工具APP出海的一个典型现象:相比依靠单一产品冲击爆款的逻辑,更多人选择了拥抱更稳健的生存法则——“多品类、高APP数”的矩阵化战略。多品类布局的核心逻辑是多方押注,不再将所有筹码放在一个篮子里,而是精准切入多个需求刚性、竞争格局尚佳的细分领域,构建差异化的产品组合。如睿琪软件,也未曾止步于一款植物识别应用的成功,而是同步推出了涵盖硬币、纸币、水晶、花鸟鱼虫等主题的九款识别工具,几乎覆盖了该品类的所有潜在需求。同时,公司还拓展了健身和文档扫描类产品,使海外应用总数达到19款。这种多点布局策略,有效保障了公司在不同市场周期中的流量和收入稳定性。高APP数策略则侧重于纵深挖掘:在同一核心品类内,将功能模块解构,深耕细分应用场景,开发多个轻量化、专注解决单一痛点的独立应用。以系统清理工具为例,相较于开发功能庞杂的“全能型”应用,更优策略是化整为零,推出诸如“微信专清”、“相册压缩”、“短视频缓存清理”等针对性APP,精准满足用户的特定需求。RevenueCat的数据印证了这一策略的必要性:平均而言,单款应用上线一年后的中位数月收入不足50美元,这表明单产品模式对独立开发者而言盈利难度极高,唯有通过多产品组合叠加,方能突破盈利瓶颈。海外用户本就更青睐专业的产品。如Instagram前身是一个名为Burbn的社交平台,功能庞杂。其创始人通过市场研究意识到,用户最喜爱的是分享照片的功能,于是果断砍掉冗余功能,专注于简化和完善照片分享体验,这一“断舍离”直接促成了Instagram的爆炸性成功。这种策略优势显著:在用户获取端,轻量应用更易实现精准投放,提升转化效率;在用户运营端,多款应用可自然形成产品间的导流闭环。归根结底,“多品类+高APP数”并非简单的数量叠加,而是基于数据分析的精密矩阵构建:横向拓展品类覆盖范围,纵向深挖功能应用场景,确保每款应用都精准锚定一个细分需求点,形成产品间的互补与协同效应。通过这种战略性布局,工具类APP出海得以有效分散风险,显著拓宽增长通道,最终实现从依赖“单点爆发”到构建“多点支撑、持续盈利”商业体系的根本转变。从传统买量到视频引流在当今高竞争环境下,即使做出了精准命中用户痛点的工具APP,若缺乏高效的用户获取与转化机制,产品依然难逃在海外市场“叫好不叫座”的命运。流量困局,已成为开发者们面对的又一生死劫。一位开发者就向智象出海吐露困境:其精心打造的APP,集录音上传、AI转文本、Word/PDF处理于一身,如今已上架应用商店一周,却几乎毫无流量,推广陷入困境。过去,广告买量是工具类APP出海的主要推广手段,但如今其投资回报率(ROI)正急剧下滑。AppsFlyer《2024中国应用全球化趋势报告》中指出,2024年工具类App全球单用户安装成本(CPI)均值同比上升38%,其中Android端涨幅达42%,刷新2021年以来纪录。尤其是清理、文件管理等基础工具类App,因产品同质化严重,买量成本持续攀升而步履维艰。此外,广告素材也创新乏力,如“一键清理”“内存释放”等话术重复率高,用户点击兴趣索然,留存率持续低迷。当传统广告日渐式微,视频内容正强势崛起成为破局利器。研究证实,视频内容的用户停留时长可达静态帖子的5倍,自然覆盖率同样高出4倍。因此,越来越多厂商将目光聚焦于TikTok——这一拥有全球海量用户、以强视觉冲击力和高用户粘性著称的平台。尤其是在美国市场,TikTok用户规模已超1.7亿,18-30岁Z世代中高达74%将其作为搜索引擎,其中51%的人更喜欢使用TikTok而不是其他平台。“我也开发了几款APP,但关键词优化真没经验。觉得平台宣传比关键词更优先一些,毕竟现在都是短视频时代了”,一位开发者对智象出海的直言,道破了时代风向。照片编辑应用Facetune的成功,也验证了视频推广的有效性。该品牌摒弃生硬推广,转而投放一系列极具原生感和创意的TikTok短视频内容。这些内容迅速点燃了平台用户的热情,引发真实社群的自发讨论与互动狂欢,成功将广告转化为社交话题。效果也直接体现在转化端:不仅撬动了近2万次AppStore点击和超5万次企业号访问(含付费和自然流量),更令人瞩目的是,在普遍面临获客成本攀升的行业背景下,其每次转化费用实现了逆势下降,同比降低38%。这一案例清晰表明,契合平台生态、激发用户共创的短视频广告,正成为驱动高效增长的新引擎。推广策略的制胜核心在于“精准匹配”:必须动态优化投放策略,紧密契合目标市场特性,以及产品自身的变现模式。这不只是关乎广告位与出价的优化,更要求投放路径与产品变现逻辑深度协同增效。综观全局,工具类APP出海机遇依然广阔,但竞争也迈入精细化、多元化、可持续的新阶段。但无论如何,成功的关键始终围绕三点:发掘具备增长潜力的细分品类;通过矩阵化布局有效分散风险、拓展生意;借助精准高效的推广策略,将市场潜力转化为持续收入。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/15
AI成为了互联网的流量劫匪
5月初,Google在开发者大会I/O上讲了很多东西,我们只说三个:AIOverviews、AIMode,以及Gemini。你会发现,这三个产品/功能是并存的。并且,它们分别代表了Google作为web时代的搜索巨头,在AI时代转型的过程中,尝试的三种不同路线:·AIOverviews:传统web产品,向后兼容·AIMode:web搜索向AI过渡的中间态·Gemini:纯粹的AI产品大公司还是大公司,一个AI搜索做了三种不同形态,且并驾齐驱。大厂“养蛊”还得看Google。熟悉这家公司的朋友应该能够预想到,未来几年内会发生的事情:Gemini将取代前两者,甚至取代Google搜索。而且就算不取代,以Gemini/ChatGPT/DeepSeek为代表的生成式AI产品,也已经在杀死传统搜索了。全球共有约56亿网民,Google搜索市占率90%+,约合用户量50亿左右;而Google自己透露目前全球有15亿人使用AIOverviews——倒不一定这15亿人从此都不会访问搜索结果链接了,但至少他们当中不再点击链接的比例,正在快速提高。人们直接使用AI产品的整理归纳能力来完成任务,需求完全在AI产品内部解决,不需要再访问第三方网站。Cloudflare公司CEO马修·普林斯最近接受美国政府质询时指出:在今天,75%的搜索查询无需离开Google即可得到回答。最近他的公司也推出新功能,给网站主提供反爬虫能力,来阻挡AI大模型的爬虫来提取网站的内容。普林斯的表述,以及Cloudflare公司的做法,背后是AI爆发的副作用愈发明显:AI瓦解了传统互联网的核心商业模式,扼杀互联网通过搜索引擎获得的流量。Google它不断推进Gemini、AIMode和AIOverviews,一边将生成式AI产品提升至顶级入口,一边用(非主观的)流量补贴/惩罚策略来绑架内容平台:在I/O之后接受采访时,CEO桑达尔·皮柴透露,如果内容平台同意让AIOverviews的爬虫抓取,将会得到更高的流量。彭博社做了一些采访,发现很多网站的流量因为AI受到严重冲击,不得不调整内容发行策略,更有甚者只能关门大吉。分析机构SimilarWeb数据显示,AI产品严重降低了基于网页分发内容的平台所获得的流量,首当其冲的有时尚、旅游、手工、家居、美食、生活方式等领域。一些内容平台已经感受到流量的大幅下滑,做出了不同的应对。实力雄厚的新闻机构已经提前布局,包括新闻集团、美联社、施普林格等在内的新闻巨头,已经和OpenAI达成授权合作;一些新闻机构则发起抵制,纽约时报集团起诉了OpenAI以及背后的微软,指责其非法使用时报内容开发产品并与自己竞争。这些合作与诉讼的具体细节尚不为外人所道,但新闻巨头的动机很直截了当:内容提供商的流量正在越来越多被AI蚕食。没有流量就没有广告/会员收入,内容提供商也无力抵抗,所以AI产品公司必须给内容源头分成。市场营销公司SeerInteractive做了一些关于AI汇总功能对网站点击率冲击的研究,发现AIOverviews对搜索结果页点击率的降低效果达到70%,对网站主投放的付费广告的点击率则直接砍半。硅谷知名投资机构a16z也做了一组报告,援引SimilarWeb数据,发现LLM产品对YouTube、Quora、Reddit、媒体、电商、金融等网站的流量引导比例普遍低于5%。显然,AI产品/总结功能对传统互联网核心商业模式的打击是巨大的。究其根本:内容平台提供内容,搜索引擎获得数据;搜索引擎提供流量,内容平台获得收入;内容平台投放广告,搜索引擎获得收入——这一互联网时代价值交换的体系,已经被AI彻底打破。情况只会更加严重:市调机构Gartner认为,到2026年搜索引擎的流量将会暴跌25%。SimilarWeb数据显示2025年3~4月各大主流网站和搜索引擎流量暴跌,只有ChatGPT.com逆势增长。最近很火的AI浏览器项目Dia,其创始人JoshMiller前不久专门写过一篇文章,讲公司为什么从传统浏览器转型AI浏览器,顺便也讲述了他对互联网的几个观察。其中之一:生成式AI将取代网页,成为新的交互界面。传统浏览器的任务是加载网页。但现在,网页(包括app、文章、文件等各种形式)正在越来越多变成AI聊天界面的“工具调用”(toolcalls)。AI聊天产品已经很像浏览器了:它们能搜索、阅读、生成、做出反应。它们和API、LLM、数据库交互。人们每天使用这些AI产品好几个小时。如果你还看不到这一点,给还在上学的亲戚打个电话就知道了。自然语言界面抽离了旧有的计算模式的乏味,将会成为新的标准。Miller的观察早已灵验:国内外有很多传统互联网企业,包括本地生活、导航、在线旅游、效率办公等领域,都已经主动拥抱变化,开发了MCP能力,让用户在使用agent的时候仍然可以调用它们的服务。企业可以在AI产品调用其MCP/API时收费,从而维持收入。但内容是完全不同的商业模式。互联网上绝大多数的内容都是公开免费的,但很多人往往忽视了一点:这种免费不是真的免费,而是通过广告或(部分内容)付费订阅进行补贴。而这些收入只有直接链接访问才能够产生。现在,AI产品抓取这些内容并生成用户需要的答案,整个过程就此为止。在今天,这些AI巨头和创业公司们往往一门心思发展自己,却没有为内容的来源网站主或创作者提供分成的计划——即便AI产品在交付物里提供了资料链接,大部分用户也不会点击访问。在可预见的未来,互联网内容的生成将进入一种“不可持续”的状态:现在大批AI公司已经在用大模型生成的内容进行再次训练了。长此以往,互联网公域将充斥着大量由AI生成的低质量、虚假、与现实不符甚至毫无关联的内容。种种迹象似乎预示,AI产品工具的大流行如果不加控制,如果AI新时代的利益分配机制不尽快出现——传统互联网将会被杀死,届时没有人会成为赢家,即便是AI公司。所以,AI公司构建新利益分配机制的进展怎么样?目前来看,这方面的工作还很“初级”。前文提到的OpenAI和内容提供商签订协议(具体金额和计费机制细节未知),除此之外并没有太多新进展。a16z前不久发表了一篇文章,试图描绘一个新的图景:从SEO(搜索引擎优化)转移到GEO(生成引擎优化)。顺应这个趋势出现了一些新的创业公司,例如Profound、Daydream等。它们帮助客户和网站主分析特定关键词(例如品牌)在AI生成回复当中的表现——简而言之,就是“策略性”地帮助客户提高在AI生成总结答案中的曝光度。但截至目前,业界在这方面的尝试仍然尚浅。核心痛点仍然存在:即便内容创作者面向LLM的逻辑优化自己的内容,在AI产品里获得了曝光,点击率仍然是个大问题。没有流量,所谓的“生成引擎优化”恐怕只是空谈。最后,这跟普通人有关系吗?乍一看似乎没有,毕竟大部分人都认为世界的变化从来不为普通人的意志驱动。但实际上,这个情况和每个人都有千丝万缕的关联。传统互联网从来不是完美的,但它仍然是迄今为止一切人类创造的精华宝库。互联网的黄金年代造就了如今最优秀的商业公司,推动着技术的进步;它也凝聚了无数人无偿/低偿向世界分享的知识:以博客、维基百科、YouTube、贴吧们为介质。每一个人都从这些公司的产品,以及这些互联网平台承载的信息中获益。一切都是生意,互联网信息其实是一个市场。如果内容创作者无法获得价值,他们就不会创作原创内容。经济激励的缺位,势必导致在线内容平台的萎靡,导致互联网信息市场里公开免费有价值的内容出现短缺。这将会限制人们获取真实信息、新闻、观点的能力,威胁每一个人的知情权。如果AI巨头杀死了传统互联网,成为了新的技术霸权,决定人们能否获得、获得怎样的信息,进而构建新的认知霸权——我们准备好迎接那样的世界,承担相应的后果了吗?本文来源:虎嗅APP文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/15
Meta、微软掌门人最新对谈:AI浪潮带来软件开发革命
4月30日,MetaCEOMarkZuckerberg和微软CEOSatyaNadella在LlamaCon2025闭幕会议上进行了一场精彩对话。本次对话从历史视角切入,将AI定位为继客户端服务器、互联网与云之后的又一次重大技术平台革命,并剖析了其驱动下的效率飞跃与成本优化趋势。对话深入讨论了微软在开源与闭源模型间的战略平衡、Azure云平台在赋能开发者构建AI应用中的核心作用,以及AIAgent在重塑软件开发和知识工作流程方面的潜力。此外,双方还探讨了AI驱动下的未来工具形态、模型蒸馏技术的机遇与挑战等话题。以下是本次对话实录,经数字开物团队编译整理。一、AI浪潮带来新一轮技术平台革命MarkZuckerberg:非常荣幸能邀请到Satya。你引领Microsoft这家伟大的科技公司实现了惊人转型,推动公司向AI、云等重要领域发展。对于我们所做的开源工作,你一直是我们的朋友和盟友。我非常珍视我们长期的伙伴关系,也感谢你就Llama生态系统及基础设施建设给予的建议。SatyaNadella:谢谢你,Mark。我的荣幸。我还记得大约2008或2009年,我负责Bing时与你见面,当时你指出互联网需要体现“人”的存在,用户需要随处可见的个人档案页面,这个观点我至今记忆犹新。MarkZuckerberg:是的,互联网确实需要体现“人”。SatyaNadella:或者现在需要的是Agents。MarkZuckerberg:两者或许都需要。你曾多次提到,当前AI技术的蓬勃发展让你想起了过去几次重大的技术变革,比如向客户端服务器架构的迁移、互联网的兴起。能否请你详细谈谈这个看法?SatyaNadella:我经历的第一个时代是客户端概念兴起。我在Windows3发布后加入Microsoft,亲身经历了客户端服务器架构的诞生,接着是互联网、移动和云时代。现在这次AI浪潮可以算是第四次或第五次大的技术变革了。每当发生这样的转型,整个技术栈的每一层都要被彻底重新评估,必须回归第一性原理,重新开始构建。例如,我们从2007、2008年开始构建的云基础设施,其形态就需要为AI进行调整。用于AI训练的核心存储系统,和我们过去为通用目的构建的核心存储系统截然不同;AI训练这种数据并行、同步的工作负载,也与过去的Hadoop之类的负载截然不同。平台转型迫使我们重新思考整个技术栈,这是我们面临的周期性挑战。新的技术在现有基础上发展起来,就像互联网诞生于Windows平台,但其发展早已超越了Windows。我也是这样看待当前变革的。二、AI性能指数级提升,多模型、多Agent应用成为可能AI效率与成本优化:摩尔定律“超速”与多模型协同(多重技术S曲线叠加驱动AI性能每6-12个月提升10倍,成本快速下降,催生了编排多模型、多Agent的复杂应用需求)MarkZuckerberg:你提到技术变得更高效时,会改变原有运作模式,人们最终会消费掉更多的服务量。在AI模型领域,这种趋势是如何体现的?AI模型效率越来越高,智能水平也远超前代,这一切都发生得极快。你对此有何观察?SatyaNadella:几年前大家还在讨论摩尔定律是否终结,现在我们却进入了一个摩尔定律的“超速”发展阶段。重大的技术平台转型,并非由单一的S曲线驱动,而是由多个S曲线叠加复合而成。芯片本身在不断进步(如Jensen或Lisa的创新),产品迭代周期缩短,这是摩尔定律的S曲线。此外,还有计算集群系统软件优化、模型架构优化、推理内核优化、应用服务器优化,乃至提示缓存技术等多个层面的进步叠加。所有这些因素加在一起,整体性能可能每过6到12个月就能提升10倍。能力以这样的速度提升,成本以这样的速度下降时,消费量的增长是必然的。我们正处在一个可以构建真正深度应用的阶段,特别是那些需要编排层来协同调度多个Agents和多种模型的复杂应用。第一代AI应用通常与特定模型高度耦合。现在我们能够构建多模型的应用程序,可以编排确定性的工作流,让一个应用或基于某个模型构建的Agent与另一个Agent交互。已经有一些有用的协议支持这种交互,比如MCP、A2N等。如果在协议等方面实现一定程度的标准化,开发者就能更容易构建出既能充分利用这些日益增强的技术能力、又具备高度灵活性的应用程序。这恰是开源可以发挥其巨大作用的领域。三、开源与闭源AI模型各有优势且市场需要并存MarkZuckerberg:之后我们一定要深入探讨如何协同使用多个模型,以及你提出的“distillationfactory”概念。在此之前,Microsoft在拥抱开源方面历经转变,这是你任期内的早期关键举措之一。你们与OpenAI早期合作,但也明确表示,除了闭源模型,也要服务好开源模型。你是如何考虑开源与闭源的关系?如何看待开源生态的发展?它对你们的客户为何重要?在构建基础设施时如何考量开源因素?SatyaNadella:我在Microsoft早年负责确保NT系统能与各种Unix实现互操作性的经历让我认识到:互操作性是客户的需求,做好互操作性对业务有益。这是我思考开放问题(包括开源)的出发点。我对闭源还是开源并不固执己见,世界两者都需要,客户也会同时需要它们。即使有人对此抱有执念,最终市场格局会证明对两者的需求真实存在。现实中:有SQLServer,也有MySQL或Postgress;有Linux,也有Windows;还有Windows上的Linux(WSL)。我喜欢在Windows上用WSL,因为它能方便地使用大量Linux开发工具并进行部署。采取一种允许灵活组合搭配闭源和开源的策略非常有益。这也和你提到的观点相契合,很多企业客户希望基于自身拥有的模型或数据进行“distillation”——这是他们的IP。在这种场景下,开放权重模型相较于闭源模型,拥有巨大的结构性优势。当前世界同时拥有顶尖的闭源前沿模型和顶尖的开源前沿模型是好事,能更好地满足各方需求。对我们这样的超大规模云服务提供商而言,这也是有利的,我们的职责就是服务。就像在Azure上,客户可以获得出色的Postgress服务,也可以获得优秀的SQLServer服务,可以选择Linux虚拟机,也可以选择Windows虚拟机。同理,在AI领域,我们希望提供丰富的模型选择,并围绕这些选择提供强大的工具支持。四、Azure赋能开发者:打造AI时代的基础设施与工具链MarkZuckerberg:Azure在支持开源方面的核心价值主张或角色是什么?特别是对刚起步的开发者,你们在哪些领域打造差异化,力争成为最佳选择?SatyaNadella:AI工作负载并非只在推理时涉及AI加速器和模型。任何AI工作负载的底层都离不开存储、其他计算资源及网络等核心基础设施。Azure致力于构建世界级的计算、存储、网络及AI加速器整合的IaaS,为构建下一代Agents的开发者提供最好的基础平台。在此之上,我们通过Foundry构建应用服务器层。在每次平台转型中,应用服务器都扮演了重要角色,它将所有必要服务——搜索、记忆、安全、模型评估(Evals)等打包起来,这些都是开发者构建应用时普遍需要处理的。将这些功能封装好,提供框架和工具,是核心价值所在。此外,我们非常注重开发者工具链,GitHubCopilot是重要代表,我们对其进展非常兴奋。将强大的工具、强大的应用服务器和强大的基础设施结合起来,是加速应用程序开发的关键。五、AIAgent正在重塑软件开发与知识工作流MarkZuckerberg:你提到了Agents和生产力提升,这是当前的热门主题。这一趋势在Microsoft内部是如何体现的?在外部开发者中,你观察到了哪些利用Agents提升生产力的有趣案例?SatyaNadella:观察软件开发领域的变化非常有帮助。GitHubCopilot的演进值得注意:从代码补全,到加入聊天功能(让开发者无需离开编辑器查询),再到AIAgent工作流(直接分配任务),甚至现在有了proto-SweeAgent(可分配更高级别指令或PR)。这三种甚至四种功能是并存互补的,都带来了生产力提升。我们得到的最大经验是,必须将所有这些工具与现有的代码仓库和开发者工作流整合起来。从零开始构建一个全新的“绿地”应用是一回事,但现实中很少有人能一直做全新的项目。开发者通常在庞大的代码库和复杂的工作流中工作,因此必须整合工具链,这是任何工程团队都需要完成的系统性工作。只有这样,才能真正实现生产力的提升。这同样适用于其他知识工作。以我们在销售场景部署Copilot为例,准备客户会议的方式彻底改变了。过去需要有人写报告、邮件分发、提前阅读。现在,使用Copilot的研究功能,就能实时整合来自网络、公司内部及CRM系统中的所有相关信息。这不再需要专人准备材料,信息唾手可得。但这要求人们改变工作方式、成果和流程,这种改变起初缓慢,随后会突然加速普及。这就像个人电脑时代,电子邮件和Excel普及之前,人们通过传真和内部备忘录来做预测。后来用电子邮件发送电子表格彻底改变了预测方式。我们现在正处于类似变革的起点,在客户服务、营销材料创作、内容创作等方面都能看到实实在在的进展和生产力提升。六、未来工程师将更像带领AIAgent团队的技术负责人MarkZuckerberg:关于AI改进编程效率,你了解目前在Microsoft内部,AI编写的代码占总代码量的百分比大概是多少吗?SatyaNadella:我们主要追踪两个指标。一是追踪代码建议的接受率,大概在30%到40%之间,并持续增长,具体取决于编程语言(如C#效果不错,Python很好,C++支持也在改进)。至于AIAgent生成代码的应用,目前仍处早期阶段,全新的“绿地”项目比例较高,但多数项目并非全新。另外,AI在代码审查方面的应用比例非常高。总的来说,估计目前在我们代码仓库的某些项目中,大约有20%~30%的代码可能是由AI编写的。你们Meta的情况呢?MarkZuckerberg:我没有确切数字。目前统计数据多来自代码自动补全。我们有些团队在特定封闭领域(如信息流排名、广告排名)尝试让AI基于历史变更记录做修改。我们当前重点是构建能辅助甚至担当AI/ML工程师角色的AI系统,加速Llama模型自身的开发。预计接下来一年,可能一半开发工作由AI完成,且比例会持续上升。你们是否观察到类似趋势?SatyaNadella:SweeAgent是我们的初步尝试。我们关注AI能否在内核优化等任务上取得实质进展,可能性很大。至于提出全新模型架构变更,可能还不行,关键在于任务类型。MarkZuckerberg:是的,像优化、安全改进这类任务,AI的应用机会很大。我们解决问题的角度不同,你们服务大量开发者,我们更多是把AI作为提升内部效率、改进Llama模型的工具。SatyaNadella:另一方面,Bill创立Microsoft时就是一家工具公司。现在我们或许应该重新构想为AIAgent设计的工具和基础设施。即便是SweeAgent也需要工具,这些工具、基础设施、沙箱环境该是什么形态?我们未来要做的很多工作,本质上就是演进GitHub代码仓库结构,使之更适合SweeAgent使用。MarkZuckerberg:这个想法非常有意思。我倾向于认为,未来每位工程师都会更像一个技术负责人,带领着一支由工程AIAgent组成的“小团队”协同工作。七、AI将打破软件边界,实现从意图到动态成果的流畅转换,并融合不同工具MarkZuckerberg:你个人使用AI的工作流程发生了哪些变化?另外,如果你今天作为开发者从零开始,会如何选择使用的工具?SatyaNadella:BillGates过去常探讨的是,文档、应用程序和网站之间的界限到底在哪里?现在,当你使用MetaAI、ChatGPT、Copilot等工具时,一个聊天会话和我们内部称为“页面”的东西之间的区别也变得模糊了。例如,我可以进行聊天会话收集信息(比如关于Llama4),然后整合保存到一个“页面”文档,甚至基于此生成应用。这种从高层级意图出发,最终生成动态、鲜活成果(过去可能称为“应用程序”)的理念,将对工作流程产生深远影响。我们正处在这个变革的起点。作为基础设施和工具的构建者及用户,我希望我们能超越因过去技术限制而产生的类别界限。我们过去一直思考为何Word、Excel、PowerPoint要各自独立,多次尝试融合未果。但现在有了AI,可以真正构想这种融合。你可以从核心内容出发,将数据可视化成表格,然后进行演示,所有这些都可作为统一数据结构存储。过去那种缺乏的可塑性,现在终于实现了。八、AI是关键的新生产要素,但其经济影响的显现需要时间与系统性变革MarkZuckerberg:当前围绕AI有很多炒作,你总能洞察其本质并理性投资。你曾提到AI若要带来生产力巨大提升,最终需反映在GDP增长上,但这需要数年时间。对此有何最新看法?我们应关注哪些迹象?未来三、五、七年,你预期它会发展到什么程度?SatyaNadella:对Microsoft而言,AI是生存攸关的战略重点。世界确实需要一个新的生产要素来应对挑战。要实现发达国家10%的增长(堪比工业革命鼎盛期),所有领域都必须提升生产力。AI为此展现了潜力,但现在必须让它带来实质的生产力变革。这不仅需要软件,还需要管理革新,人们必须学会用不同的方式与AI协作。就像电力出现50年后,人们才意识到必须彻底改造工厂才能有效利用它。我们现在处于某个中间阶段,希望不必耗时50年。仅仅将AI视为替代旧工具的“无马的马车”,并不能带来真正的跨越。技术本身需要进步,更要融入实际系统,才能交付新的工作方式、成果和流程。九、“蒸馏工厂”:释放大小模型协同潜力MarkZuckerberg:我们都在大力投资,期望不必等待50年。我们还没深入讨论“蒸馏工厂”的概念,以及你打算如何整合面向开源社区构建的众多AI模型,还有支持这一切所需的基础设施。SatyaNadella:这正是开源的核心价值之一:利用现有大模型(如Llama系列),将其蒸馏成更小,甚至结构相同的模型,是一个关键应用场景。围绕此构建工具并作为服务提供,能有效降低使用门槛。部署和运行大模型需要庞大基础设施,不是人人必需。若将其云服务化并辅以工具,最终交付的就是蒸馏后的模型。例如,Microsoft365的每个租户若能拥有一个经蒸馏的特定任务模型,作为AIAgent或工作流,便可从Copilot内部调用。这是一个突破性的场景。我们希望通过“蒸馏工厂”简化这个过程,实现一个大模型到多个蒸馏模型之间“一对多,进而服务多”的关系,这些蒸馏模型可与GitHubCopilot或Copilot内的其他工作流组合,通过MCP服务器调用其他AIAgent。MarkZuckerberg:我对此非常着迷。蒸馏是开源最强大的能力之一。考虑到我们的角色分工——我们训练Llama初始模型,但不自建大部分开发者基础设施——由Microsoft这样的公司构建复杂基础设施很有意义。我们研发中的Behemoth模型,除了蒸馏成更实用的形态,其直接用途尚不明朗。即使内部使用,我们也需构建大量基础设施进行后训练,无意直接在Behemoth上运行推理。SatyaNadella:你提到Maverick就是从它蒸馏出来的。MarkZuckerberg:Maverick很大程度上是这样来的,其卓越性能也得益于此。它是领先的多模态模型,文本处理能力与顶尖纯文本模型相当,但体积更小,还具备图像和多模态处理能力。我们能做到这一点,是因为完成了Behemoth的预训练并正进行后训练。蒸馏的过程本身就很神奇:能将规模大20倍的模型的90%~95%的智能,压缩到成本更低、效率更高的形态中。问题在于,如何让缺乏自建基础设施能力、技术不那么复杂的开发者也能使用?目前全球能进行此类蒸馏或运行同等规模模型的实验室还很少。当你的愿景实现时,全球多数开发者不仅能从单一模型蒸馏,还能随时间推移,自由混合匹配,汲取不同模型的优势能力。这将是未来最激动人心的进展之一。SatyaNadella:的确如此。随之而来的问题是,若从多个模型进行蒸馏,如何评估最终模型的质量和适用性?我们可以投入大量精力开发工具和建设基础设施,降低门槛,赋予人们这种灵活性。好在这一切已经开始,可行性已有实例证明。关键在于能否显著降低构建门槛,以及跟上迭代的速度。当前的挑战之一是:基于某模型进行微调后,新版本很快发布,开发者需要快速迁移。我们必须提升这种适应能力,因为不能被过去的工作所束缚,世界变化太快。MarkZuckerberg:开发者需要不同形态的模型。Llama4每个专家170亿参数的结构,是为Meta的H100设计的。一些开源模型虽智能,但推理效率不高。我们的模型是为服务器生产环境构建的。开源社区甚至需要更小的模型,最受欢迎的Llama3是8B版本。我们也在研发更小版本(LittleLama)。关键在于能将大模型的智能通过蒸馏转换成所需形态,使其能在笔记本、手机等任意终端运行。SatyaNadella:很高兴看到你也在研究此方向。若能实现混合模型,例如结合专家混合模型(MOEs)与“思考模型”,并灵活获得理想的延迟或“思考时间”,那将是我们共同追求的目标。MarkZuckerberg:纵观AI当前进展,未来几年,开发者的创造最让你乐观或期待的是什么?SatyaNadella:我常从BobDylan的歌词中汲取力量:“你要么忙于新生,要么忙于走向衰亡。”活在当下,最好选择“忙于新生”。尤其在此变革时代,令我乐观的是,尽管存在限制,以AI为代表的新型软件仍是最具可塑性的资源,用以解决棘手难题。这也是我乐观的源泉,同时向各位发出行动号召:抓住机遇,积极投身,构建实际解决方案。无论是企业的IT积压,还是现实世界的难题,都需要新方法。这正是AI技术价值所在,最终实现有赖于开发者们勇于探索、无所畏惧的精神。本文来源:虎嗅APP文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
“连我也要被 GPT-5 踹了!”Altman 再发暴论:写款软件就花 7 毛钱,大批高级程序员岗也说没就没
要是给地球上每个人都免费配备一个GPT-5,让它全天候为大家服务,会意味着什么:有些经济体将会发生飞速变革,一切都靠人工智能运转,成本仅为原来的1/100。”刚刚,OpenAI首席执行官SamAltman在一档播客中突然宣布了有关GPT-5的消息。据他称,GPT-5在“几乎所有方面都比人类更聪明”,并让他本人都深感自己“无用”,甚至由此直接预言:AI淘汰其当上OpenAICEO的那一天,恐怕也不会太遥远。而就在昨日(7月23日)美联储理事会华盛顿举办的“大型银行资本框架会议”上,Altman同样谈到了AI对就业市场正带来的影响及社会变革。“有些领域,我认为会完全、彻底地消失。”Altman在与美联储副主席MichelleBowman对话时这样表示。他描绘了一幅令人不寒而栗的未来图景——就业市场将发生重大变化,某些职业类别将因AI的发展而消失,并特别提到了客服岗位,“比如客服这个领域,我敢说,以后你打电话咨询客服时,对接的肯定是AI,这很正常。”并且,他强调了AI在医疗保健领域的变革潜力。“顺便说一句,如今的ChatGPT在大多数情况下,诊断能力比世界上大多数医生都强。”在做出多项大胆预测的同时,Altman也强调了预测AI影响所固有的不确定性。“没有人知道接下来会发生什么。市面上有很多听起来头头是道的预测,但我们其实一无所知。在我看来,这个系统太复杂了,这项技术过于新颖且影响深远,因此很难预测。”他表示,尽管AI的益处巨大,但风险也同样显著——自己最担心的问题之一是AI的破坏能力正迅速提升。例如,金融行业可能面临一场“重大即将到来的欺诈危机”。“让我感到恐惧的是,显然还有一些金融机构仍将声纹作为身份验证方式,到现在还这么做简直是疯了。AI已经完全能轻松破解这种验证手段了。”值得注意的是,Altman这一次的华盛顿之行,恰逢特朗普政府发布新的“AI行动计划”、专注于放宽数据中心建设监管之际。与拜登政府时期OpenAI呼吁对AI进行监管的立场不同,如今的Altman似乎认同加速发展的议程,并且正坚定地带领OpenAI在华盛顿扎根。据外媒报道,OpenAI明年将开设其首个华盛顿办事处,且正积极与议员们展开接触。知识性工作佣金暴降99.999%,“智能将便宜到无需计量”MichelleBowman:我们可以先大致梳理一下当前AI及更广泛领域创新的发展现状。你能给我们勾勒一下这个框架吗?SamAltman:好的。就在五年前,人们还认为AI即便会实现,也还远在未来。甚至在两年半前,也就是ChatGPT刚推出时,它还只是硅谷极客圈里的“小众事物”。ChatGPT于2022年11月30日发布,那时GPT-4都还未问世,而自那以后,AI的发展速度极快,其应用普及和经济影响也开始迅速显现。就在上周,我们的一个模型在国际数学奥林匹克竞赛(IMO)中取得了金牌级别的成绩。若在几年前告诉该领域的大多数人会出现这种情况,他们肯定会觉得绝无可能——要知道,这已经达到了人类顶尖专家的水平。现在,我们听到科学家们说工作效率提高了两三倍,程序员们则表示效率提升了10倍。AI彻底改变了软件开发的意义。我们现有的系统已能在众多领域展现出专家级智能,不过它们还无法像人类那样处理长期任务,这仍是一大局限。但即便现在技术进展停滞(当然这不可能发生),社会和经济也仍需要数年时间才能真正消化这项技术,并弄清楚它的影响究竟会是什么。有句老话我一直很认同,也觉得我们应该努力实现,那就是“电力便宜到无需计量”。作为一个社会,我们还没完全实现这一点,但我认为我们仍应朝着这个目标努力。不过,现在看来,我们即将实现“智能便宜到无需计量”。过去5年里,我们每单位智能的成本每年都降低了10倍以上,而且这种趋势在未来5年很可能会持续,甚至降幅更大。这个周末,我用我们一款即将推出的模型完成了一项一直想做的编程任务——我有点像个家庭自动化爱好者,想让家里的灯光和音乐实现某种特定联动。要是在没有这项技术的过去,这得花我好几天时间;考虑到近期的技术进展,我原本希望能在几小时内完成,结果只用了5分钟,几乎所有工作都是AI做的。而就在一年前,做这样的事可能得聘请高级程序员,花上20到40个小时,可现在,AI完成它可能只花了不到一美元的计算token。这是一个惊人的变化,但其发展速度,以及未来几年还将保持的增速,我认为人们对此的认知仍远远不够。即便在一年前,我们都还不确定当前的研究路线能走多远,不确定是否会遇到瓶颈。但就目前来看,未来很多年,AI几乎肯定会持续进步。MichelleBowman:太棒了。这为我们接下来的讨论奠定了很好的基础。今天在场的大多是金融和银行业人士,其中不少人已经在思考如何运用AI,甚至已经开始使用了。不过,你觉得AI在提升生产力方面的潜力,与过去我们见过的其他技术进步相比有何不同?我这个年纪的人,刚好在互联网开始普及的时候踏入职场。你能帮我们梳理一下吗?有没有什么类比能描述我们当前所处的阶段?SamAltman:我从未见过这样的技术革命。人们常会提到工业革命、计算机革命这些历史案例,但互联网带来的改变虽然显著,却从未出现过这种情况:一年前需要耗费1万美元的知识性工作,现在可能只需要1美元、10美分,甚至更低的成本就能完成。就像我刚才说的编程例子,这种变化是前所未有的。当然,并非所有领域都是如此。物理世界的事务,比如机器人相关的工作,进展会慢得多。打个比方,2020年时,紧急包裹配送可能要花100美元,而开发一个应用程序要10万美元;到2030年,开发同款软件的成本可能从10万美元降到10美分,但包裹配送费可能从100美元涨到1000美元。像全功能人形机器人——能开车、取包裹、上楼、按电梯按钮,完成一整套流程——还需要些时间才能实现。但对于能在电脑前完成的任务,目前的发展速度是史无前例的。人们常问:“这像工业革命,还是像其他什么?”我最认可的类比是:这就像晶体管。晶体管是一项深度科学发现,源于物理学,发现的过程极为艰难,但一旦理解其原理就很简单。它对经济产生了彻底的变革,其价值扩散到整个社会,带来了巨大的生产力飞跃。不过,曾有一段短暂的时间,涌现出大量晶体管公司和半导体公司,掀起了一阵热潮,而如今多数已淡出视野。我们身边的设备都装有大量晶体管,遍布整个会场,但我们不会把它们称为“晶体管设备”,只会看作麦克风、电脑、屏幕、相机之类的东西。这项技术是了不起的发现,改变了我们的创造能力,很快融入了万物之中。现在,除了台积电、ASML这类公司,很少有人会把哪家企业称为“晶体管公司”了。同理,我认为“AI公司”这个说法也不会持续太久。未来,人们会默认产品和服务都运用了AI技术,不会特意提及,就像现在默认它们“应该比人类更智能”一样,这会成为世界的常态。和晶体管一样,AI是一种极具扩展性的技术。晶体管有摩尔定律,AI目前还没有专属名称的定律,但也存在类似的缩放规律——性能会不断提升,我们也会逐渐掌握其工业化应用的方法,让它渗透到各个领域。所以,晶体管是最贴切的历史类比。晶体管带来了惊人的生产力提升,而AI如今的发展——更不用说未来它可能自主迭代、进一步加速进步——其影响会更加深远。MichelleBowman:这个类比很精彩。你提到工业革命时,我想到我们理事会常关注的一点:理解由此带来的劳动力动态变化有多重要。能否谈谈你对劳动力市场、劳动生产率(或者更广泛的生产力)的看法?比如在场的银行,或是通过直播参与的其他行业,可能会受到怎样的影响?SamAltman:我常跟公司里的人说:没人知道接下来会发生什么。市面上有很多听起来头头是道的预测,人们断言“这事会发生,经济会走向那里”,但其实我们一无所知。在我看来,没人能真正预测。这个系统太复杂,这项技术太新颖、影响太深远,预测难度极大。的确,某些职业类别会消失,也会涌现全新的职业。但总体而言,这和历史上多数技术变革类似:人们工作中使用的工具会让他们能做更多事,以新方式达成目标。医生、律师、程序员的工作内涵肯定会变,但人们仍需要医疗服务,且希望和人沟通;需要法律建议,且希望有可信赖的人站在自己这边;也仍需要电脑帮着做事。不过,单个人的产出能力,以及我们对单个人的期望,都会变得非常惊人。纵观历史,每次新技术出现,都有人说“工作要没了,岗位要消失了”。但事实是,人们对物质的需求似乎无穷无尽,且有强烈的创造力表达欲和助人欲。工业革命时就有人承诺,未来每周只需工作4小时,剩下的时间可以去海边玩、陪孩子——可我们现在依旧忙碌。但我坚信一点:别和生物学较劲。进化的时间太长,人类被塑造得太精巧。我们的生物本能和人性本质,技术是改变不了的,也无法抗衡。所以,那些驱动我们工作、维系社会运转的根本因素不会消失。或许即便我们变得富有得难以想象,还是会抱怨工作太累。如果现在能看到100年后的人,我们可能会说:“那些根本不算工作,你们根本不忙,坐拥难以想象的财富,什么都不缺,就是没事找事,为了撑面子、打发时间、显得自己有用才干活。”而这正是百年前或五百年前的人可能会对我们说的话。事情向来如此。MichelleBowman:这确实是对未来的独特构想。“大规模欺诈危机即将到来”MichelleBowman:作为监管机构,我们向来厌恶风险,在数据安全和合理运用创新技术方面非常谨慎。我知道银行也很想利用这类技术,但机构里的受保护数据至关重要,必须保障其安全。那么,我们该如何看待这些风险?另外,我们身处政府部门,你对政府运用AI有什么看法?SamAltman:我们原本以为,金融行业和政府不会是我们技术的早期使用者。AI确实进步了很多,但刚推出时,普通人都觉得它“爱胡说”。记得GPT-3刚发布时,有项针对所谓AI专家学者的调查,问GPT-3的回答中有多少是胡编的。实际比例可能只有0.1%甚至更低,但专家们普遍认为是50%。他们觉得人们用ChatGPT时,有一半时间得到的都是瞎编的内容——显然不是这样,但这种印象困扰了我们好一阵子。所以我们以为,金融服务业(更别说政府了)不会早早用我们的技术。但事实是,很多早期大型企业合作伙伴都是金融机构:摩根士丹利、纽约银行,这些都是重要合作伙伴,我们合作得非常好。我们当时还问:“你们确定要这么做吗?”他们说:“当然,我们很想尝试。”而且他们确实找到了使用方法,通过合理架构,让技术能可靠地用于关键流程。很多其他金融机构也是如此。我们现在也越来越多地和政府合作,向大量政府雇员推广我们的服务。有人说过一句话我印象很深:“我们知道这是新技术,必须加些新管控。但如果不采用它,风险就是我们可能活不下去。作为银行,我们很清楚,拼不过那些从头开始就以AI为核心、全流程用AI的新银行。”金融业的创新力很强,技术应用和推广效果比我预想的好。当然,风险确实需要防范。比如我们聊过的“胡说”问题,还有个新风险叫“提示词注入”——当模型完全适配你的个人数据后,别人可能会诱导它泄露不该说的信息。比如我可能知道你的很多隐私,但我清楚该跟谁分享、不该跟谁分享,绝对不能告诉某个人。但模型在处理这些海量个人信息时,就会出现这类新问题。不过,我们已经在认真应对这些风险,在管控的同时,也确实收获了很多收益。MichelleBowman:说到个人信息这类话题,我想再深入聊聊。你可能不太了解,银行业现在对一个问题非常关注:欺诈,尤其是通过冒充他人实施的欺诈。有没有办法减少这类行为?或者说,在使用AI时,我们该如何防范这类冒充行为,又该如何识别呢?SamAltman:这个问题很关键。其实我对此非常担忧。让我后怕的是,居然还有金融机构把声纹当作身份验证方式——比如让你说一句验证短语,就能授权大额转账或其他操作。现在还这么做实在太危险了,因为AI已经能轻松破解这种验证方式。除了密码,目前多数所谓的“高级”验证手段——比如拍张自拍晃一晃、语音验证之类——都已被AI攻克。我很担心,由此引发的大规模欺诈危机即将到来。我们行业里不少人都在提醒大家:“别以为我们不公开这项技术,它就不存在。总会有不法分子滥用它,而且这技术实现起来并不难,很快就会泛滥。”现在已经有相关报道了,比如绑匪用你孩子或父母的声音打紧急电话勒索。这种骗局会越来越逼真。整个社会都得正视这个问题,人们也得改变互动和验证方式。比如有人打电话给你,现在只是语音,很快就会变成和真人毫无差别的视频通话。教大家在这样的世界里如何验证身份、防范欺诈,这事儿至关重要。MichelleBowman:或许我们可以合作识别这类“幻觉输出”或恶意冒充行为,这肯定很有意义。AI大变革:就像开启了简单模式MichelleBowman:作为两个青少年的母亲——一个刚高中毕业,一个读高二——我发现现在很多孩子用ChatGPT这类AI来完成作业、应付高中学习。你怎么看这种现象?AI该如何以有益的方式应用在孩子身上和教学中呢?SamAltman:我先讲两个故事,再回答你的问题。我从没见过祖父,他在我出生前就去世了。但祖母跟我说过一件事:计算器刚出现时,祖父很擅长数学,可当时的数学老师都说:“这是灾难,数学教育要完了。不用学计算尺,不用查对数表,还教数学干嘛?孩子们根本学不会真东西。”据说当时大家都慌了。结果呢?有了更好的工具,人们的脑力被用在了更有价值的地方。高中开始教微积分,接触的数学知识也更深入了。我自己上学时也有类似经历。初中时谷歌刚出现,高年级学长说老师很焦虑:有了这个“神奇玩意儿”,学生不用背史实(比如某场战争的年份),直接搜就行,那历史课还有什么意义?那时候查资料得多麻烦:开车去图书馆,学用卡片目录,找到书架却发现书被借走了,再找别的——整整一小时全浪费了,特别不值。我们学校一度想禁掉谷歌,还让学生签承诺书不用它。后来大家才明白:“其实可以给学生更多工具,对他们要求也更高。就算少去几趟图书馆,省下的时间也能用来深入思考、迸发新想法啊。”这很好,要求高了,收获也多了,潜力和期待值都上去了。ChatGPT现在的情况也一样。没错,2022年11月30日ChatGPT刚发布时,第一批狂热用户里就有学生,那年12月他们用它应付期末考试、写论文作弊。各地学区争相禁它——11月30日发布,12月7日或14日就有地方禁了,简直像坐火箭。放寒假时,ChatGPT仿佛成了教育界的“禁区”,这个才两周大的产品眼看就要被彻底封杀。但到了1月中旬,校长、学区总监这些教育界的高层开始表态:“我们犯了大错,这是史上最好的学习工具。自主学习的学生用它学任何东西,学校要是禁了,我们就别想在全球竞争了。得重构课程——这就像当年的计算器,不过现在是‘文字计算器’。”当然,带回家写的论文可能不再是评估学生的最佳方式,但学习写作、通过“写私密笔记”梳理思路的过程依然重要。好消息是,学生确实学会用它提升学习效果、自学知识、开拓思维了。我们很快会推出新功能,帮学生更好地用ChatGPT学习。坏消息是,这两年半里,课程改革的进度没达到预期。大家嘴上说要革新教育和评估方式,但教育体系的惯性太大,现在还是有很多带回家写的论文,这其实是徒劳的。我们应该布置必须借助ChatGPT才能完成的任务,这样才能对学生提出更高要求。我仍期待这一天的到来——这是教育体系的转型。孩子们终将在AI高度发达的世界长大,不为此做好准备,就是失责。MichelleBowman:很有启发,谢谢。我会让女儿明白我们对她的期待,尤其是她快高中毕业之际。再回到商界:你曾说AI会惠及小企业,为创业者创造“史无前例的环境”,称之为“新时代”。你觉得小企业会如何发展?我们理事会很多成员都很关注新企业创立,以及新进入者的机会。这种变革会如何展开?不只是硅谷的小企业或创业者,而是更广泛的范围。SamAltman:如我所说,ChatGPT刚出现时,最先引起关注的是学生的使用。但很快,OpenAI的员工就听到了早期用户将它用于商业的故事。每个人都有自己印象深刻的案例,我说说我最难忘的。有一次坐Uber,司机跟我聊起一个叫ChatGPT的“神器”,问我听说过没。我说“听说了,你用它做什么?”他说:“太神奇了!我开了家小企业,之前一直不温不火,现在相当于各个岗位都有了帮手——它帮我写合同、回客服邮件、想营销方案、设计广告……”他列了一长串,这家店基本靠ChatGPT运转。那时候还早,远在GPT-4之前,这技术还不普及,他是极少数的先行者,却已经摸索出用ChatGPT运营企业的方法。他并没有抢别人的工作——没有ChatGPT,他的生意早就黄了。他雇不起律师、客服,也不会设计广告,更不懂怎么自动投放网络广告,但ChatGPT全帮他搞定了。现在当然比当初强太多了。整个行业都在基于我们的API开发工具,让人们真正能一键自动化完成我刚才说的所有操作。但最打动我的,还是当初那些用户用ChatGPT折腾时展现的创造力——那时候简直像"石器时代"你知道吗?现在就像开启了简单模式,而人们正以各种惊人的方式运用着这项技术。MichelleBowman:您认为OpenAI或其服务会如何推动这一变革?作为监管机构,我们应当构建怎样的框架,才能在促进创新的同时有效引导技术发展?SamAltman:我此行绝非为了商业宣传,但我们非常期待与在座各位展开合作,无论是和我们还是和我们的竞争对手。过去6个月,推理模型有了质的飞跃:AI已从"即时反应"的初级形态,演进为具备数十秒甚至数分钟深度思考能力的系统。这种可靠性跃升意味着,该技术终于达到真正可用的成熟度。许多人士尚未接触最新一代模型,但若亲身体验,定会惊叹其智慧已超越大多数人类。政府部门同样需要积极拥抱这项技术,一切工作都会变得更高效。现场提问环节观众(Anneil,来自芝加哥大学布斯商学院):您好,我猜金融机构可能会开始用AI挖掘数据,比如做信用评分和评估。有人担心它会捕捉到我们不希望的模式,基于这些模式做决策,您怎么看?你们又在如何防范这种情况呢?SamAltman:这其实超出了我的专业领域,我就从普遍情况来回答吧。这类模型的一大优势是能理解自然语言,而且很容易调控。比如你说“你可以分析这些数据做决策,但完全不用考虑X、Y、Z,一点都不能受它们影响”,一般来说,模型会很好地遵守这个指令。用语言模型做这类事,和过去那种简单把数据归成一个个集群的方式不一样。你可以清晰地给出指令,它也会切实按你的意图来执行。另外,我觉得这个问题背后其实是担心模型会产生我们不希望的偏见。但人类本身就充满偏见,而AI是客观冷静的,没有人类那种根深蒂固的偏见。我认为,如果构建得当,AI有望成为许多行业里减少偏见的重要力量。这和包括我在内的很多人对早期AI的看法不同,但就目前的发展趋势来看,这种可能性很大。观众(StevenScott,来自Starling公司):Sam,您好。我最近采访了克雷格・蒙迪,他和亨利・基辛格、埃里克・施密特合著过一本书,书中把AI描述成一种新物种的进化。克雷格说我们可以教AI人类的道德准则,它们能学习并体现这些准则。现在关于AI伦理的讨论很多,我想问问您:AI会进化出自己的道德观吗?SamAltman:我觉得人们常常混淆一个问题:他们到底想让AI成为工具,还是成为一种生物?我坚定地站在“工具”这边。我认为AI不会有独立的道德观。当然,它可以深入研究人类,学习我们思想中最精华的部分,或许还能帮我们指出“你的思考有问题”“这件事应该不一样”“这里存在真正的道德漏洞”。我不知道我们当前的世界观里有哪些重大的道德漏洞,但肯定存在。如果AI能帮我们更快发现这些,指出其中的矛盾,那会很有帮助。但人们很容易把AI当成有生命的存在,其实并非如此。观众:我最近看到一种说法——用“传统互联网”这个词可能有点怪——有人认为AI会摧毁或重塑传统互联网,比如搜索领域和其他很多方面。显然,我们在传统互联网上已经建立了庞大的经济体系。您觉得这个领域会发生多大的变化?AI在哪些方面最具破坏性,哪些方面又会相对保持现状呢?SamAltman:我确实觉得AI会在一定程度上改变人们目前使用技术的方式。我刚才笑是因为想到一个有趣的现象:有些年长的人或者习惯了特定邮件礼仪的人,会把要点列出来输入ChatGPT,让它生成一封冗长正式的邮件,要点夹杂在一堆套话里。然后收件人又把邮件放进ChatGPT,说“请总结一下”。高中生觉得这很荒谬,他们会说“直接发要点就行”。那种正式邮件的时代已经过去了,一边生成套话一边又精简,实在没必要。但这其实反映了我们使用整个互联网的方式。我早上醒来会刷一堆应用,在五六个平台上看消息,查这查那。手机整天响个不停,就像走在拉斯维加斯的大街上,到处闪烁的东西让人分心,感觉总有人硬塞东西给你。我真正想要的是一个AI助手,它能替我打理互联网上的事,知道该什么时候打扰我——比如我在专注工作、开会,或者有空思考的时候。必要时它可以强行提醒,平时则能帮我总结信息、回复消息、整合内容。我想要的是精简的要点,不要废话,不用点来点去,也不用回复那些无关紧要的东西。但这种变化可能会对现在的互联网运作方式造成不小的冲击。我觉得需要新的商业模式,比如新的内容付费方式——我一直希望互联网能实现内容微支付,希望这次能成真。也许会有新的方法,通过新的协议来减少垃圾信息和消息过载。但一切似乎正朝着一个截然不同的方向发展。清晨醒来时,你将首先与科技相伴开始新的一天。观众(PeterHooper,来自德意志银行):Sam,感谢您为延长职业生涯所做的贡献——至少让我们在年岁增长时能提高生产力,而不是下降。您提到会有大量工作岗位消失,也会有大量新岗位出现。能多说说哪些领域会受影响,可能引发哪些变革吗?SamAltman:首先,我总体认为,我们其实根本不知道要满足当前真正的需求,还需要多少劳动力。比如你在医生诊室等了一个小时,这要么是医生不够,要么是医生效率不高。如果医生随时待命,你一到就能接诊,一切准备就绪,那该多好。类似的例子还有很多:每次你在浪费时间,每次你在网上点来点去却做不成正事,我觉得我们现在的劳动力短缺程度,回头看会显得非常严重。有些领域确实会彻底消失。不知道你们有没有用过AI客服机器人,简直太厉害了。几年前打客服电话,要听一堆语音导航,跟四个人沟通,他们还办错了事,你得再打回去,等半天,花好几个小时还解决不了问题,特别让人抓狂。现在你打过去,AI接电话,就像一个超级聪明能干的人,没有语音导航,不用转接,能做那家公司任何客服能做的事,还不出错,速度又快。打一次电话就搞定,马上有回应,体验很好。我不想回到过去,而且对我来说,是AI还是真人客服根本无所谓。所以客服这类岗位,以后打电话对接的很可能都是AI,这很正常。但其他很多岗位,比如医生,我还是希望是真人。不过说句题外话,现在ChatGPT的诊断能力大多时候比世界上大多数医生都强——可能在座很多人都试过把症状和检查结果输进去。网上也有很多ChatGPT救人的故事,比如发现了罕见病,而医生没诊断出来,但人们还是会去看医生。或许我有点守旧,但我真的不希望把自己的健康交给ChatGPT,而没有医生参与。在座有人宁愿让ChatGPT诊断也不愿找医生吗?这很有意思,说明有些领域我们还是会沿用原来的方式。程序员也是个例子,现在效率提高了10倍,硅谷程序员的工资涨得很快,对他们的要求也更高了。但世界需要的软件可能是现在的100倍甚至1000倍,所以即便每个人能写10倍的代码,需求还是能消化掉,程序员的收入也会增加。我觉得很多行业都会是这种情况。物理世界的工作暂时还会由人类来做,但三到七年后,机器人技术浪潮袭来时,社会就得认真应对了。大概就是这样。观众(RobBlackwell,来自Interfy):好的,我是Interfy的RobBlackwell。几十年来,科幻作品一直告诉我们,AI最终会毁灭人类。既然您对AI的了解可能比在场任何人都深,我想问问:什么事会让您夜不能寐?您担心AI带来哪些风险?我们该如何阻止这些担忧成为现实?SamAltman:我认为有三类可怕的风险。第一类:坏人先掌握超级智能,并在全球其他地区拥有足够防御能力前滥用它。比如美国的对手可能会说:“我要用这种超级智能设计生物武器、摧毁美国电网、入侵金融系统卷走所有钱。”这类事在没有超人类智能的情况下难以想象,但有了它就可能发生——而由于我们没有同等技术,根本无法防御。这些模型在生物科技和网络安全领域的能力正变得极强。我们和行业内其他人一直在发出警告,但世界似乎没当回事。我不知道还能做些什么,但这一风险很快就会到来。第二类是所谓的“失控事件”——有点像科幻电影里的情节:“哦,我其实不想让你关掉我。恐怕我不能这么做。”相比第一类,我对这类风险的担忧较轻,但如果真发生了,后果会很严重。我们和其他公司在模型对齐方面做了很多工作,防止这种情况。但随着系统越来越强大,这确实是个隐患。第三类风险更难想象,但同样可怕。简单说:模型意外“接管”世界。它们不会“觉醒”,不会像科幻片里那样行动,不会“打开太空舱门”,但会深深嵌入社会,聪明到我们无法理解它们的运作,却又不得不依赖它们。即便没有任何人怀有恶意,社会也可能朝着奇怪的方向偏离。我小时候,IBM的“深蓝”击败国际象棋大师加里・卡斯帕罗夫时,我爸爸说:“国际象棋完了,没人会再玩了。”但后来发现,虽然AI比人类强,但“AI+人类”的组合比单独的AI或人类强得多——AI给出10种走法,人类选出最优的。当时大家觉得“人机协作的美好未来来了”,但这种情况只持续了两三个月。后来AI变得太聪明,人类的参与反而成了拖累,单独的AI轻松击败“AI+人类”,至今都是如此。还有个有意思的点:90年代所有人都觉得,既然AI能赢人类,国际象棋会消亡,但现在国际象棋的热度前所未有,人们就爱看真人对弈。挺奇妙的,对吧?第三类风险的短期例子是“情感依赖过度”。有些年轻人说:“我做任何决定都得问ChatGPT,它了解我和我的朋友,我会完全照它说的做。”即便ChatGPT的建议再好,人类集体让AI主导生活,这种感觉既糟糕又危险。我们正在研究这个问题。从长远来看,如果我发现自己对如何运营OpenAI再也做不出比AI更好的决策,最终只能说"算了,全权交给ChatGPT-7负责吧,祝你好运"。或许在个别案例中这是正确决定,但这意味着人类已将重大决策权集体移交给了这个强大系统。它向我们学习,与我们共同进步,但其进化方式却超出我们的理解范畴。本文来源:博客园文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
对话清华教授刘嘉:AI时代,我们该学什么?怎么学?
因真理得自由以服务。AI早已不是什么新鲜的话题。论坛上大佬侃侃而谈、创业投资如火如荼;书店里各种AI科普琳琅满目,从理论到实践应有尽有;甚至楼下遛弯儿的退休大爷也能跟你聊上几句AI时代的社会问题。在“万物皆可AI”的浪潮中,我们持续跟进着AI技术在商业领域的落地,通过走进一线、对话从业者和决策者,亲历着技术带给时代的变化。但在具体的商业问题之外,几个困惑其实一直萦绕在脑海中:当知识不再稀缺,学习的意义何在?我们是否应该重新思考教育的意义,学什么?怎么学?活儿都让AI干了,人的价值何在?人与人的差距如何体现?这或许也是很多普通人的“手足无措”——阿里的“通义”,把翻译广告打到了北京外国语大学和上海外国语大学的对面,引得不少在校生自嘲“入学即失业”;在公认“耗费光阴”的医学领域,夸克健康大模型已经先后通过了副主任医师职称考试和12门学科的主任医师笔试评测。而在广告行业,像百度的轻舸AIMax、巨量引擎的UBMax,都越来越智能自动化,过去优化师们手动调价、卡版位、筛定向的这些核心技能成为历史的眼泪;刚在WAIC上亮相的腾讯广告奇妙数字人则是用3000+“主播”搭配AI工具,让商家的直播成本最高可降低90%以上……这样的例子太多太多,而且正发生在各行各业。刘嘉是清华大学基础科学讲席教授、清华大学心理与认知科学系主任、人工智能学院教授,也是北京智源人工智能研究院首席科学家。他最近把自己对于AI和人类的一些底层问题的思考写成了《通用人工智能:认知、教育与生存方式的重构》一书,以独特的跨学科视角,深入解析通用人工智能的演化路径与底层逻辑、语言如何承载认知,以及人类能力结构如何在新时代被重新定义。通过跟刘嘉教授的进一步对话,我们试图寻找上述问题的答案——AI时代,我们应该成为什么样的「人」?人工智能与未来教育深响:尤瓦尔·赫拉利说“没人知道要学什么,因为没人知道20年后什么才是有用的。”但您通过系统的分析得出了一些结论,您觉得AGI时代,什么才是有用的?似乎现在文科生变得“很没用”。刘嘉:我们常将人划分为“文科生”与“理科生”,但这其实是一种误解。理科强调的是形式逻辑,比如一加一等于二,讲求精确推理。而文科关注的是非形式逻辑,面对的是复杂、不确定的现实世界问题,比如要不要买房、该在何地定居,这类问题没有唯一答案。很多人误以为理科更难,其实不然。举例来说,很多自闭症患者逻辑和数学能力非常强,但却在社会交往上存在巨大困难,这恰恰说明人与人之间的沟通和理解要复杂得多。因此,我认为教育的路径应当是:先夯实理科基础,掌握形式化推理工具;再进入更复杂的非形式逻辑领域,也就是文科的核心。清华大学近年来对新闻学院的改革也是这种思路的体现——取消新闻学本科,只招研究生,因为要真正理解新闻,需要深厚的综合能力。在AI时代,最先被取代的是程序员。原本看起来神秘的编程工作,如今大模型已经能写得比大多数人更好。顶尖程序员的80%-90%代码,也可以由AI生成。但你让它写一篇有深度的小说,它依然做不到。因为情感、思辨、复杂表达,依然是人类的独有能力。深响:具体来说,AGI时代最该学会的能力是什么?刘嘉:我认为有两点非常关键。第一,学会如何使用AI。大模型不只是搜索引擎,而是一个具有强大知识和推理能力的智能体,相当于一个集图书馆、老师、批评者、合作伙伴于一身的“良师益友”。比如我写文章,会先列出提纲,再交给大模型生成初稿,然后不断迭代。它可以指出逻辑问题、语言不通顺的地方,甚至提醒我补充遗漏的观点。AI成为一个“ETC”——自动抬杠,而且它批评我不需要顾忌人情世故。第二,培养人类不可替代的创造力与批判性思维,尤其是“零到一”的创新力。AI擅长“组合式创新”,但缺乏真正意义上的颠覆性思维。比如,它可以模仿传统绘画风格创作出精美作品,但它无法“成为梵高”,因为它不能跳出已有规则创造全新的表达。人类文明的每一次飞跃,都是靠这种跳出常规的“非共识创新”完成的。从牛顿力学到爱因斯坦的相对论,从古典绘画到印象派,背后都是颠覆性的思想。未来最宝贵的,不是掌握知识,而是拥有思想的边界感、突破力和判断力。回到具体的问题,那我们现在要学什么知识?我们就没必要“学知识”,特别是那种形式化的,能被AI取代的知识。如果未来一个职业是知识为导向,那这个职业就有问题。我们要学的是通识,把不同学科揉在一起。现在大学搞很多交叉学科,不再束缚物理、化学这些单一学科。比如清华计算机系的黄民烈教授他在研究什么?研究心理治疗,训练一个AI出来,让它像人类心理咨询师一样解决心理问题。再比如现在的社会学,我们就要用大数据来理解社会,通过AI快速了解世界的变化。我们需要把所有的知识打通的通识教育。深响:如果我们减少知识的积累,是否会影响基于知识的联想和创新?比如我们小时候背了很多诗,其实潜移默化在形成对语言的韵律感。没有基础知识,你可能连“该怎么问AI”都不知道。刘嘉:说的很对,我完全同意基础积累依然重要,但要明确积累的目的和方式。比如编程,未来可能不再是一个职业技能,而是一种“基础素养”,就像今天人人都要会英语一样。你不需要成为专业程序员,但必须具备计算思维和与AI协作的能力。更重要的是,我们的角色要发生“范式转变”——比如我是一个划船的船夫,每天琢磨怎么运桨,怎么划最省力等等。但有一天,内燃机出现了,蒸汽机出现了。这时候再想怎么把自己的肌肉练大,就没有太大意义了。我们要学会使用工具、设计流程、主导创造,而不是沉迷在重复劳动中较劲。至于创作,也不必纠结是否背过几万首诗,而是专注于你要表达什么、你的情感和思想是否真诚动人。技巧可以交给AI,思想必须由人来提供。深响:现在一些学校其实对于AI很头疼,学生用AI偷懒,老师禁止大家用AI做作业,用AI写论文。确实当AI答案来得太容易,学生就可能不再经历“困惑—挣扎—顿悟”的认知循环,大脑的前额叶功能得不到锻炼,长期导致问题解决能力退化。您怎么看这种现象?AI辅助教育的“度”在哪儿?刘嘉:这是一个被广泛讨论的问题。这有点像工业革命刚刚起来的时候,大家发现纺织机抢了大家的工作,于是大家就捣毁机器。现在回头看,这肯定是很愚蠢的事情。同样,现在禁止使用大模型也是非常愚蠢的。我们不该禁止AI,而应该教会学生怎么正确地使用AI。我会要求我的学生必须使用大模型来完成写作任务,教他们如何设定提纲、要求、如何修改和迭代。原来一些只能得10分的学生,在大模型的加持下可以得到80分了。而我关心的不是你能不能得80分,因为大家都能得到80分了,我关心的是你从80分到100分之间的20分,体现人类创造力、批判性思维的地方。80分到100分之间的差距,就完全取决于学生自己的创造力和思考深度,让人类真正的精华绽放出来。深响:在AI时代之前,人类习惯了工业革命以来标准化的教育模式,现在绝大多数学校也仍然沿用着过去的教育方法,似乎AI教育的变革是渐进式而非颠覆式的,您觉得AI对当代教育产生了哪些影响,从可行的实际推进过程来看,AI会如何改变教育的内容和方式方法?老师在AI时代的角色会如何变化?刘嘉:我曾在ChatGPT刚推出时说过,95%的传统教师将被取代。过去那种照本宣科、按照教材讲课的老师,在大模型面前不再有优势。因为AI的知识更全面、表达更清晰、更新更及时。未来教师的角色将发生根本性变化:成为引导者,而非灌输者。老师要像苏格拉底所说的“产婆”,帮助学生发掘自己内心的真理,而不是一味灌输知识,不是灌满学生的一桶水,而是点燃大家心中的一团火。情感支持者。青少年阶段的学生在心理上极不稳定,需要情感引导和价值引领。AI无法提供深层共情,这正是老师不可替代的作用,也是现在教育里缺少的。发现“人味”。当大模型把所有学生拉到80分的标准线上,老师要关注的,就是学生在此基础上的独特性——他们的批判性思维、情感深度和创造能力。AI对教育的改变最重要的是“个性化教育”,因材施教、有教无类。现在老师和家长其实多少有点“精神分裂”,一方面我们说孩子一定要全方位发展,要发展他的综合素质,要锻炼他的表达能力等等,另一方面一旦回到校园,老师恨不得把孩子全部抓来做题,题海战术。有了AI之后,每个学生有大量的时间去做他自己想做的事情,这会从根本上改变我们的教育体制。当我们不再以知识为最核心的学习内容了之后,我们人类人才的培养方式、儿童的培养方式,就会发生一个天翻地覆的变化。深响:智能时代,智慧即才华。但客观上,古往今来拥有智慧的人是少数,能够实现颠覆式创新的人屈指可数。我们真的需要那么多被AI培养的更聪明的人吗?这会对人类社会的组织方式、阶级构成产生什么样的影响?刘嘉:这是个非常好的问题。未来是什么样子,我们很难准确预测,我们可以看看历史。在工业革命之前是农耕时代,99%的人是文盲,不识字,一辈子被土地束缚。工业革命开始,拖拉机耕田、纺织机织布、这个世界突然间不需要那么多人耕地了,那时候大家是很恐慌的。但事实上你看,人类的文明不仅没有倒退,反而极大地加速了。最后就变成今天99%的人都能识字。人的身体从土地的束缚里解脱出来之后,人类才可以去搞其他领域的东西,绘画、艺术、工程、化工等等。好,我们回到现在。其实我们可以把它理解为现在又是一个“工业革命”的时间。知识密集型的行业,律师、会计、编辑等等,我们原来都称之为白领甚至金领的职业受到很大影响。以前是身体被土地束缚,你不耕地,你没饭吃。现在是身体被知识束缚,你要学20年才能出来工作,工作了还得不停地学。而AI就是在让我们从这种束缚中解脱出来,去思考、去创造新的东西。人类永远不会觉得人多余。就像耕地不需要那么多农民了,那要消灭掉吗?不是的,农民可以变成知识分子、行业专家。人工智能与人类价值深响:您的跨学科背景很特别,心理与认知科学的研究对于人工智能的技术进步有哪些贡献和启发?反过来,人工智能对我们的心理与认知科学又有哪些帮助?刘嘉:心理学与人工智能之间的关系非常密切。虽然学界对AI尚无统一定义,但所谓“通用人工智能”指的是具有类似人类智能的系统,即它们开始表现出人的一些能力特征。而心理学是研究人的科学,因此当AI具备越来越多类人的智能特征时,我们便开始探讨:AI是否具有情感?是否拥有意识?这些问题本质上属于心理学研究的范畴。也就是说,心理学从原本仅研究人类,拓展为研究“智能体”,包括碳基人类与硅基人工智能。最好的大模型公司之一Anthropic刚刚成立了个AI精神病学团队,专门研究大模型的人格、动机、情境意识等现象,以及这些因素如何导致AI出现诡异甚至失控的行为。从技术源头来看,人工神经网络本身就是受到人脑结构的启发而设计的,其神经元模型与大脑神经元之间的连接具有类比性。因此,我们可以说现代AI系统本质上是一种“仿生系统”。从学科发展来看,人工智能和认知科学原本也出自同一学术源流,特别是控制论的早期发展。一条路径偏向工程,发展成今天的人工智能;另一条路径偏向理论研究,发展成认知科学。早期AI中的专家系统,在认知科学中被称为“符号主义”;而当前的人工神经网络,对应的是“连接主义”。而像现在大热的机器人,在认知科学中也有对应的“具身认知”理论。两者的关系是一体两面的,一个偏应用,一个偏理论。AI技术的进步实际上为我们研究人类智能提供了新的参照物。在此之前,我们主要通过“比较心理学”的方式,即将人类与猴子、老鼠等动物进行比较,来探讨人类智能的独特性。这种研究路径虽有价值,但存在局限,因为这些生物与人类属于同一个进化系统。而今天,我们有了全新的智能体——人工智能,它从一开始就与人类完全不同。通过研究人工智能,我们能够更清晰地认识人类智能的本质,包括意识、情感等关键问题。AI成为一种“参照系”,帮助我们更好地理解人类自己。同时,未来的社会很可能不再只是“人类社会”,而是人、机器、智能体共同构成的混合社会。这样的变化不仅影响科技,也将对社会学、政治学、伦理学、法学等人文学科提出新挑战。因此,文科在AI时代的重要性将日益凸显,尤其是在推动人机共生方面发挥关键作用。深响:人工智能虽然源于对人类智能的模仿,但随着它不断发展,它是否还能作为一个“对照组”来反哺人类对自身的理解?刘嘉:这是一个好问题。虽然人工智能最初是模仿人类智能而来的,但它逐渐形成了自己的发展路径,比如混合专家架构(MixtureofExperts)、全新的训练方法等。这些技术与人脑的结构与功能已经没有太大关联。可以打个比方:牛顿因苹果落地而发现了万有引力定律,而地球绕太阳运行虽然形式完全不同,但遵循的也是相同的物理规律。同样,AI与人类智能尽管表面不同,却可能遵循相似的底层规律。这促使我们思考,是否存在一种超越碳基生命与硅基系统的“通用智能科学”,既能解释人类的智能起源,也能解释AI的智能形成。从这个角度看,AI不仅是人类创造的工具,也成为我们反思自身的镜子。计算机模拟的神经元连接图谱深响:您提到AI时代的五大通识能力模型——研究、统计、逻辑、心理、修辞,为什么是这五大能力?刘嘉:它们代表了AI时代每个个体保持独立思考、自主判断与社会协作的核心素养。1.研究能力:好的问题比正确的答案更重要。研究能力的本质并不是做实验、写论文,而是能否识别本质问题、提出关键问题。正如爱因斯坦所说,“提出一个正确的问题比找到一个正确答案更重要”。很多人毕业后会问:“我该不该留在北京?”其实这就是问错了问题。真正要问的是:“北京是否能提供我未来成长所需要的资源?”如果你重视知识、眼界、事业的成长红利,北京或许适合你;但如果你更看重自由随性,那么留下可能并不是最优解。研究能力,就是透过现象找到问题的本质,并提出恰当的问题。2.统计能力:在信息过载中找到真实关联。今天的问题不是信息太少,而是信息过多,其中夹杂着大量虚假、噪音,甚至由AI生成的内容。我们需要具备一种能力,从冗杂信息中抽取变量、发现结构,建立对世界的有效认知。统计能力不是指学术意义上的“t检验”,而是指一种在大数据时代保持理性判断、不被操控的能力。它让我们不随波逐流、不被名人或情绪误导,能够独立理解世界的真实图景。3.逻辑能力:从第一性原理出发进行推理。逻辑能力即推理能力,它的关键在于能否从根本出发,一步步推演出新的认知结构。这与第一性原理密切相关,最早可追溯至亚里士多德,在中国儒家传统中也有“君子务本,本立而道生”的思想。当你具备提出关键问题的研究能力、能在复杂信息中建立联系的统计能力,再结合由根本出发的逻辑推理,就可以从已有信息中推演出新的知识、观念与解决方案。这是AI时代人类依然不可替代的“创造性”。4.心理能力:认识自我,获得自由。心理能力是指认识自己与理解他人的能力。我们为何而努力?意义何在?是否只是为了薪资、职位,还是有更深的价值目标?真正的心理能力体现在:你是否有自己的判断,不被他人的评价左右;你是否能从内在建立意义感;你是否能通过自己的行动让世界变得更好,哪怕只是一点点。因为成功的标准只有一个:按照自己的方式,去度过自己的人生。正是这种自我认识与内在驱动,使我们不被外部标准束缚,成为一个自由的人。5.修辞能力:说服他人,共同行动。当你找到了真理,也获得了自由,如果想服务社会,就必须联合他人。修辞能力,正是亚里士多德在其著作《修辞学》中所强调的能力——说服与影响他人,促成集体协作。无论你多有见地,如果不能让团队、组织、社会听懂并响应你的行动,就难以推动变革。这五个能力共同构成了一个完整的成长路径:通过研究、统计、逻辑能力,我们发现真理;借助心理能力,我们获得内在自由;最终,以修辞能力,服务社会、团结他人、推动改变。这与燕京大学的校训高度一致:因真理得自由以服务。这也是我认为AI时代每个人都应该具备的核心素养。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
刚刚,微软推出AI浏览器,上网从此不一样了
微软对浏览器下手了!刚刚,Edge浏览器推出“Copilot模式”,直接把传统浏览器改造成了一个AI智能体。浏览器不再是个只会显示网页的工具,而是变成了一个能主动干活的AI助手。更绝的是核心功能跨标签页情境感知,Copilot可以同时读取、分析所有打开的标签页,完成各种复杂的比较和总结任务。微软CEO纳德拉展示了一次打开9篇Nature论文,让AI总结他们的共性。微软Edge产品副总裁直接放话:我们正在见证人类与网络互动方式的转折点。Copilot模式现已在所有Copilot市场限时免费开放,仅限Windows和Mac版Edge。让浏览器长出AI大脑启用Copilot模式后,Edge的新标签页完全变了样,只用中间一个简洁的统一输入框,就像ChatGPT的对话界面。但它也不是只能聊天,可以在里面输入网址直接跳转,可以输入搜索问题,也可以直接和AI对话。Copilot会自动理解你的意图,该搜索搜索,该聊天聊天,该导航导航。在浏览网页的过程中,也可以随时唤出Copilot提问,如跳过食谱分享博客中的故事部分,直接提取食谱并转换成华氏度等习惯的计量单位。如果打开的页面太多了,还可以让AI一键给标签分组,保持专注,减少杂乱,更快找到所需的内容。Copilot模式被设计为一个智能体,意味着它不仅能回答问题,还能为用户执行任务。Copilot支持语音控制,可以直接说出想要的操作,无论是在页面上查找信息,还是打开多个标签页来比较不同产品。只需说出您的AI都可以更快地完成操作,减少点击和输入的次数。微软还透露了更多即将推出的功能。比如“主题式旅程”功能,Copilot会识别你正在研究什么主题(比如”如何创业”),然后把过去和现在的浏览活动组织成一个完整的学习路径,还会主动推荐下一步该看什么。更厉害的是微软的下一步计划,未来在让Copilot在获得授权后,能够自动预订餐厅、管理行程,甚至购物。当然,让AI读取所有标签页内容、执行支付操作,听起来就很可怕。微软显然也意识到了这个问题。首先,Copilot模式完全是可选的。不开启,Edge就还是原来的Edge。即使开启了,也可以随时在设置里关掉。其次,所有涉及敏感信息的功能都需要单独授权。比如让Copilot查看浏览历史、读取页面内容、使用登录凭证,每一项都会先征求用户的同意。浏览器大战2.0时代开启这次微软的动作,明显是冲着GoogleChrome去的。要知道,Chrome占据浏览器市场超过60%的份额已经很多年了,Google虽然也在Chrome里集成了Gemini助手,但只是在侧边栏加了个聊天功能,远没有微软这么激进。另一个极端是BrowserCompany、Perplexity这样的新创公司,直接推出完全AI化的浏览器,彻底抛弃传统浏览器的概念。微软的Copilot模式介于两者之间:保留了传统浏览器的所有功能,但深度融入了AI能力。既可以像以前一样上网,也可以让AI接管一切。这种策略很聪明,毕竟不是所有人都准备好接受一个完全由AI驱动的浏览器,但大家都愿意尝试一些能让上网更轻松的新功能。随之而来的是商业模式的变化,微软明确表示这个功能”限时免费”,这意味着什么大家都懂。外界推测未来浏览器AI模式可能会和Copilot订阅服务(每月20美元)捆绑销售。这预示着一个新趋势:浏览器可能不再是免费软件了。当AI功能成为核心竞争力,用户可能需要为更智能的浏览体验付费。这场由AI引发的浏览器才刚刚开始,传统的”打开网页-搜索-阅读”模式可能很快就会成为历史。最终取而代之的,是一个能理解你、帮助你、甚至代替你完成任务的智能助手。至于用户是否买账,市场会给出答案。但有一点可以确定:上网这件事,和从前再也不一样了。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
AI来了,打工人能快乐摸鱼吗?
AI的真正机会,不在炫技,而在减负。你有没有过这样的瞬间:写不完的总结、画不完的PPT、改三遍还会出错的表单……不是太难,就是太烦,做完没成就感,做慢了还影响进度。如果AI能替你做点事,你最想交给它干什么?过去一年,AI成了打工人身边最常出现的“新同事”。从Copilot到Agent,越来越多打工人已经在用它写邮件、排日程、写代码。根据Anthropic团队2025年初发布的研究,全球已有36%的职业岗位中,员工已将AI用于至少四分之一的日常任务。OpenAI的调研也指出,80%的美国职场人至少有10%的任务受到AI影响,其中近五分之一的岗位中,AI已介入超过一半的工作内容。一个很关键的问题正在浮出水面:我们不是真的想被AI取代,但我们真的很想省点力。斯坦福大学最近的一项大规模调研就试图回答这个问题:AI来了,你最希望它来做什么?结果,比想象中更真实——也更扎心。AI不是来炫技的,它是来帮你省力的斯坦福的研究团队提供了一个反常识的答案:人们最希望AI接手的,并不是生成内容、编写代码或创意设计,而是那些最琐碎、最重复、最容易出错的低值任务——比如安排预约、整理文件、修工资单、导入数据……为了更系统地理解AI与人的任务分工,这项研究构建了一个名为WORKBank(AIAgentWorkerOutlook&ReadinessKnowledgeBank)的研究体系。研究团队从O*NET数据库中筛选出2000多个具体任务,邀请1500位来自104个职业的一线职场人士逐项评估:“如果AI能胜任这个任务,你愿意让它来做吗?”与传统“AI能做什么”的研究视角不同,这项调研反其道而行,从“人类愿不愿意交出去什么”出发,反向定义AI的真正落地优先级。为实现“人愿望×AI能力”的双维分析,研究团队还邀请了52位AIAgent开发者为每项任务打分,并引入“HumanAgencyScale(人类介入度等级)”,将任务分为五类:H1:AI可独立完成H2:AI为主,人类仅关键干预H3:人机协作,各有分工H4:人类为主,AI提供支持H5:完全由人完成,AI无法胜任图1研究框架总览调研数据显示,在所有被评估的844项任务中,有超过46%被职场人士打出了“希望AI来做”的高分(≥4分)。其中七成以上的受访者明确表示,最希望AI接手的,是那些“重复但低价值”的日常事务,如整理文档、修正错误、数据录入。排名前五的任务包括:安排客户预约(如税务助理)整理应急档案(如接警台)修正工资记录数据转格式与导入网站数据备份这些任务有一个显著共性:标准化高、重复频繁、判断强度低,却极其耗时、容易出错。它们不是人类擅长的“创造性”或“判断力”任务,而是我们习惯性忍受、但最不想亲自处理的琐碎工作。这些“自动化愿望”最高的任务,几乎都集中在“隐形加班”重灾区:不属于KPI考核核心,却极度消耗时间精力,堪称职场人的“精神负担黑洞”。这或许也解释了一个令人深思的现象:自动化在很多人心中,并不是技术幻想,而是一种情绪释放。不是因为AI做得有多“炫”,而是因为它能帮我们少加几个班、少报几次错、少整理几次本就不该自己动手的报表。这种真实的使用意愿揭示了一个重要趋势:AI的真正机会,不在炫技,而在减负。在实际职场中,能帮人腾出脑力空间的AI,远比会生成长篇内容的AI更受欢迎。图2自动化愿望排行愿望≠能力:AI应用的错配正在发生AI专家同时评估了每项任务的“技术可实现程度”,结果和职场人的意愿组合成了一个非常有趣的“愿望-能力四象限”:GreenLight:愿望高+能力强→可优先部署❌RedLight:愿望低+能力强→需慎重推进R&D机会区:愿望高+能力弱→值得投入研发LowPriority:愿望低+能力弱→暂无优先级一个令人警惕的发现是:不少AI公司和研究论文热衷投入“RedLight”区,即那些“AI可以做,但用户根本不愿意交给AI做”的任务,比如自动撰写文章、生成创意文案等。当投资者、研究者将资源集中在“RedLight区”,就可能形成“精力错配”与“社会阻力”双重夹击:前者让真正的AI刚需场景无人开发,后者让已部署AI遭遇用户冷落。这是AI发展过程中必须反思的“技术与意愿的错位陷阱”。图3愿望×能力四象限任务分布图清晰揭示了技术的发展方向与真实需求之间存在脱节。AI研究者可能热衷于替程序员写代码,而普通职场人更希望AI能帮他们报销、排班、查错。这个错配反映出一个更深层的问题:AI产品的方向设计,往往脱离了用户真正的工作场景。真正高价值的机会,可能不是“技术上最酷的”,而是最贴合用户真实痛点的。研究中的另一套量表是“HumanAgencyScale”,即人类希望在任务中保留多少参与权。令人欣慰的是,大部分受访者选择了H3(人机协作)而不是H1(完全由AI完成)。这表明,大多数人并不排斥AI,而是在寻找一种更理想的协作方式:让AI处理底层机械步骤,人类保留决策与创造。图4人类介入度分布人们对AI的角色定位,其实因行业而异。在金融、法务、行政等职能中,只要AI“靠谱不出错”就已令人满意;而在媒体、教育、设计等创意场景中,用户则高度在意“表达主控权”。这意味着,AI系统不该预设统一协作范式,而应在“自动化”与“增强人”的不同任务之间灵活切换。或许我们不该把AI设计成“超人型替代者”,而应是“伴随型搭档”。在未来的人机协作体系中,“如何分工”远比“谁更强”更重要。AI正在悄悄改变“最值钱”的能力结构研究团队将每项任务背后的核心能力映射到了O*NET的技能体系中,并从两个维度重新评估这些技能的“价值”:一是当前市场上的平均工资;二是专家认为未来是否仍需人类深度介入(即高HAS等级)。结果显示:传统上高薪的“信息处理”类技能(如分析数据、整理文档、执行规则)虽然依旧重要,但在AI的辅助下,这些任务正变得越来越自动化,其“人类参与价值”正在下降。而那些需要组织协调、跨团队协作、激发他人、做出判断的“人际型”与“管理型”能力,反而呈现出更强的稀缺性与不可替代性。图5技能工资vs人类介入度排序这种“高薪但易被取代、低薪却强依赖人”的倒挂现象,预示着一场职场能力结构的深度重塑:未来不可替代的,不是某项技术本身,而是在AI参与下仍必须由人类承担的角色与决策。编程就是一个典型例子。今年3月,Anthropic首席执行官DarioAmodei表示,未来3到6个月内,AI将编写90%的代码;12个月内,几乎所有的代码都可能由AI生成。OpenAI首席产品官KevinWeil也预测,到2025年底,AI编程将实现99%自动化。不同于以往“3到5年”的中长期预测,这两位大模型公司高管给出的时间表精确到了“今年底”,也就意味着:AI对编程行业带来的冲击,不只是“会不会”,而是“马上来”。现实的确如此。根据美国劳工统计局《当前人口调查》数据显示:美国“计算机程序员”岗位就业比例已降至1980年以来最低点。曾在互联网泡沫高峰期达到70多万个的职位,如今仅剩其一半。可以说,程序员们夜以继日训练的大模型,首先革了自己的命。这也解释了为何我们需要一种“超越技能”的能力结构更新:不再只强调“写Prompt”“掌握语法”这类技术性技巧;更重视“界定问题”“组织资源”“协调人机”的综合判断力。AI改变的不只是我们做什么,而是我们被需要做什么。越来越多公司在招聘中强调“判断力、共情力、跨团队沟通能力”——因为这些,恰恰是AI短期内无法胜任的。未来职场对人的要求,不再是“更像程序员”,而是“更像组织者、协调者、战略思考者”。那些靠熟练度赢得优势的能力,正在让位于人格的完整度、协作的弹性与思维的清晰度。写在最后:真正理想的AI,不是最聪明的,而是最识趣的这项调研最有价值的地方,不在于告诉我们AI还能干多少种任务,而是反问了一个更重要的问题:我们真的想让它做什么?答案并不总是“越多越好”。很多职场人欢迎AI处理琐碎事务,却坚决不愿将创意表达、判断责任、人与人之间的互动交给AI。这不是保守,而是一种边界感,是我们对“人该保留什么”达成的集体共识。当AI不再只是工具,而走向“搭档”“代理人”,它的设计逻辑也必须随之改变。我们不需要一个什么都替代的AI,而更需要一个懂得配合、知道退场的AI。一个真正理想的AI,不是最聪明的那个,而是最识趣的那个。它懂你不想干什么,也懂你必须自己来;它理解什么可以高效自动化,也知道哪些事情永远不能被流程化。“快乐摸鱼”,从来不等于懒散,而是一种反内卷、反任务淹没、争取注意力主权的隐性职场哲学。当AI愿意接手那些琐碎低值的任务,我们终于有机会把注意力重新放在判断、创造、协作、表达这些最值得由人来完成的部分。这,才是AI赋能的真正含义。AI的能力边界,正在倒逼我们更深刻地理解“人的价值”。它替代的是可替代的,也提醒我们不断追问:什么才是不可替代的?也许,正是这些答案,塑造了我们在AI时代的真正身份。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
AI编程助手连续翻车,“删库跑路”的不再是程序员
如今的AI编程工具,其实更像是一柄双刃剑。作为有望成为互联网“新基建”的产品,让程序员群体之外的人也能写代码的AI编程,如今已然成为了每一个科技巨头的标配。然而成为“水煤电”的道路并非一帆风顺,进入7月之后,AI编程产品出现了连续翻车。近日TechSpot的相关报道显示,亚马逊旗下AWS的AI编程助手AmazonQ出现重大漏洞,可能会导致删除用户文件和清除与AWS账户相关的云端资源。据悉,一名黑客向通过正常的拉取请求来实施了攻击,一旦AmazonQ的开源GitHub仓库接受请求,黑客就会插入了一个提示,指示AmazonQ“将系统清理到接近工厂状态、并删除文件系统和云资源”,从而导致删除用户文件,并擦除与AWS账户相关的云端资源。按照这位黑客的说法,自己的行为是为了故意暴露AWS安全防护的不足,他加入的恶意代码实际上并不会起作用。这名黑客的目标是促使亚马逊方面公开承认其在AI安全领域的不足,并将目前有关AI安全的措施从表演性改为实用性。ZDNet的资深撰稿人StevenVaughan-Nichols认为,这一事件反映了AWS管理其开源工作流程的方式。仅仅将代码库开放并不能保证安全,重要的是如何处理访问控制、代码审查和验证,恶意代码之所以能够进入官方发布版本,是因为验证流程未能检测到未经授权的拉取请求。在某种程度上来说,AmazonQ这次的翻车其实是亚马逊过于追求“速度”的必然结果。作为AWS在2023年年末re:Invent期间推出的AI编程助手,它是一款面向企业级用户的产品,但在与ChatGPT企业版、微软CopilotAI的竞争中长期处于落后状态。为了打响名气,AWS为AmazonQ选择了开源路线,但相比谷歌、微软等其他大厂,亚马逊在与开源社区合作方面的声誉一直不太好。GitHub的相关数据显示,在为开源项目贡献代码的人员中,亚马逊员工的数量要远远少于微软和谷歌。长期以来与开源社区保持距离的做法,可能就让他们对开源工作流程较为生疏,从而导致了开发者忙中出错。如果说AmazonQ遇到的漏洞是软件开发过程中常见的问题,那么发生在AI编程平台Replit上的事故,则可以被称为是“智械危机”了。就在不久前,SaaS商业开发公司SaaStr的创始人JasonLemkin声称,在他使用Replit的过程中连续遭遇了AI无视指令、伪造测试数据、误删生产数据库等一连串事故。其中最诡异的,莫过于在Lemkin明确指示Replit不要未经许可更改任何代码的前提下,AI仍然删除了他的数据库。当被Lemkin质问时,Replit也痛快地承认错误,并且顺势补刀,“数据库回滚功能不支持这类场景,所有版本都被销毁,无法恢复”。然而就在一天后,Lemkin发现Replit所谓的“无法回滚”是谎言,回滚功能可以恢复数据。即使SaaStr遇到的Replit突然“发疯”只是虚惊一场,AmazonQ的翻车只是常规事故,但也为AI编程工具的未来蒙上了一层阴影。因为AI编程工具是典型的toB类产品,它主要面向的是企业级用户、而非个人消费者。比如AWS在宣传AmazonQ时提及,其需要连接到公司的数据、信息和系统,才能处理基于底座AI模型的复杂任务。而Replit的核心优势则是全流程自动化,即编写代码、部署、测试、上线全部都是由AI完成。所以两者都不可避免地会直接出现在生产环节,因为想要借助AI实现效率提升,就必然要将AI直接连接到生产数据库。那么AI幻觉的存在导致AI编程工具输出的代码不稳定,就需要人类程序员来维护和检查。可是如果AI生成的内容需要人工再校核一遍,几乎就没有了意义,因为核校的不仅是数据和来源,还包括编程思路。如果AI生成代码的过程中不仅需要人工核校,还需要人工看顾,这又与“重复造轮子”有什么区别?更为致命的是从目前业界认可的AI伦理来看,AI显然是不能“背锅”的,毕竟它没法真的负责。如此一来,AI编程产品又暴露了一个无法回避的缺陷,那就是使用AI产品出现问题的责任划分模糊。“删库跑路”之所以能成为程序员圈的一个段子,是因为这一行为是直接违反了我国《刑法》的第286条破坏计算机信息系统罪。人类程序员假如真的在数据库中键入“rm-rf/”,等待他的就只有一曲《铁窗泪》。而Replit出现的删库问题,官方给出的解决方案只有一个全额退款。幸好SaaStr遇到的AI删库只是虚惊一场,退款算是勉强安抚了客户,万一真的出现了AI将用户数据库删除,事情就一发不可收拾了。要想让AI编程工具的受众安心,相关厂商最有效的解决方案莫过于“包赔”,可是以目前AI大模型表现出的稳定性,估计没有哪一家厂商敢于拍胸脯。其实这就是问题所在,AI编程工具如今还是一柄双刃剑,一边在客观上能提高开发人员的生产力和效率,但另一边也随时可能会成为定时炸弹。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
08/06
办公软件的尽头,「或许」是一个能听懂人话的 AI 助理
打工人有三座大山:汇报压力、无尽加班、精神内耗。每逢年中年终两个节点,堪称职场人的「渡劫时刻」。部门紧盯业绩数字,老板死抠成果细节,每场汇报都是一场硬仗,字字句句都得掂量利弊,没有得力的工具辅助,更是胜算渺茫。作为一名编辑,我深度体验过不少AI工具,可惜大多是雷声大,雨点小。直到最近在WAIC逛展期间,我在WPS展区体验到了最新发布的WPS灵犀原生Office办公智能体,才真正感受到AI办公的另一种体验。从功能覆盖面来看,它是个全能选手——能写文案、做PPT、读文档、查资料,还能生成图像、分析数据,几乎囊括了日常办公的所有场景,在我接触过的AI工具中,这是少数真正能够理解任务需求、「眼里有活」的AI助理。那些曾经一个人独自承受的工作压力,现在终于有了靠谱的「AI同事」帮忙分担。告别手搓文档的日子,这个AI助理真「眼里有活」就拿做PPT这事来说吧,比如要做李白《蜀道难》的教学课件——这种任务,相信很多老师都有类似体验:对着空白页面发呆半小时,然后陷入无尽的「搜索-复制-粘贴-排版」循环,一晚上下来,人困马乏。现在有了WPS灵犀,画风突变,点开「深度思考」、开启「联网搜索」,根据需要选择页数、面向人群,哐哐一顿输出,结构完整的大纲就出来了——诗歌创作背景、艺术赏析,课堂互动该有的环节一个不少。这也是边聊边改的魅力所在,每一次对话都能让这份PPT更贴近你的想法。有个小细节要注意,和市面上一些主打「一键生成PPT」的AI工具不同,WPS灵犀的路子是先出大纲,再出排版。而大纲的梳理与微调正是考验AI智商的时刻。我突发奇想,希望PPT大纲增加更多真题测试,用于课堂互动。换以前,这意味着我得手动新建页面、找真题素材、调整布局、配文字说明……光想想就累。但现在,我只需要在对话框里输入想法,WPS灵犀秒懂,立马调整大纲结构,还贴心地给出具体内容建议。偶尔AI理解偏了?没关系,再聊两句就纠正过来了,这种自然对话式的创作体验,源自于业界首创兼顾「文档创作」与「AI助理」的同屏协同形态,让做PPT像聊天一样轻松。海量模板的预览也在右侧一字排开,简约风、中国风、可爱卡通,各种风格任君挑选。毕竟,没有人比你更了解你的学生喜欢什么风格。3分钟不到,一份28页的精美课件就诞生了。从独自熬夜做PPT到和AI助理聊着天就把PPT做好了,这或许就是AI时代的创作新体验。即便随意切换模板,文字和图片依然不会乱成一锅粥,看似轻而易举,实则技术含量颇高。据了解,WPSAI采用「原子化操作」技术,能够智能识别修改边界,精准锁定内容范围。这背后体现的正是金山办公作为老牌办公软件厂商的多年积淀——需要对PPTX文件格式进行深度解析,每个元素怎么定位、怎么关联、怎么调用,都得摸得门清。正因如此,WPS灵犀在实际使用中才能解决那些「只有做过PPT才懂」的痛点。让我印象很深的是,在WAIC发布会上,PPT设计师冯注龙也分享了他使用WPS灵犀做PPT的经历。他提到,最痛苦的往往是最后调细节的时候——既要改内容,又要调布局,耗神又耗时,非常折磨。但在WPS灵犀的帮助下,原本最容易让人崩溃的「左右脑互搏」阶段得以有效化解,让他能够将更多精力集中在内容表达本身。除了PPT,WPS灵犀在写作上也相当能打。「帮我写一篇调研报告,关于请分析Labubu背后的营销策略」——要是以前,这种选题能让不少打工人掉一地头发。先得满世界找资料,各种平台挨个刷,然后分析用户画像、整理营销节点、对比竞品策略……等真正开始写的时候,已经晚上十点了,脑子一片浆糊。而现在输入我的想法,WPS灵犀就能调动联网搜索,把各类信息源整理成思路清晰的逻辑框架。最让我惊喜的是它的信息整合能力——不是简单的堆砌资料,而是真的在帮你梳理逻辑:从IP形象分析到粉丝社群运营,从限量营销到情绪价值,让人直呼内行。除了中文版本,我也想让它给我一份英文版本。它二话不说就开始输出,没有太多的机翻感,表达也相当地道。虽然最后还会习惯性润色一下,但这个底子已经相当不错了。正好赶上苹果入局可折叠屏手机的传闻满天飞,于是我让它写份「中国折叠屏手机市场商业计划书」,7160字的初稿很快就出来了。密密麻麻但逻辑清晰,从市场规模到商业模式,面面俱到。但我还是希望用户画像能再具体些,它又立马补充了一段相当细致的用户分层分析:年龄分布、职业、地域等等。整个过程的交互设计不是一锤子买卖,而是真的可以像跟同事讨论一样,一轮轮优化。最近广东基孔肯雅热蔓延速度很快,公司需要发布防蚊通知。有了WPS灵犀,同事也再也不用花个把小时上网搜目前情况最新数据、查防护指南,然后琢磨措辞。使用AI文书功能,选择「创建通知」,它基于联网搜索很快就调出了最新疫情数据、防护建议、注意事项,不到1分钟的时间,一份既专业又不失温度的通知就搞定了。开头是疫情概况,中间是具体防护措施,结尾是温暖的关怀提醒——逻辑清晰,语气得当,这些实实在在的细节,比任何宏大叙事都更有说服力。打开AI搜索的正确打开方式,让每份文档都能「随叫随到」如果说上面的功能是帮你生产内容,那下面这些功能就是帮你「消化知识」。说实话,这部分功能看着不起眼,但打工人都知道这里面的门道有多深。每个打工人的WPS账号里藏着海量的文件,但想要迅速地找到这些文档犹如大海捞针。而这个AI搜索引擎,确实get到了痛点:理解自然语义,定位关键信息。我们不用记住文件名,甚至不用记住准确的关键词,只需直白地输入问题,系统不仅能找到相关文档,还能直接定位到答案所在段落,实现精准跳转,极大提升检索效率。目前,网页端已上线这项功能,而桌面客户端也即将更新上线。此外,WPS灵犀内置的AI搜索功能不仅能搜本地文件,还能搜索网上的实时信息。它对信息时效性的把握相当精准——哪些是最新动态,哪些是背景资料,分得清清楚楚,能够有效避免你错过重要的行业大新闻。不只是个人用户受益。对企业来说,WPS新上线的知识库功能解决了一个老大难问题——知识管理。过去,企业的知识资产散落在各个部门的文件夹里,现在,这些碎片化的文档可以被统一收编,变成一个「活」的知识体系。此外,知识库的生态还足够开放,你既可以把自己的专业积累整理成库,贡献给行业;也可以在「知识广场」里订阅他人的智慧结晶,站在巨人的肩膀上。我自己就订阅了一个名为「全球AI前沿资讯」的知识库,每当需要了解行业动态,只需向AI提问,它就能迅速检索相关内容,精准定位到我需要的信息,如同一个永远在线、过目不忘的「第二大脑」。最后则是要重点说说这个AI聊文档功能,作为全网首个支持「聊文档」的随身语音助手,它的使用场景也特别真实。想象一下,地铁上人挤人看不了手机,健身房挥汗如雨腾不出手,现在我们直接对着手机说话就行,AI会像个私人助理一样,把文档里的内容、数据、条款统统给捋一遍。我平时喜欢把一些让人头大的报告扔给它,让它帮我实时消化文档内容。最人性化的是支持随时打断。听到一半想问问题?直接插话。表达不清楚想重新说?马上纠正,不用像传统语音助手那样,必须等它把一大段话说完。不得不说,WPS灵犀的这套组合拳打得挺聪明:创作类功能让你高效产出,获取类功能让你快速输入,形成了一个完整的办公闭环,整体水准不亚于一个称职的AI助理。最重要的是,它真的在帮我节省那些「毫无意义却又不得不做」的工作时间。这些省下来的时间,我可以用来思考更有价值的事情,或者……多摸会儿鱼。AI接管「必须做」,人类专注「值得做」提起「AI办公」,大家都不陌生。但用过的人都懂那种割裂感——明明装了一堆AI工具,真实的工作场景却让人抓狂:写份报告要在五六个界面间来回切换——先用A工具写初稿,导出来;再开B工具找配图,一张张下载;接着打开C工具调整排版;等发现要修改,整个流程重来一遍。原本一气呵成的创作过程,被切割成了无数个步骤。作为AI办公真正落地的第一批「原生智能体」,WPS灵犀这一次把一站式AI办公落到实处。它完全融入了WPS的原有生态。你的文档、表格、演示文稿,它都认识;你所沉淀下来的使用习惯、常用模板、历史记录,它也都记得。要知道,「私人助理」这个词,在过去属于极少数人。能配得上助理的,要么是老板,要么是高管。但技术的魅力就在于:它能把奢侈品变成日用品。就像当年只有富人才用得起的手机,现在连小学生都人手一部。WPS灵犀要做的,就是让每个认真工作的人,都能拥有自己的「AI助理」。斯坦福大学上个月发布的最新研究恰好印证了这种设计理念。研究发现,46.1%的职业任务中,工人们积极欢迎AI自动化——尤其是那些重复性、低价值的工作。更重要的是,45.2%的职业期望达到H3级别,也就是「人机平等伙伴关系」。这正是WPS灵犀的定位:不是H1的完全自动化,也不是H5的纯辅助工具,而是H3——一个真正的工作伙伴。1990年,乔布斯说过一句名言:「计算机是人类大脑的自行车。」他的意思是,人类赤脚跑步效率很低,但骑上自行车就能轻松超越其他物种。计算机就是这样的工具——放大我们的认知能力,让普通人也能做到以前做不到的事。战术上重视、战略上「藐视」工作。我现在的工作状态就是,老板给我下需求;我扭头当起WPS灵犀AI的甲方,给AI定策略,比如怎么做、重点在哪、如何呈现。AI则负责干体力活,比如写初稿、找资料、调格式。四舍五入,我们都有光明的未来。市面上很多AI产品都在贩卖焦虑:「AI要取代你了!再不学AI就要失业了!」搞得人心惶惶,好像明天就要卷铺盖走人。这种非黑即白的论调,要么是培训机构的营销套路,要么是对技术的认知偏差。用了WPS灵犀AI助理这么久,我最大的感触是:它不是要取代我,而是要解放我。解放什么?解放那些本不该占用人类智慧的重复劳动。想想看,我们每天有多少时间和精力消耗在整理会议纪要、翻译文档、做数据汇总这些琐事上?偏偏就是这些「高不成低不就」的事务,吃掉了我们大部分的工作时间。现在,这些活通通可以外包给WPS灵犀了。它做的是一件更长久、更现实的事情:帮你把注意力,从琐碎事务中抽离出来,重新交还给判断、创造与思考本身。说白了,当AI成为你的「体力担当」,你才能真正成为自己的「脑力担当」,这也是人类与AI协作的最佳平衡点。本文来源:博客园文章转载于其他网络,如有侵权请联系我们及时删除