任泽平：应用驱动是AI发展的第一性原理_常见问题_爱游戏app官方网站手机版-爱游戏app官网登录ayx

任泽平：应用驱动是AI发展的第一性原理

浏览次数：1 次来源：爱游戏app 发布时间：2024-12-21 17:23:58

一方面，OpenAI的下一代语言模型Orin遭遇重大瓶颈，效果不及内部预期。其2024年初主推的多模态模型Sora的发布日期也持续推迟。

另一方面，AI行业的“Scaling Law”似乎正在失效，大模型的性能不再随着参数量、数据量、计算资源的增加而产生指数提升。

AI需要新驱动力，应用驱动将成为第一性原理。进入“冷静期”合乎行业发展的规律，就像历史上许多次技术浪潮一样，在度过最初的高期望阶段之后，泡沫不可避免产生。当技术未达到高期望时，行业会进入一段冷静期，等待新技术和应用变革带来大洗牌。

海外AI发展曾经以技术驱动，实现AGI（通用AI）等同于实现AI企业的终极商业经济价值。ChatGPT让产业界看到了以AGI为目标的技术驱动的潜力，但经过两年发展，行业意识到AGI仍然遥远，纯技术驱动还不具备客观条件。海外AI巨头在2024年逐步调整方向，开始以应用开发、产业结合为当前阶段重点。OpenAI转向盈利性商业化运营，谷歌、微软等都开始以To C、企业端、开发者社区合作为聚焦点。

中国AI发展特点是应用驱动。2023年ChatGPT浪潮掀起“百模大战”，积累了早期中国AI市场基础。根据《全球数字化的经济白皮书》，截止2024年11月，中国的大模型数量高达478个，约占全球总数量的36%。中国市场投入大量资源开发基础大模型，在某些特定的程度上导致AI深层技术发展整体滞后。但另一方面也提高了生成式AI的社会认知和接受度，进而促进个人和企业去关心AI产品与市场的契合度，打下了应用驱动AI发展的“弯道超车”基础。

原生AI企业是推动行业技术进步和产业化的引擎。2024年11月，沙利文发布《2024年全球AI生态全景概览》，其中原生AI巨头有谷歌、百度、OpenAI三家。通过原生AI企业的技术、产业创新实现“冷静期”跨越有迹可循。比如，谷歌在2017提出了Transformer架构，成为推动预训练模型进化为大模型落地的最关键技术。2023年OpenAI发布ChatGPT，通用大模型首次进入公众视野，唤醒沉寂多年的AI赛道。2024年百度世界大会召开，开创性主张“AI应用向实”，中国AI发展郑重进入弯道超车阶段。

大语言模型（Large Language Model）中的“幻觉”现象指的是模型生成的内容虽然看似合理，但实际存在事实错误；或者AI生成的文字、图片、视频在直觉上不符合人类认知，欠缺真实感。“幻觉”主要有逻辑谬误、捏造事实、数据偏见三类。通常是因为模型的推理能力欠缺，算法框架存在漏洞，数据压缩、数据不一致性等原因导致。

多模态大模型领域兴起，图像、音频、视频类模型也出现幻觉现象。比如，OpenAI的Sora大模型虽然在视频生成领域表现优异，但也存在生成的视频违背物理规律，时空关系错乱等情况。这也是正式版Sora无法上线的根本原因之一。

业内解决“幻觉”问题的方式是采用RAG技术，（Retrieval-Augmented Generation）即检索增强生成，通过结合阶段和增强生成，减少学习数据中的“负样本”，以此来减少大模型的幻觉现象。但这也仅限于在LLM领域。在多模态领域，百度开发了基于图像的iRAG（Image based RAG）技术，将搜索引擎的亿级图片资源与文心基础模型能力进行结合，在强化学习生成下，输出各种真实的图片，整体效果远超传统的“文生图”的原生系统，有效的消除了“AI味”。未来，以iRAG技术为代表多模态RAG将成为业内缓解AI“幻觉”现象的主要方向，为更成熟、更真实的多模态应用发展提供更准确的能力。

AI编程应用将加速AI迭代进程，赋予企业和个人更强的开发能力。全球AI企业已确定进入“效率时代”，由于软件应用开发的成本高、周期长，算法工程师昂贵且稀缺，通过开发辅助编程AI来提高开发者效率、缩短开发周期成为方向。

一种是企业内部用AI直接辅助开发任务。比如，亚马逊将Amazon Q用于企业内部的软件升级任务，为其节省了相当于“4500 名研发人员一年的工时”，并且还提高了准确性和安全性，降低了基础设施成本。

或是与开发者社区联合开发编程AI助手，提高个人写代码效率。比如，GitHub Copilot由GitHub、OpenAI和微软Azure团队联合推出，能够给大家提供代码建议和自动补全功能，帮助开发者更快地编写代码。

甚至是直接省去人工代码步骤，由AI完成开发全流程。2024百度世界大会发布的“秒哒”是里程碑式的开发工具，不同于前两种辅助编程工具，使用秒哒不需要任何代码能力，通过自然语言就能实现软件开发，人人都将拥有程序员的能力。其实现是通过将任务拆解成核心需求、内容结构、工程开发、数据需求四个步骤，再采用多个智能体协同来完成，这也是迄今为止，最复杂的多智能体协作工具。以后随着基础模型能力提升，以及智能体本身的技术能力迭代，秒哒将能完成更复杂的开发诉求，实现系统级开发能力。

百度在AI编程应用上迈出的这一步，不仅消除了未来成为开发者的门槛，更是对AI时代商业模式的一次革新。这意味者实现商业创意或不再需要组织人员架构，智能体就能充当项目经理、设计师、开发工程师，凭借AI工具和创意，个人就能开发产品和创造商业模型。

智能体会变成AI时代内容、信息和服务的新载体，是下一个爆发点。大模型是AI应用的初期形态，具备一定的通用性，但在深度方面欠缺。大模型作为应用发展的下一步是智能体（AI Agent），不但能基于LLM进行任务推理和解决，还具备记忆、规划功能和更强的自我学习能力，并且能使用特定的行业知识完成更复杂、更高质量的任务。

第一类具身智能体（Embodied AI），典型代表有智能驾驶汽车、通用人形机器人。如英伟达CEO黄仁勋所言，具身智能体是AI进入物理世界的超级智能形态。L3以上的高阶智能驾驶是第一步，目前以国内的百度Apollo和美国的特斯拉RoboCab为代表。第二步是通过无人驾驶的大范围应用铺开，积累智驾算法的数据和经验，再构建虚拟环境去训练人形机器人算法，帮助其实现量产落地。比如人形机器人领域领先的特斯拉Optimus，采用的就是其FSD智能驾驶算法。

第二类是平台智能体（Platform AI），为工具、企业、角色、行业、产业等提供AI赋能升级和定制化解决方案。

工具智能体，在个人的工作和兴趣应用场景中拥有强大的创造力和价值，将成为AI界的新质生产力代表。如AI写作、Canva设计助手、logo生成器等等，都是典型的代表。工具智能体的核心在于AI的“自由性”——能通过连接公域（公开数据、搜索引擎内容、社交平台内容）和私域（个人数据、音频、图像、文字）来生成符合用户期望的内容，解锁“创造性”和“独特性”。比如，百度发布的自由画布就是由文心多模态大模型加持的创造力工具，具备输入自由、编辑自由、创作自由三大属性，覆盖从创意绘画、AI写作到专业报告领域等使用场景，帮用户完成从找资料、到编辑、再到生成和分享的全部任务。

企业类智能体，相当于AI时代的公司官方AI，具备官网+服务一体的系统化能力。由于传统的企业官网通常信息庞杂、专业术语难懂、视觉观感上易疲劳，检索方式复杂、服务效率较低，已不足以满足用户的需求变化。而AI企业智能体则具备了定制化推荐、及时化响应、高效化服务的能力。在汽车零售领域，比亚迪官网是成熟的企业智能体案例，对于不懂术语的用户，智能体能像人类客服一样为用户找出匹配的参数，一键式提供清晰明了的对比，省去手动筛选步骤，给出符合用户期待的建议。

角色类智能体，也就是AI数字人，有自己的背景、设定、知识库。可以是基于现实真人、特定职业进行在线服务的AI角色，也可以是虚拟角色。以往的虚拟数字人，大部分存在声音口型不匹配、肢体动作机械、神情呆板等问题。在LLM和多模态的技术加持下，角色智能体能呈现出更高度拟人化的表情、神态、情感。可以充当辅导老师，健康咨询师，网络娱乐主播等，通过与人互动提供知识和价值。实际上，当前的数字人直播在许多场景下已超越真人直播的转化率，具备可观的商业价值。

行业类智能体，为用户打破信息不对称，提供对应领域的专业服务，在法律、医疗健康、金融、体育、旅行等领域潜力巨大。比如，法律行业的智能体——法行宝就是普通人的专业法律助手，从案件分析、条文引用、赔偿计算、诉讼起草，实现了全流程免费服务。上线半年多以来，百度推出的法行宝为940万多人提供了高效、可信的法律服务。

产业类智能体，为不同产业中、不同分工的公司，提供商业决策中各环节解决方案。比如，餐饮产业的选址和售后服务是两大难题。国内的餐饮龙头百胜集团选择与百度合作，基于大模型能力进行选址评估，提高了上千家门店的选址效率与销售效果。初期的赋能成功后，百胜又对全线业务进行了数字化升级，大模型每天调用量的峰值达到数百万，AI客服的问题解决率提升到了90%。为传统行业转型提供AI升级，还只是产业类智能体的应用探索第一步，未来随着模型学习能力更具深度，数据训练更庞大，产业类智能体甚至有潜力成为公司战略的核心决策者。

科技进步的原力是理想主义，前沿的技术浪潮最早都是由少数个人的理想主义来推动的，这一点在AI领域尤其突出。2024年的诺贝尔物理学奖颁给了约翰·霍普菲尔德和杰弗里·辛顿，一方面表彰两位学界先驱对于AI理论研究和产业化的贡献；另一方面，是对两位在深度学习路线余年，仍然坚定该研究方向的理想主义精神致以敬意。

30年来，推动美国AI产业高质量发展成型是学术界的辛顿团队和产业界的微软、谷歌团队，将这一成果转换为商业化浪潮的是OpenAI和英伟达。其背后根本是以辛顿、伊利亚、苏莱曼等为代表的学者和以马斯克、奥特曼、黄仁勋为代表的企业家以个人理想主义推动行业进步。

中国的AI产业高质量发展和未来趋势亦是如此，有AI理想主义的企业家是推动行业进步的关键。早在2012年，李彦宏就瞄准AI领域，率先意识到AI发展的转折点到来，发起计划收购刚完成AlexNet的辛顿团队。该团队中还包括了后来的“ChatGPT之父”伊利亚·苏茨克维。彼时参与拍卖的还有谷歌、微软、DeepMind，而百度在竞标中一直出价最高，直涨到4400万。尽管因为辛顿的身体条件等原因，最终未能与百度合作，但这场改变人工智能革命的舞台上，中国企业的世界眼光和视角高度让AI学术界感叹。“AI教父”、深度学习发起人之一杨立昆感叹：百度是最早部署商业化深度学习系统的大型公司之一，甚至领先于谷歌和微软。

十年来，李彦宏作为企业家一方面将百度的十年布局聚焦在AI领域，另一方面作为个人也在不断传播他的理想主义，无论是对国家领导、企业家、媒体，还是对朋友、学生、极客，他从不放过任何“布道”AI的机会。在连续8年的“两会”中，李彦宏提出了13份AI相关提案。在坚持十年的“布道”和产业落地中，慢慢的变多的企业也看到了AI技术的价值并开始重视对AI的投入，互联网科技公司转向发展人工智能的信心也更加坚定。

AI理想主义从理念到落地，根基是聚焦人才教育培训。2013年，李彦宏组建了成立百度深度学习实验室，担任院长。这是世界上首个以“深度学习”命名的企业级实验室。至此，中国AI领域开始招贤纳士，打稳根基，踏上10年的探索之路。2014年，谷歌猫牵头人吴恩达加入百度深度学习，担任首席科学家，负责百度大脑项目，培养了众多中国AI界的核心技术骨干。2017年，王海峰接棒吴恩达，搭建AIG（AI技术平台体系）后来发展为深度学习技术及应用国家工程研究中心。2023年，王海峰发布百度人才教育培训星河计划，宣布为社会再培养500万大模型人才的愿景。

十年来，百度不但实现从0到1的AI技术人才骨架逐渐成型，打稳了中国AI发展的人才基本盘，也让人工智能的理想主义队伍不断壮大，为中国AI行业在下一次变革性浪潮中做好了准备。2021年，李彦宏在致股东信中提到：“百度有定力，有耐心。因我们深知，最前沿的技术浪潮是等不来的，你必须提前10年、20年去布局”。当下看，不仅提前10年布局的百度做到了生态领先，中国AI行业也做到了立足于全球AI的大浪潮中。

上一篇: 白条还款晚了一天上征信吗会有什么影响？

下一篇: 震动！无锡深夜竟现婴儿贩卖丑陋买卖