近段时间,深度求索公司(DeepSeek)在国内外引发强烈关注。在1月20日发布DeepSeek—R1模型后,公司1月份用户增长达1.25亿,其中80%以上来自1月份最后一周,创造了7天完成1亿用户增长的纪录。
开辟竞争新赛道
全球AI大模型热潮已持续了两年多。美国人工智能公司OpenAI于2022年11月份发布GPT—3.0模型后,各国科技厂商纷纷入局“炼”大模型。OpenAI以规模作为大模型的制胜法宝,为追求更高的性能,模型体积不断膨胀,参数数量呈现指数级增长。这种开发模式能源消耗和训练成本较高。2024年,OpenAI预计亏损额达到50亿美元。
与之形成鲜明对比的是,DeepSeek采取了不同的策略。其发布的大模型R1在多个基准测试中与OpenAI公司2024年12月份发布的o1模型持平,但成本仅为o1的三十分之一。
哈尔滨工业大学商学院院长马涛指出,这是对全球AI行业高资本投入型主流创新模式的低成本破冰。作为由对冲基金孵化的非传统AI企业,DeepSeek的跨界突破证明了新兴力量通过差异化技术路线颠覆行业的可能性。
“DeepSeek—R1主要在模型架构和训练过程中进行了深度优化,大幅降低了计算资源的消耗和训练成本,并且开源了模型的权重、训练代码和相关工具链。”北京航空航天大学人工智能学院副研究员胡堃认为,这将推动大模型竞争朝着更加高效、低成本和开放共享的方向发展,进而推动AI大模型在更多行业场景的深入应用。
中国社会科学院财经战略研究院研究员刘诚说,以往,大模型竞争建立在算力的累加上,一些公司甚至不计代价地投入算力来训练大模型。现在,DeepSeek使人们充分意识到,算力也是可以节省的。长期来看,这将极大降低AI的成本和能耗,加快AI在全社会的普及。
构建科创新格局
目前,中国移动、中国电信、中国联通3家基础电信企业,华为云、阿里云、腾讯云、百度智能云等多个云平台,均已上线DeepSeek。华为昇腾、沐曦、龙芯中科等多家国产芯片企业都宣布完成了对DeepSeek模型的适配或上架服务。微软、英伟达、亚马逊等海外AI巨头也宣布接入DeepSeek,标志着中国AI大模型首次大规模反向输出。
当前,我国每年理工科毕业生超过发达国家理工科毕业生总和。这种人才储备系统性构建了“基础研究—应用转化—产业升级”的全链条创新梯队。DeepSeek正是高密度技术人才协同攻关的产物。当美国顶尖人才流向金融业时,中国通过政策引导让量化投资领域的技术精英反哺AI研发,形成独特的人才再分配机制。
开源策略引发的连锁反应远超技术范畴。国际平台主动适配中国模型,标志着全球AI生态从“单向输出”转向“双向融合”。中国创新者抓住了两个关键转折点:一方面,通过混合专家系统实现“算法代偿硬件”;另一方面,以场景复杂度倒逼工程创新,使模型能效比提升的同时,训练成本大幅降低。
“DeepSeek与各大云平台的结合,将为DeepSeek模型训练和推理提供更丰富且弹性的计算资源。”胡堃表示,未来可通过一站式AI开发和部署简化技术流程,吸引更多开发者、企业和研究机构参与模型的生态建设,由此向更多的垂直细分领域提供更精准、轻量化和按需付费的AI技术解决方案。总之,这波创新浪潮有望使AI技术更加普及和实用化。
催生产业新机遇
业内专家普遍认为,这波创新浪潮将促进各企业探索具有成本效益的AI开发和部署方法,加速赋能千行百业。
低成本高性能大模型将有效推动AI云计算和边缘计算的融合发展。胡堃表示,一方面,大模型可部署在低资源的边缘设备上,实现复杂的AI推理任务,可拓展大规模的端侧应用,并面向实时性的复杂任务,实现多模态的具身智能,拓展智能机器人在各行业领域的应用;另一方面,大模型可低成本地私有化训练和部署,深度赋能中小企业和个人应用。
各行业领军企业都在加快AI布局。刘诚认为,从未来趋势看,自动驾驶、无人机、人形机器人3个领域可能在AI布局方面发展更快。原因有二:一是这些领域已具有先发优势产业,在企业数据积累、地区试点和示范、国家政策等方面具有较好基础,有了低成本大模型将如虎添翼。二是通用大模型技术在走向专用领域过程中,需要经历大量二次训练,要在垂直细分市场中纵深推进,而自动驾驶、无人机、人形机器人等各自领域的专业技术创新将为之提供支撑。
刘诚建议,未来需要保持宽松的、包容的监管环境,让企业自主探索;强化对企业知识产权的保护,引导耐心资本大胆投资;对人工智能可能引发的科技伦理、机器替代劳动、数据保护、数字版权等问题加强学术研究,前瞻性预判可能出现的经济社会问题,探索建立基础制度规则。
马涛建议,未来,从战略层面出发,中国应致力于将“场景主权”转化为“技术定价权”,构建起AI创新的动态护城河体系。一方面,国家应积极推动建立跨行业的场景创新协作机制,借助实际场景中复杂多变的需求,不断推动AI技术的更新迭代;另一方面,引导产业向自主技术架构迁移。通过政策倾斜,如税收优惠、专项补贴等,鼓励企业在AI开发和部署中优先使用国产技术组件,全面提升我国AI产业的自主性和安全性。
转自中国经济网


2024-2030年中国多模态大模型行业市场现状分析及前景战略研判报告
《2024-2030年中国多模态大模型行业市场现状分析及前景战略研判报告》共九章,包含全球及中国多模态大模型企业案例解析,中国多模态大模型行业政策环境及发展潜力,中国多模态大模型行业投资机会及策略建议等内容。
版权提示:智研咨询倡导尊重与保护知识产权,对有明确来源的内容注明出处。如发现本站文章存在版权、稿酬或其它问题,烦请联系我们,我们将及时与您沟通处理。联系方式:gaojian@chyxx.com、010-60343812。