基于成本、能耗、可靠性和时延、隐私、个性化服务等考虑,端云混合的AI才是AI 的未来,高通认为终端AI 能力是赋能混合AI 并让生成式AI 实现全球规模化扩展的关键。
百亿参数开源MoE 大模型Mixtral 8x7B 再掀热潮,性能超LLaMA2-70B,对标GPT-3.5。MoE(混合专家模型)通过将任务分配给对应的一组专家模型来提高模型的性能和效率。Mixtral 8x7B 的专家数量为8 个,总参数量为470 亿,但在推理过程中仅调用两个专家即只调用130 亿参数。
我们认为MoE 或为现阶段大模型平衡成本、延迟以及性能的最优选择,叠加开源模型本身高灵活性、安全性和高性价比特点,Mistral AI 的开源MoE 轻量化模型可能是未来最适合部署于终端的模型。目前,高通、联发科、英特尔、AMD 等龙头芯片厂商都推出了终端AI 芯片,能跑十亿甚至百亿量级大模型。后续类Mixtral 8x7B 的SMoE 模型在高性能基础上继续压缩的话,很大几率可以装进终端设备实现本地运行。SMoE 轻量模型大幅降低了训练的门槛和成本,且由于在推理时只激活少部分参数,保持较高性能的同时能适应不同的计算环境,包括计算能力有限的终端,降低推理成本且将催生更多大模型相关应用。
2024 年有望成为终端智能元年,看好拥有终端资源、深耕场景、掌握行业knowhow、积累了海量数据的B 端和C 端公司。1)未来每台终端都将是AI终端,包括AI PC、AI 手机、AI MR 等,这将带来全新的用户体验。2)AI PC有望成为“AI+”终端中最先爆发的。英特尔预计全球今年将交付4000 万台AIPC,明年将交付 6000 万台,预估2025 年底AI PC 在全球PC 市场中占比将超过20%;微软AI PC 预计于今年亮相。3)随着大模型逐步发展,尤其是多模态能力增强,更广泛的AIoT 设备也迎来了更新换代的重要机遇。3)B 端私有化部署也是AI 应用的重要方向,关注边缘侧AI。4)鸿蒙:提供顶级流畅连接体验,大模型有望赋能奔赴万物智联下一站。
人形机器人是大模型应用的重要硬件载体,也是终端智能发展的核心方向。1)人形机器人是目前具身智能最好的形态,因为它们有着与人相似的外观设计,能更好地适应周围的环境和基础设施。2)端云混合的“大脑”让机器人既能处理复杂和高强度的计算任务,又能实时进行信息处理和分析。
建议关注:1)算力基础:中科曙光、神州数码、浪潮信息、高新发展;2)AIPC:华勤技术、龙旗科技、联想集团、星环科技-U、海光信息;3) 终端鸿蒙:
润和软件、九联科技、东方中科、软通动力、中国软件国际、拓维信息、初灵信息;4)拥有丰富的终端资源:海康威视、大华股份、科大讯飞、萤石网络、漫步者;5)B 端应用:北路智控、智洋创新、云涌科技、商汤-W、云从科技-UW。
风险提示:AIGC 技术突破不及预期、终端智能需求不及预期、宏观经济增长不及预期、国际环境变化。
知前沿,问智研。智研咨询是中国一流产业咨询机构,十数年持续深耕产业研究领域,提供深度产业研究报告、商业计划书、可行性研究报告及定制服务等一站式产业咨询服务。专业的角度、品质化的服务、敏锐的市场洞察力,专注于提供完善的产业解决方案,为您的投资决策赋能。
转自西部证券股份有限公司 研究员:郑宏达
2025-2031年中国人工智能生成内容(AIGC)行业市场全景调查及战略咨询研究报告
《2025-2031年中国人工智能生成内容(AIGC)行业市场全景调查及战略咨询研究报告》共十二章,包含中国人工智能生成内容(AIGC)行业重点上市企业经营状况分析,2021-2023年中国人工智能生成内容(AIGC)行业投资潜力分析,对2025-2031年中国人工智能生成内容(AIGC)行业发展前景及趋势预测等内容。
版权提示:智研咨询倡导尊重与保护知识产权,对有明确来源的内容注明出处。如发现本站文章存在版权、稿酬或其它问题,烦请联系我们,我们将及时与您沟通处理。联系方式:gaojian@chyxx.com、010-60343812。