投资要点:
豆包大模型家族全面升级,正式发布视觉理解模型,起步晚但跑得快。2024 年12月18 日,2024 火山引擎FORCE 原动力大会·冬正式召开,火山引擎带来豆包大模型家族全新升级,重磅推出视觉理解模型。据火山引擎总裁谭待介绍,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,有着细腻的视觉描述和创作能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。再则,豆包大模型多款产品也迎来重要更新:豆包通用模型pro 已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60 秒的简单结构,升级到生成3 分钟的完整作品;文生图模型2.1 版本,在业界首次实现精准生成汉字和一句话P 图的产品化能力,该模型已接入即梦AI 和豆包App;3D生成模型也首次亮相,该模型与火山引擎数字孪生平台veOmniverse 结合使用,成为一套支持AIGC 创作的物理世界仿真模拟器。谭待表示,豆包大模型虽然发布较晚,但一直在快速迭代,目前已成为国内最全面、技术最领先的大模型之一。豆包大模型12 月日均tokens 使用量超过4 万亿,较5 月发布时期增长超过33 倍。
字节AI 再次掀起价格战,视觉理解模型进入“厘时代”,爆款应用有望加速涌现。
2024 年5 月15 日,在2024 春季火山引擎FORCE 原动力大会上,字节跳动自研大模型家族全体亮相,豆包通用模型pro(32k)的价格为0.0008 元/千tokens,使得语言模型进入“厘时代”。与32k 及以下模型的业内价格相比,豆包比行业价格低99.3%。此次冬季大会,字节AI 再次将视觉理解模型价格带入“厘时代”。豆包·视觉理解的输入价格为每千tokens 0.003 元,比行业平均价格降低85%,相当于一块钱可以处理284 张720P 的图片。同时火山引擎还将提供更高的初始流量,RPM 达到了15000 次,TPM 达到120 万,让企业和开发者用好视觉理解模型,找到更多创新场景。豆包·视觉理解模型在教育、旅游、电商等场景有着非常广泛的应用,“厘时代”价格将伴随着视觉理解模型能力的提升,低成本挖掘更广阔的应用场景,有望提高大模型场景开发的价值天花板。
豆包垂类行业/端侧AI 的tokens 使用量增长迅猛,火山引擎助力企业AI 应用轻松落地。火山方舟、扣子平台和HiAgent 等平台持续升级,加速了大模型落地,为企业和开发者提供高效的工具。火山引擎推出全域AI 搜索,通过场景化搜索推荐一体化服务、企业私域信息整合服务、联网问答服务,将企业的信息、业务和用户需求紧密结合;扣子1.5 发布,提供全新的AI 应用开发环境,具备更强的多模态能力,涵盖多业务场景的精品模板;HiAgent 1.5 发布,敏捷构建企业级AI 原生应用的能力中心,更懂AI 转型、更深业务适配、更强安全保障。在行业垂类场景,豆包大模型获得了众多企业客户青睐:最近3 个月,豆包大模型在信息处理场景的调用量增长了39 倍,客服与销售场景增长16 倍,硬件终端场景增长13 倍,AI 工具场景增长9 倍,学习教育等场景也有大幅增长;在终端场景,字节表示,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC 等智能终端,覆盖终端设备约3 亿台,来自智能终端的豆包大模型调用量在半年时间内增长100 倍。
投资建议。建议关注:1)豆包链:乐鑫科技、润泽科技、汉得信息、掌阅科技、梦网科技、海天瑞声、天键股份、中科蓝讯、炬芯科技;2)AI Agent:金山办公、万兴科技、泛微网络、金蝶国际、福昕软件、彩讯股份、致远互联、鼎捷软件、汉得信息、用友网络、科大讯飞、焦点科技、金证股份、华策影视、中国软件国际等。
风险提示:技术发展不及预期、AI 商业化进展不及预期、用户粘性不及预期等。
知前沿,问智研。智研咨询是中国一流产业咨询机构,十数年持续深耕产业研究领域,提供深度产业研究报告、商业计划书、可行性研究报告及定制服务等一站式产业咨询服务。专业的角度、品质化的服务、敏锐的市场洞察力,专注于提供完善的产业解决方案,为您的投资决策赋能。
转自德邦证券股份有限公司 研究员:陈涵泊/李佩京/王思
2024-2030年中国多模态大模型行业市场现状分析及前景战略研判报告
《2024-2030年中国多模态大模型行业市场现状分析及前景战略研判报告》共九章,包含全球及中国多模态大模型企业案例解析,中国多模态大模型行业政策环境及发展潜力,中国多模态大模型行业投资机会及策略建议等内容。
版权提示:智研咨询倡导尊重与保护知识产权,对有明确来源的内容注明出处。如发现本站文章存在版权、稿酬或其它问题,烦请联系我们,我们将及时与您沟通处理。联系方式:gaojian@chyxx.com、010-60343812。