核心观点 DeepSeek-R1 模型发布,具有高性能、低算力需求的特性,带动小模型推理能力的提升,引发全球开发者及用户关注。R1 作为开源模型性能接近头部闭源模型o1,一定程度上已经反映了AI 平权,同时纯强化学习对推理能力的提升带来RL 范式泛化可能,预计后续基模的持续迭代,有望推动AI 全产业链持续保持高景气和高关注度,关注算力、应用、端侧、数据等核心投资机会。 行业动态信息 DeepSeek 模型密集更新,高性能+低成本促进用户数高增近期DeepSeek 多款模型上线并完全开源,其中R1 在推理任务上基本实现于o1 相当的性能,Janus-Pro 在多模态理解和生成方面表现较好。受春节信息传播下沉促进,DeepSeek 出圈并成为全球增速最快的 AI 原生应用,第18 天达到1500 万日活。此外,DeepSeek 通过算法迭代、架构升级,使通用及推理模型成本相较于OpenAI 同类模型下降至数十分之一以下。 技术不断革新,大模型Scaling Law 仍有效 DeepSeek 通过多头潜在注意力、MoE、多token 预测等架构和基础设施创新实现了高效训练,并在R1-Zero 模型验证了纯强化学习对推理能力的提升。尽管Pre-Training Scaling 面临技术、算力、数据的制约,但强化学习带来了规模化扩张新方向,预计各厂商将陆续跟进,持续优化模型架构。 DeepSeek-R1 促进AI 平权,产业链享受发展红利R1 作为开源模型性能接近头部闭源模型o1,一定程度上已经反映了AI 平权。同时,R1 使小模型具备推理能力成为可能,更低的成本将更有利于开发者探索AI 的实际落地。 投资建议:1)算力:算力建议关注以国产算力和AI 推理需求为核心的算力环节,尤其是IDC、服务器、国产芯片等算力配套产业,推荐海光信息、浪潮信息、软通动力,并关注AIDC相关标的,如并行科技、宝信软件等;2)应用:B 端推荐金蝶国际、鼎捷数智、赛意信息、用友网络、恒生电子、中控技术等;C 端推荐金山办公、万兴科技、彩讯股份、同花顺等;3)端侧:教育推荐视源股份、科大讯飞等;其次新终端推荐虹软科技、联想集团等;4)数据:建议关注向量数据库、数据处理类企业,以及具备行业侧专业数据的厂商,关注拓尔思等。 【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:
发表评论