Agent不用担心催化剂,随时都有[淘股吧]
————————
【申万计算机】2025中外AI主线:开源、轻量化、原生多模态和Agent!

#近期中外大模型赛道更加火热
#GPT-4o新原生图像生成功能亮点,取代DALL-E3单独调用,采用原生多模态模型直接生成。采用全新视觉自回归技术路径,较过往扩散模型在结果细节、精准度、理解能力和多次交互一致性上亮点突出。

#llama4开源发布亮点:原生多模态+MoE架构成为轻量级原生多模态模型,中杯Maverick128专家模块17B活跃参数,性能媲美主流闭源/开源模型,单个H100可运行,API价格比Deepseek更优惠。2万亿参数超大版本Behemoth未来将发布。低成本、高性能来源于重新设计的技术架构。

#智谱新一代Agent发布亮点,1)首次将DeepResearch和Agent工作流结合,每步任务更多反思提升完成准确度和深度,平均单任务需20分钟完成;2)视觉理解能力为核心,能够自行搜索B站理解视频和登录小红书理解图片类数据,绕过数据授权限制;3)更轻量化,基座模型32B,推理模型速度相比DS-R1提升8倍,成本将至1/30,支持消费级卡运行。

#核心启示:
除了推理模型,原生多模态模型同是重点!近期关注度较多在推理模型,中外主流厂商同样聚焦原生多模态大模型,GPT-4o的自回归技术路径可能解决此前扩散模型的瓶颈。

更轻量化的趋势,利于端侧使用。更多蒸馏的高性能小参数量模型出现,支持消费级显卡部署友好。

Agent能力在跃升,目前类似GPT3到ChatGPT阶段。模型推理能力的提升仍是Agent发展重点。

Agent Scaling Law,算力需求提升。DeepResearch+Agent模式单个任务的计算量百倍,扩散后对推理侧算力需求会飞速提升。

更多强开源模型,AI应用继续爆发。DeepSeek、Llama4、智谱等中外开源模型陆续展现出媲美闭源模型的性能且部署友好,有望带动AI应用热潮。

#后续关注催化预计:
DeepSeek V3.5/V4/R2(预估4月)、oai o3和o4-mini发布(预估4月)、智谱正式开源(4月)、商汤全新日日新多模态融合大模型发布(4月)、GPT-5发布(25H2)、Qwen 2.5Max、QWQ Max等。

#建议关注AI多模态、Agent企业流程自动化、AI医疗、AI金融等场景:
AI多模态:虹软科技
AI Agent:金山办公泛微网络金蝶国际汉得信息鼎捷数智新致软件中科创达税友股份迈富时明源云、中软国际、焦点科技
AI医疗:润达医疗
AI金融:同花顺