①近年来国内模型进步显著,本次DeepSeek-R1的发布,在性能对齐OpenAI-o1正式版、但成本更低,有望带来下游更为广泛的应用落地和商业化机会。 ②西部证券认为,交互型多模态大模型的出现有望推动人机交互变革。
幻方量化旗下AI公司DeepSeek一夜爆火,刷屏美国各大主流媒体和社交网站。1月24号,一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。这位Meta员工写道:“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。
1月25日,AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。中信证券研报指出,DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本,推理成本的降低,将是AI应用普及的前奏,正如4G提速降费给我国移动互联网产业提供了助力。预计模型性价比持续提升下,国内AI应用依托丰富生态和成熟流量加速各领域落地。
据财联社主题库显示,相关上市公司中:
每日互动2024年7月2日互动易回复称,公司在第一时间接入ChatGPT、文心一言、ChatGLM、通义千问、DeepSeek等国内外通用大模型,开发出垂直场景类大模型应用。
航锦科技控股子公司超擎数智可提供最优的AI服务器+GPU+智能网卡/DPU+交换机+光模块/AOC/DAC整体解决方案,其公司官网显示超擎数智合作伙伴包括幻方量化。