打开APP
×
再见ChatGPT!Deepseek爆火海外 霸榜美区App Store下载榜
财联社 刘蕊
2025-01-27 星期一
原创
①国产AI模型Deepseek R1一经发布便轰动海内外AI圈;
②目前,Deepseek应用已经登顶苹果中美两区免费APP下载榜,在美区超越ChatGPT;
③Deepseek已经在海外社交平台上引发热议,不少科技爱好者直言其已经成为OpenAI和Meta的有力竞争对手。
人工智能
关注

财联社1月27日讯(编辑 刘蕊)1月20日,国产大模型公司杭州深度求索正式发布DeepSeek R1模型。这一模型展示了在数学、编程和推理等关键领域的表现甚至能媲美OpenAI的最强推理模型o1,但其API调用成本却低了90%-95%。

仅仅一周时间,这一最新模型的优越表现和超低成本就让整个硅谷都慌了神,轻而易举地轰动了海内外AI圈。

随着DeepSeek热度不断攀升,1月26日,DeepSeek应用一度因用户流量暴增,出现服务器短暂繁忙甚至“崩溃”的情况。1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

苹果美区应用商店免费APP下载排行榜

中信证券研报指出,DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本,推理成本的降低,将是AI应用普及的前奏。预计模型性价比持续提升下,国内AI应用依托丰富生态和成熟流量加速各领域落地。其中,Agent模式有望以更长的任务流程、更好的场景理解、更高的自主能力,成为所有互联网用户的数字助手,在企业管理、教育、办公、金融等领域展现应用价值。

DeepSeek获海外科技大佬超高评价

DeepSeek之所以爆火,一方面是由于它以更低的训练成本取得与OpenAI o1相当的性能,可谓十足的“物美价廉”;另一方面,它作为一款开源模型,采用MIT许可协议,支持免费商用、任意修改和衍生开发等。所以也难怪众多科技家大佬都对DeepSeek予以了超高评价。

DeepSeek-V3在仅使用2048块H800 GPU的情况下,完成了6710亿参数模型的训练,训练成本仅为557.6万美元,远低于其他顶级模型的训练成本(例如GPT-4的10亿美元)。因此,一些人认为,DeepSeek可能会颠覆英伟达在AI硬件领域的主导地位。

上周三,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在达沃斯世界经济论坛上表示:“DeepSeek 的新模型非常令人印象深刻,他们不仅有效地开发出一种开源模型,实现了推理时间计算,而且计算效率极高…我们应该非常认真地对待中国的发展。”

Meta首席AI科学家、图灵奖得主Yann LeCun表示,DeepSeek的成功,并不应该被看作中国的人工智能“超越了美国”,而应看作“开源模型正在超越专有模型”。

LeCun写道:“DeepSeek 受益于开放研究和开源…他们提出了新的想法,并在其他人的工作基础上构建了这些想法。因为他们的工作是公开的和开源的,所以每个人都可以从中受益。”

英国《金融时报》指出,DeepSeek 的成功颠覆了“AI研发必须依赖巨额投入”的传统认知,证明精准的技术路线同样可以取得优异的研究成果。更重要的是,DeepSeek 团队对技术创新的开放和分享,让这家公司成为了挑战了OpenAI、Google和Meta等老牌公司主导地位的异常强劲的竞争对手。

目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。

引发科技圈人士热议

事实上,除了科技大佬和媒体,DeepSeek也已经在海外热爱科技的大众人群中掀起热潮。

在社交平台X上,DeepSeek已经成为热门话题。一位科技爱好者在X发布一篇贴文名为“再见ChatGPT!”的贴文,直言DeepSeek最新模型才发布五天,世界已经被其潜力所震惊。这篇贴文获得了超过8000个转发和超5万点赞。

另一位科技圈人士用电影《钢铁侠》的片段制作了meme动图,嘲讽“硅谷就是个骗局”,因为DeepSeek的开发成本相比于众多美国AI巨头可谓微不足道,如同是在山洞里面用一堆破铜烂铁造出来的钢铁侠。

还有人在这张meme图中反派角色头上PS了META和扎克伯格的头像,暗讽DeepSeek的出现把META和扎克伯格打的措手不及。

事实上,相比于OPENAI的ChatGPT,META旗下的开源AI模型Llama系列的确是DeepSeek最直接的竞争对手。

据悉,随着DeepSeek爆火,Meta生成AI小组和基础设施团队的经理和工程师已开设了四个作战室来学习DeepSeek的工作原理:其中两个动员起来的小组正在试图了解幻方如何降低训练和运行DeepSeek的成本;第三个Meta研究小组正在试图弄清楚幻方可能使用哪些数据来训练其模型;第四作战室正在考虑基于DeepSeek模型属性重构Meta模型的新技术。

特别声明:文章内容仅供参考,不构成投资建议。投资者据此操作风险自担。
相关新闻
抄底成功
相关企业家
联系Ta
联系企业家
为保护双方个人信息请联系您的专属助理进行接洽
我再想想
点击复制
复制成功,请去微信添加