财联社2月12日电,DeepMind CEO哈萨比斯当地时间2月11日表示,“算力仍是AI基础设施的关键组成部分,不仅在探索新想法时需要,前沿领域的创新也依赖大规模实验。”
①该架构在保证模型效果的前提下,推理速度较传统的MoE架构提升2-6倍,推理成本最高可降低83%; ②大模型的推理能力对应的是端侧AI工具的响应能力和速度,直接影响用户体验; ③先前的研究者提出了MoE和PKM(Product Key Memory)方案,但它们都有各自的局限性。
财联社2月12日电,国家超算互联网平台2月11日晚间宣布推出“AI生态伙伴加速计划”,提供3个月DeepSeek API接口免费使用、千万卡时算力资源池等激励。据介绍,超算互联网平台已上线DeepSeek满血版的模型镜像,并为有需求的企业免费开放3个月DeepSeek API接口。
财联社2月11日电,伴随着DeepSeek持续出圈,DeepSeek智算一体机等硬件热度一路飙升,各行业需求明显增长。为了满足企业的私有化、国产化部署需求,中国电信天翼云正式推出息壤智算一体机-DeepSeek版,为各行各业提供性能卓越、安全可控的智能算力解决方案。中国电信天翼云将全力满足国央企、高校对天翼云息壤DeepSeek一体机开箱即用的需求。
①火山引擎智将围绕多元模型部署调用、火山方舟上API调用DeepSeek R1、火山引擎部署DeepSeek方案、DeepSeek平台上开发AI应用等开展研讨会。 ②阿里云、华为云、百度云、腾讯云、优刻得等厂商也都陆续在其云服务平台上线了DeepSeek的大模型
财联社2月8日电,京东云发布DeepSeek大模型一体机,具备国产算力全适配、支持丰富大模型参数规格、AI应用开箱即用、超高性价比等核心特性,助力用户一站式构建自主可控的AI生产力。
①多家AI芯片初创公司透露,随着越来越多的客户采用DeepSeek开源模型,推理算力需求正在攀升。 ②DeepSeek日前暂停API服务充值,也反应了算力还是不够用。 ③当DeepSeek通过技术降本,为AI应用打开更多落地场景,“杰文斯悖论”或许也将在AI行业应验。
财联社2月8日电,财联社记者今日从中国电子云方面获悉,中国电子云CECSTACK智算云平台正式上线MoE架构的671B全量DeepSeek-R1/V3模型,以及DeepSeek-R1的蒸馏系列Qwen/Llama模型,并提供私有化部署方案,为党政、央国企及关键行业用户提供智能化解决方案。小财注:据悉,中国电子云CECSTACK智算云平台目前已适配包括昇腾、天数、沐曦、燧原、摩尔线程、昆仑芯、登临科技等国产算力,使国产算力快速适配DeepSeek-R1/V3全系列模型推理API服务能力。同时,中国电子云面向专业用户提供基于DeepSeek系列大模型的垂类大模型训练开发能力;提供DeepSeek模型全栈推理服务与行业场景应用解决方案的智算云平台,通过DeepSeek-R1/V3大模型赋能RAG与Agent应用;针对模型推理场景,推出为DeepSeek优化的推理一体机。(财联社记者 付静)
①DeepSeek迎部署适配潮,芯片、云计算、智算厂商等陆续宣布适配; ②算卡经销商称中小算力需求在增加。多位受访者认为,长期看DeepSeek将提升算力需求,高质量开源低价模型将带动AI繁荣; ③蛇年前三个交易日,DeepSeek“点燃”了A股科技板块行情。
《科创板日报》6日讯,燧原科技今日宣布,DeepSeek的全量模型已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署,将为客户及合作伙伴提供高性能计算资源,提升模型推理效率,同时降低使用门槛,大幅节省硬件成本。
《科创板日报》6日讯, 云天励飞DeepEdge10 “算力积木”芯片平台,已经完成与DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Llama-8B大模型的适配,可以交付客户使用。DeepSeek-R1其他模型适配完成后,DeepEdge10芯片平台将在端、边、云全面支持DeepSeek全系列模型。
财联社2月5日电,AMD股价盘后重挫逾10%。AMD数据中心第四财季营收同比增长69%,至38.6亿美元,但低于分析师预估的40.9亿美元,显示其在人工智能算力领域未能缩小与英伟达的差距。AMD预计当前季度总营收料在68亿至74亿美元之间,分析师的平均预估为70.4亿美元。AMD的财报令投资者担忧该公司进军AI算力领域的势头正在减弱。
财联社2月5日电,中信建投研报表示,DeepSeek R1训练和推理算力需求较低,主要原因是DeepSeek R1实现算法、框架和硬件的优化协同。过去的预训练侧的scaling law正逐步迈向更广阔的空间,在深度推理的阶段,模型的未来算力需求依然会呈现爆发式上涨,充足的算力需求对于人工智能模型的性能进步依然至关重要。
《科创板日报》31日讯,天风国际证券分析师郭明錤发布报告指出,DeepSeek-R1发布后,有以下两个重要的AI产业新趋势值得关注。就算没有DeepSeek-R1,这两个趋势终将显著浮现,但DeepSeek-R1的出现,加速了趋势发生。一、Scaling Law边际效益放缓时,AI算力仍可透过优化训练方式持续成长并有利挖掘新应用。二、API/Token价格显著下滑,有利AI软件/服务与装置AI,加速AI应用多元化。
财联社1月29日电,中国人工智能(AI)企业深度求索(DeepSeek)日前发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于美国开放人工智能研究中心(OpenAI)开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖,其影响波及资本市场。摩根士丹利认为,DeepSeek的模型表明,前沿AI能力可能不需要大量计算资源就能实现。通过巧妙的工程设计和高效的训练方法,高效利用资源可能比纯粹的计算能力更重要。这可能会激发一波创新浪潮,各家企业会探索具有成本效益的AI开发和部署方法。
①DeepSeek爆火之下,新一轮“算力怀疑论”再度升起。 ②全球五大云厂商即将集中披露财报,历次财报季这“五朵云”的资本支出情况,一定程度上已经成为算力投资的“风向标”。 ③主要算力硬件厂商的财报也将悉数登场,例如英特尔、AMD等。
财联社1月27日电,寒武纪跌幅扩大至近10%,成交超40亿元,另外天孚通信、中际旭创、工业富联、中兴通讯等多只科技权重股跌超4%。
①在四川天府新区科创生态岛,无人机化身为“智能空中配送员”,把一杯咖啡按时、准确地送到顾客手中,其背后是5G-A低空监管运营服务平台的控制。 ②除了物流配送外,5G网联无人机的另一大应用场景是巡检。
财联社1月21日电,针对美国前总统拜登任内推出的AI芯片管制新规,欧盟将向特朗普政府提出关切。根据上述新规,波兰等东欧国家在购买美国制造的AI芯片方面面临算力限制。欧盟方面认为,此举违背单一市场原则,不公平地偏袒西欧企业,将阻碍东欧地区创新。拉脱维亚、爱沙尼亚和立陶宛上周曾发布联合声明,对美方新规表示关切,称“美国的决定可能在欧洲单一市场中造成人为分化”,破坏部分国家AI生态系统的发展。波兰数字事务部长加夫科夫斯基则表示,美国白宫的决定“令人费解,没有任何实质性理由”。
财联社1月21日电,工业和信息化部信息通信发展司司长谢存今日在发布会表示,2024年,全年电信业务收入累计超过1.7万亿元,电信业务总量同比增长10%。网络基础能力显著提升。建成全球规模最大的移动通信和光纤宽带网络,5G基站达到425万个,千兆用户突破2亿,实现“县县通千兆,乡乡通5G”。30年来首次批准新设6个国际出入口局,互联网骨干直连点总量达到29个。移动物联网加快从“万物互联”向“万物智联”发展,终端用户超过26亿户,“物超人”持续扩大。在用算力中心标准机架数超过880万,算力规模较2023年底增长16.5%。