①AMD管理层在财报会上大幅上修服务器CPU长期市场空间,并强调公司与Meta、OpenAI等头部客户的大规模AI算力合作持续深化;
②AMD CEO苏姿丰在本次会议释放出强烈信号:AI推理与智能体应用正重塑算力结构,CPU地位正不断抬升,AMD已进入新一轮高增长通道。
《科创板日报》5月6日讯 当地时间5月1日,欧洲AI新锐Nebius(NASDAQ:NBIS)宣布,将以约6.43亿美元现金加A类股票的组合,收购AI推理与模型优化公司Eigen AI。
这笔交易核心指向Nebius旗下平台——Token工厂,其旨在吸收Eigen AI在推理性能优化方面的优势,让该平台从通用托管推理平台,跃升为全球生产级AI推理的标杆,助力Nebius在全球AI基建竞争中抢占制高点。
Nebius脱胎于俄罗斯科技巨头Yandex,2024年初完成业务分拆后于荷兰阿姆斯特丹成立,创始人阿尔卡季・沃洛日有“俄罗斯马云”之称。
作为欧洲头部AI云厂商,Nebius背靠顶级资本,2026年3月获英伟达20亿美元战略投资,双方计划到2030年共建超5吉瓦算力中心,该公司同时得到ISL等机构加持,并于2024年10月登陆纳斯达克,市值一度突破340亿美元,核心业务为全球AI算力交付与企业级托管推理平台Token工厂。
该平台是行业“Token工厂”概念的标杆级产品——它以大规模、高性能、低成本的Token生成能力为核心,为企业和开发者提供从模型部署、优化到量产推理的一站式解决方案,是 Nebius AI云业务的核心引擎。
Token工厂作为Nebius核心引擎,是Nebius倾力打造的专业Token生成与大模型推理工厂平台,是行业“Token工厂”概念的标杆级产品——它以大规模、高性能、低成本的Token生成能力为核心,为企业和开发者提供从模型部署、优化到量产推理的一站式解决方案。通俗来说,它是面向企业与开发者的一站式大模型部署推理中枢,主打高性能Token吞吐、模型量化部署、自动弹性扩缩容、长文本与MoE模型适配、低成本批量Token生成服务,也是行业所说的Token工厂核心载体。平台可承接各类开源及定制大模型的上线、调度、推理、运维全流程,核心价值就是高效量产低成本Token,满足AI应用、智能交互、内容生成等行业的海量算力与Token需求。
作为本次收购的标的,Eigen AI虽规模较小,是一家仅20人的硅谷初创公司,但其技术直击AI推理“降本增效”核心痛点。
该公司由麻省理工学院(MIT)HAN实验室校友Ryan Hanrui Wang与Wei-Chen Wang创立,深耕大模型推理性能优化领域,其核心成员主导开发的AWQ4位量化、SpAtten稀疏注意力等行业标配技术,能显著降低显存占用、提升GPU利用率、大幅压低单Token生成成本,相关论文屡获国际顶会奖项,技术被广泛应用于全球AI模型生产部署。
当下AI行业已进入推理为王、Token为王的阶段,推理算力消耗占据AI总算力需求大半,谁能掌控高性能、低成本的Token量产能力,谁就能掌握AI产业话语权。
根据Semianalysis数据,如今模型需要处理超过100万亿个token,推理模型的token数量是之前的20倍,计算量是之前的150倍。国家数据局数据显示,2024年初中国日均Token的消耗量仅为1000亿,而2025年6月底日均Token消耗量已突破30万亿,1年半时间增长了300多倍。根据IDC预测,到2030年,全球活跃AI智能体将达22.16亿,年度Token消耗量将从2025年的0.0005 Peta Tokens飙升至15.2万Peta Tokens,增长超3亿倍。
Nebius拥有庞大算力底座与资本加持,但缺少顶尖底层推理优化算法,Eigen AI手握核心技术与顶尖人才,却缺乏大规模算力与商业化交付能力,两家公司因此一拍即合。
交易完成后,Eigen AI全套算法、优化框架将全面并入Nebius的Token工厂,从底层重构模型推理调度、量化压缩、长上下文处理能力,直接提升平台Token产出效率、降低生产成本。同时,Eigen AI创始团队全员加入Nebius,在旧金山湾区设立Nebius研发中心。