Meta强势发布开源大模型Llama 3.1 英伟达也来助攻

科创板日报记者张洋洋 2024-07-24 11:48

①Meta发布开源大模型Llama 3.1，这是Meta目前为止规模最大的大语言模型，性能对标GPT-4o和Claude3.5；
                ②大模型开源和闭源优劣比较时有发生，随着Llama 3.1发布，二者获或迎来新一轮激斗；
                ③英伟达同期推出组合服务，为Llama 3.1助攻。

《科创板日报》7月24日讯（记者张洋洋） 扎克伯格将大模型开源进行到底。

今天凌晨，Meta正式发布新一代开源大模型Llama 3.1系列，其中包含8B、70B 和405B三个版本，最大上下文提升到了128k。

Meta创始人扎克伯格同时在官网发文为自家模型强力代言。他称，当今大多数领先的科技公司和科学研究都是建立在开源软件之上，开源是AI前进的方向，Meta正朝着成为开源AI行业标准的目标迈进。

需要强调的是，在科技界，关于开源和闭源的争端由来已久。批评者认为开源掩盖了技术原创性缺失，只是对开源模型简单调整，而非实质创新。百度创始人李彦宏甚至表示开源大模型在学术研究、教学领域等特定场景下有存在的价值，但并不适用于大多数应用场景。支持者则认为，基于成熟开源架构进行定制化改进是技术发展的常态，它能推动技术的快速创新和进步。

在大模型领域，开源和闭源大模型优劣比较也时有发生。到目前为止，开源模型在功能和性能方面大多落后于封闭式模型。但随着Llama 3.1的发布，大模型开源和闭源或将迎来新一轮激斗。

根据Meta提供的基准测试数据，Llama 3.1有4050亿参数，是近年来规模最大的大语言模型之一。该模型基于15万亿个Tokens、超1.6万个H100 GPU上进行训练，这也是Meta有史以‮第来‬一个以这‮规种‬模进‮训行‬练的Llama模型。Meta称，在常识、可操纵性、数学、工具使用和多语言翻译等先进功能方面，Llama 3.1足以对标GPT-4o和Claude3.5Sonnet等顶级闭源大模型。

Llama 3.1现已于Meta官网和Hugging Face开放下载。最新数据显示，所有Llama版本的总下载量已超过3亿次。

就在当天同一时间，英伟达也推出组合训练服务，为Llama 3.1强势助攻。

《科创板日报》记者从英伟达方面了解到，英伟达正式推出全新的NVIDIA AI Foundry 服务和NVIDIA NIM™推理微服务。NVIDIA AI Foundry 是由 NVIDIA DGX™ Cloud AI平台驱动，该平台由NVIDIA与公有云共同设计，可为企业提供大量的算力资源。

NVIDIA AI Foundry 、NVIDIA NIM™配套Llama 3.1系列开源模型一起使用，企业可以为其特定领域的行业用例创建自定义“超级模型”。企业还可以使用自有数据以及由Llama 3.1 405B和NVIDIA Nemotron™ Reward模型生成的合成数据，来训练这些超级模型。

英伟达创始人兼首席执行官黄仁勋则表示，Meta 的 Llama 3.1开源模型标志着全球企业采用生成式AI的关键时刻已经到来。Llama 3.1 将掀起各个企业与行业创建先进生成式AI应用的浪潮。NVIDIA AI Foundry已经在整个过程中集成了Llama 3.1，并能够帮助企业构建和部署自定义Llama超级模型。

财联社声明：文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。