财联社4月12日电,OpenAI在其网站上表示,从4月30日起,GPT-4将被GPT-4o“完全替代”,但GPT-4将继续通过API提供使用。OpenAI称,“在面对面的评估中,它(4o)在写作、编码、STEM等方面持续超过GPT-4。”据美媒The Verge 10日报道,OpenAI下周将揭晓一系列新的AI模型,其中将包括GPT-4.1, 这将是4o多模态模型的改进版。OpenAI同时还将推出更小的GPT-4.1 mini和nano版本,以及o3“推理”模型和新的名为o4-mini的推理模型。
《科创板日报》10日讯,今日,月之暗面Kimi开源轻量级视觉语言模型Kimi-VL和Kimi-VL-Thinking,新模型采用MoE架构,支持128K上下文,激活仅约30亿参数;多模态推理能力在多个基准测试中,超过10倍大小的大模型。
①OpenAI将暂时对ChatGPT生成图片的功能引入一些速率限制; ②让AI生成更精确、更高清的图像依赖于GPU的大规模并行计算; ③OpenAI因新功能面临的问题,折射了AI多模态技术发展中的资源与需求平衡难题。
《科创板日报》3日讯,《科创板日报》记者今日获悉,2025年将是国内大模型独角兽智谱的开源年,其很快会发布全新大模型(包括基座模型、推理模型、多模态模型、Agent等),并将其开源。(记者 李明明)
财联社2月26日电,当虹科技涨超10%,万兴科技、开普云、华策影视、因赛集团、虹软科技、中广天择、华扬联众等跟涨。消息面上,阿里巴巴于昨日晚间全面开源旗下视频生成模型万相2.1模型,视频生成、图像生成两大能力均获得提升。
财联社2月21日电,在2月21日开幕的全球开发者大会(GDC)上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括基于300亿参数、全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。
财联社2月18日电,在百度财报后的电话会上,百度董事长李彦宏透露,文心大模型4.5将开源,4.5将是百度有史以来最强大的大模型。他表示,开源4.5系列的决策源自于对技术领先地位的信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力,“但我想强调的是,无论开源闭源,基础模型只有在大规模解决现实问题时,才具备真实价值”。未来,百度将加速推动文心大模型的性能升级与成本降低。
视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。不同于Sora 、DALL-E 、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。 目前,该项目代码与模型已开源。
《科创板日报》5日讯,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。(记者 黄心怡)
《科创板日报》19日讯,在云栖大会期间,通义万相大模型发布文生视频能力。同时,通义千问新一代开源模型Qwen2.5发布,涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,总计上架100多个模型。(记者 黄心怡)
①Meta发布开源大模型Llama 3.1,这是Meta目前为止规模最大的大语言模型,性能对标GPT-4o和Claude3.5; ②大模型开源和闭源优劣比较时有发生,随着Llama 3.1发布,二者获或迎来新一轮激斗; ③英伟达同期推出组合服务,为Llama 3.1助攻。
《科创板日报》6日讯,今日,在2024世界人工智能大会(WAIC)上,启明创投发布了2024《生成式AI》报告预告,其中对多模态模型作出预测:将出现图像和文本的统一连续表示,并且基于此的图文联合扩散模型将达到GPT—10级别能力;3年内视频生成将全面爆发,结合3D能力,可控多视频生成将对影视、动画、短片的生成模式带来变革。(记者 李明明)
①《科创板日报》记者实测发现谷歌Gemini 1.5 Pro在文本理解能力上优于GPT-4o,但在多模态理解方面,GPT-4o更胜一筹; ②前华为“天才少年”预测国内第一个端到端多模态大模型年底将到来。
财联社5月13日电,多模态AI概念震荡回升,中胤时尚、网达软件涨停,万兴科技、佳发教育、因赛集团、值得买等跟涨。消息面上,OpenAI在社交媒体X上宣布,将于5月13日上午10点(北京时间5月14日凌晨1点)在其官网上直播演示ChatGPT和GPT-4的更新。据硅谷科技媒体The Information报道,OpenAI正在开发具备音频和视觉理解能力的AI语音助手,最早可能会在5月13日的活动上预览。
①生数科技在两个月内有如此提升已经是算法和工程能力上的突破,但在同等性能表现下追平Sora的1分钟时长,还有较长的一段路要走。 ②目前,Vidu对外公布的时长上限是16秒,Sora最大时长则是1分钟。