①如果说长文本是月之暗面登月的第一步,那么提升模型深度推理能力则是第二步。除了数学推理模型外,几个多模态能力也在内测中。 ②Kimi每月的活跃用户规模已经达到3600万。提升用户留存,成为目前最核心的任务。
《科创板日报》6月9日(记者 李明明)近日,文生视频明星创企Pika宣布,日前已完成总额8000万美元(约合人民币5.8亿元)的B轮融资,由Spark Capital领投,Greycroft、Lightspeed Venture Partners以及Jared Leto参投。
对于此次融资的用途,Pika团队表示,这一轮融资将加快公司构建最佳视频模型的进程,同时帮助聘用优秀的人才。
本次Pika获得的融资额位于文生视频领域前列。作为一家刚成立一年不到的创业企业,其在一级市场的强大号召力再度引发了市场关注。
但有大模型创企工程师告诉《科创板日报》记者,Pika在视频生成时长、动作流畅度以及真实物理定律等方面,当前的竞争力略弱于同行,这也导致了Pika的网站访问量出现了增长乏力的趋势。
那么,在Pika相较竞品没有突出优势的情况下,为何本次获得投资人青睐?
另有业内人士对《科创板日报》记者透露,Pika本轮能继续获得大额融资,或与其即将推出的新品直接相关。
至今已完成五轮融资
Pika成立于2023年4月,创始人郭文景和孟辰霖都是斯坦福大学AI Lab博士生,她们分别专注于NLP和计算机视觉两个方向的AI研究,也有生成式AI的学术经历。
去年11月,Pika发布首款AI视频生成产品Pika 1.0,现在可供免费使用。此款应用能够生成和编辑3D动画、动漫、卡通和电影等各种风格的视频,同时能根据需求对图片等进行扩容,一经推出便在各大社交媒体上迅速走红。
爱智岛AIGC创作者社区AI视频技术负责人徐依伟对《科创板日报》记者分析,Pika1.0最大的突破点在于,支持用户实时进行视频的编辑和修改,即用户在生成一个原创视频后,如果还想要修改视频的局部,可以再次输入简短的指令,即可修改固定或移动的物体。“彼时Pika可以说是Runway的免费平替,因此一经上线就收获了大量关注。”
截至目前,Pika 已完成五轮融资,总融资额累计达1.35亿美元,投资方也是明星云集,包括 Quora 创始人亚当・德安杰洛 (Adam D'Angelo) 、Github 前首席执行官 Nat Friedman、硅谷投资人Daniel Gross、Color 联合创始人 Elad Gil、Giphy 联合创始人 Alex Chung等。
本次的领投方Spark Capital,是一家成立于2005年的美国资产投资管理公司,主要关注于娱乐、传媒和高科技行业的投资。近年,其投资中心偏向人工智能,Anthropic是在生成式人工智能的被投项目之一。
对于Pika持续受到众多资方关注的原因,创道硬科技创始人步日欣认为,文生视频是目前大模型应用中最令人期待的功能,被认为是文本生成之后的又一大突破,“但是从实际效果看,目前还鲜少有产品很难真正符合用户的预期,这也是资本市场对这个领域持续看好的原因,因为还有提升和发展空间。”
上述业内人士对《科创板日报》记者透露,Pika本轮能继续获得大额融资,或与其即将推出的新品直接相关。“新品目前仍在保密状态,但从行业目前的发展趋势看,DiT架构的优化和新拓展会是新品的关注重点。”
明星项目竞争乏力?
尽管Pika仍保持着在资本市场的极高热度,但其在用户市场的受关注度出现下滑。刚上线时,Pika的网站访问量在 1 个月内增长约两倍,而据最新数据,Pika 4月的网站访问量仅200 万,较去年11 月刚上线时多了40万。
上述业内技术人士表示,这与Pika的视频生成时长、质量都有直接关系。
文生视频的生成时长一直是个瓶颈,用此作为维度衡量,Pika目前达到约4秒左右,相较竞品并不算出色。
而同行企业方面,OpenAI的Sora长达60秒;生数科技发布的Vidu生成时长为16 秒;Runway的Gen-2为18 秒;前京东副总裁梅涛成立的Hidream为15秒以上。
徐依伟认为,决定文生视频时长的是模型对于视频连贯性的把握能力。与此同时,文生视频另外两大难点:动作流畅度和真实物理定律,Pika也弱于Runway和即梦。“因此,行业内大家使用Pika的频次都明显变少了。”
目前,文生视频领域竞争加剧。《科创板日报》记者了解到,Vidu 将于近期完成三大更新,实现“重大技术迭代”,并支持一键生成 32s 视频;智谱AI正在研发对标Sora的高质量文生视频模型,预计最快年内发布。
产品竞争力下降、同行竞争加剧,再叠加访问量下滑,这些因素都让Pika推出具有突破新品的急迫性增加。
徐依伟分析,Pika新品或聚焦在时长、真实感以及美感等方面。“时长增加即代表着视频连贯性能力得到加强,其次,是‘真实感’的改善,体现更流畅的动作和更真实的物理定律。最后,是‘艺术性’的改善,体现在镜头语言的美感。”