
在今日举行的谷歌2024I/O开发者大会上,谷歌正式推出了备受瞩目的全新视频生成模型——Veo。这款产品被视为对OpenAI三个月前推出的文本转视频工具Sora的直接挑战,旨在为用户提供更加高质量、多风格的视频生成体验。

据谷歌官方新闻稿介绍,Veo不仅支持生成时长超过1分钟、分辨率最高达1080P的高质量视频,而且具备对自然语言的先进理解能力,能够精准捕捉“延时摄影”、“航拍风景”等电影术语,并将其转化为生动的视觉表达。
用户可以通过文本、图像或视频提示来指导Veo生成所需的视频内容。谷歌表示,Veo生成的视频将具有更高的连贯性和一致性,人物、动物和物体的动作也将更加逼真。为了更直观地展示Veo的强大功能,谷歌还附上了演示视频供用户参考。
在周一的媒体预览会上,谷歌DeepMind首席执行官德米斯-哈萨比斯(Demis Hassabis)进一步透露,Veo的视频结果可以通过额外的提示进行完善,以满足用户更加精细化的需求。此外,谷歌还在积极探索更多功能,使Veo能够制作故事板和更长的场景,进一步拓展其应用场景和创作空间。
凭借其高质量、多风格的视频生成能力和对自然语言的先进理解能力,Veo将成为视频创作者、广告商、影视制作人员等各行各业人士的重要工具。同时,这也标志着谷歌在人工智能领域的持续创新和突破,为未来的视频创作和应用提供了更加广阔的想象空间。
近日,小米旗下备受欢迎的人工智能助手“小爱同学”与阿里云通义大模型携手合作,共同探索并强化在图片生成、图片理解等多模态AI生成能力的新领域。
这一创新技术已经在小米汽车、手机等多类设备上成功落地,为用户带来前所未有的智能体验。
以小米汽车SU7为例,这款车型搭载了全新升级的“小爱同学”。乘客只需通过自然语言指令,即可在车载中控屏上轻松绘制出如“小猫爬上窗台”等生动画面,为亲子互动和乘车旅程增添无限乐趣。通过优化算法和蒸馏模型,大模型在确保图片质量的同时,将出图时间缩短至5秒,效率提升一倍。

在小米手机端,“小爱同学”同样展现了其强大的多模态AI生成能力。用户可以通过一键拍照功能,让“小爱同学”生成菜谱、进行户型图分析,甚至提供P图建议等复杂的图片理解任务。
此外,用户还可以向“小爱同学”发出语音指令,让它创作山水画、梗图或创意设计文案,满足用户个性化需求。
阿里在2024财务年度报告中首次披露对大模型创业公司月之暗面的投资情况。
据悉,在2024财年中,阿里斥资约8亿美元投资月之暗面(Moonshot AI),并成功购入该公司约36%的股权。

此前,阿里巴巴集团主席蔡崇信和首席执行官吴泳铭在最新股东信中明确表示,公司视人工智能(AI)为推动业务增长和变革的最核心力量。他们坚信,AI技术将为企业带来前所未有的机遇和挑战。
蔡崇信、吴泳铭表示,未来十年,没有哪个行业能免于AI带来的颠覆。AI不会为旧的做事方式提供保护,而是重新点燃我们的创业激情和想象力。我们的每个业务都有大量应用场景,所有场景都可以通过人工智能创造更大的价值。同时人工智能的部署将增加计算需求,从而也将推动阿里云的增长。AI不会是一种威胁,而是作为突破性用户体验和商业模式的驱动力,将带来巨大机遇。如果不能跟上AI每天带来的持续而惊人的进步,我们就会被取代。