🎮 DIAMOND模型能模拟CS:GO游戏,运行速度达每秒10帧。📊 仅使用87小时游戏数据训练,仍能模拟复杂游戏场景。🐛 存在缺陷,如无限跳跃和路径偏离导致模拟崩溃,但未来有改善潜力。,Midjourney即将推出在线编辑器,V7版本和个性化功能在路上,💡Blackwell GPU需求爆发,未来12个月内完全售罄。🔍主要客户包括AWS、谷歌等大型科技公司,推动市场增长。📈NVIDIA预计2024年将出货数十亿美元的Blackwell GPU,数据中心收入显著增长。
在数字时代,制作引人入胜的多语言音频内容成为热门话题。谷歌的NotebookLM备受好评,而开源Python软件包Podcastfy引起广泛关注。Podcastfy是开源版NotebookLM,采用先进的生成式人工智能技术,让用户实现更多个性化和规模化的播客制作。,Adobe推出Firefly AI视频模型,Photoshop新增多个AI功能,📜 专为长剧本解析设计的动态故事板 AI 生成工具“神笔马良”。🤖 实现剧本智能分析、角色创作、分镜创作台词朗读等功能。🎬 将剧本内容视听化呈现,助力创作者提升作品表现,推动影视行业创新。
在日常生活中,我们经常拍摄有趣的照片和视频,但缺乏合适的音乐。Suno推出的新功能“Suno Scenes”解决了这一难题,用户可以上传照片或视频生成匹配氛围的歌曲,让照片和视频更生动有趣。,🌟 技术浪潮中的泡沫现象:少数企业将脱颖而出创造社会价值。🚀 AI模型准确性提升:Chatbot能提供可靠答案。💡 技术革命将替代辛苦工作:创造更舒适新工作。
5、比FLUX快100倍!英伟达联手MIT、清华推出超快AI图像生成模型Sana,笔记本也能秒速出图!,🚀 Westlake-Omni是全球首个开源的中文情感端到端语音交互大模型,注重实时性和零延迟体验。💡 模型具备出色的情感理解与表达能力,能生成清晰、自然、富有表现力的中文语音。🌱 西湖心辰期望通过开源Westlake-Omni模型,促进更多开发者参与中文情感语音交互技术的发展
13、开源多模态模型Molmo 能够识别图像中的物体并生成准确描述,💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。,🌟 Mira Murati离职,标志着OpenAI高层人事大变动。📈 Mark Chen晋升为新任高级副总裁,负责研究部门领导。🤔 首席研究官Bob McGrew和研究副总裁Barret Zoph也宣布离职。,Cove是一家由前Google Maps核心团队成员创立的AI初创公司,致力于开发新一代智能工作空间,解决AI对话工具在复杂项目协作中的限制。他们推出的可视化工作空间结合AI协作,提供更自然的工作方式,已获得600万美元种子轮融资。
火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。,2、美图AI短片创作工具MOKI全面开放 支持生成配乐、细节修改
6、夸张!GPT-4无意中掌握面部识别技术,准确率超越专业算法,🔥 Pika1.5版本新增四种新特效,包括粉碎、溶解、瘪掉和“ta-da”特效,让视频内容炫目多彩。💰 Pika Labs吸引巨额投资,用户数量迅速增长,显示其受欢迎程度和市场潜力。🎨 提供多样的订阅计划,满足用户不同的创作需求和经济实力。,10、Nvidia发布了70B的新AI模型,碾压GPT-4和Claude3.5,9、Zoom推数字分身功能:便利还是隐忧?,🚀 Mistral AI推出Ministral3B和8B,支持高达128,000个token的上下文长度。💡 适合本地翻译、离线助手、数据分析和自主机器人等应用。💰 定价合理,Ministral8B每百万token费用为0.10美元,Ministral3B为0.04美元。
在这篇文章中,OpenAI向法庭申请驳回马斯克对公司的诉讼,称其为“骚扰”行为。文章揭示了马斯克和OpenAI之间的法律纠纷背景,强调马斯克的指控缺乏证据,并质疑他的法律地位。,🎧 Ola Friend智能体耳机售价1199元,支持智能对话功能。🤖 Ola Friend耳机是随时陪伴在耳边的AI朋友,提供听音乐、学习英语、导游服务等功能。📱 用户需下载豆包APP来充分利用Ola Friend耳机的功能,APP支持搜索信息、答疑解惑、激发灵感等多种功能。,vivo在2024vivo开发者大会上发布了全新蓝心大模型矩阵,升级了语言、语音、图像和多模态能力,提供更强大的性能和功能。新的蓝心大模型矩阵将行业标准提升至新高度,为用户带来更优质的体验。,🌟 Podcastfy是开源Python软件包,可将文本和网络内容转换为多语言音频对话。🎧 用户可以通过Gradio演示应用或HuggingFace体验Podcastfy,操作简单易上手。⚠️ 使用外部内容时,需确保拥有版权和权限,生成的音频内容由AI生成,不模仿现实人物。
7、Runway推出百部电影扶持计划,vivo在2024vivo开发者大会上发布了全新蓝心大模型矩阵,升级了语言、语音、图像和多模态能力,提供更强大的性能和功能。新的蓝心大模型矩阵将行业标准提升至新高度,为用户带来更优质的体验。,近日,卡内基梅隆大学的研究团队发布了名为“DressRecon”的新技术,通过单目视频实现高质量的人体重建,尤其适用于宽松衣物和手持物体的场景。该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识捕捉细微几何特征。重建结果生成高保真的三维模型,支持从任意角度渲染,提升了可视化体验。,Adobe在最新的MAX大会上推出了Firefly AI视频模型和多个增强版Photoshop工具,为用户带来了令人振奋的AI新功能。Firefly视频模型让用户通过文本提示创建或修改视频内容,为创作者们提供了全新的创作空间。同时,Photoshop新增的AI工具如移除工具和生成填充功能,让用户更轻松地编辑图像。Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。
🚀 Cove完成600万美元种子轮融资,投资方包括Sequoia Capital、Elad Gil、Homebrew。🔑 Cove提供类似Notion的可视化工作空间,用户可自由组织多种内容形式,AI作为协作者直接参与内容创建和优化。💡 Cove配备强大的Chrome扩展,与常用办公工具无缝对接,智能提供帮助,应用场景广泛。,🚖 特斯拉将于10月10日展示Robotaxi无人驾驶出租车,马斯克表示意义重大。🔋 特斯拉CEO马斯克回应电动公交车供暖问题,暗示传统公交车或被淘汰。🚗 网友拍到特斯拉Robotaxi伪装车,外形独特,可能采用Cybertruck设计。,🤖 企业自律:协议鼓励制定人工智能治理策略、识别高风险系统、提升员工素养。💼 积极参与:超过100家公司签署协议,跨越科技、医疗、银行等行业。⚠️ 苹果和Meta观望:担忧监管环境不确定性、数据泄露风险,Meta停止在欧盟提供Llama模型服务。,2、美图AI短片创作工具MOKI全面开放 支持生成配乐、细节修改,7、200万用户量!Hugging Face旗下Gradio5发布:用自然语言轻松构建AI应用
🔥 Pika1.5版本新增四种新特效,包括粉碎、溶解、瘪掉和“ta-da”特效,让视频内容炫目多彩。💰 Pika Labs吸引巨额投资,用户数量迅速增长,显示其受欢迎程度和市场潜力。🎨 提供多样的订阅计划,满足用户不同的创作需求和经济实力。,🚀 Midjourney即将推出新的在线编辑器,用户可以导入图片并利用深度图和图像修复功能进行编辑。💡 团队正在优化用户界面,以区分新功能与现有图片功能,并讨论首次发布时包含哪些功能。🔧 Midjourney正在开发新工具,使用户更容易管理和切换多个个性化配置,引入更精细的风格个性化系统。,✨ 4K图像直接生成:V2版本能直接生成4K质量的图像,提高效率并拓展创作者创作空间。🎨 多样化风格选项:用户只需输入描述性提示,选择分辨率和风格,系统生成优化后的图像,提供丰富的创作可能性。🔧 精细控制与高级功能:提供精细调整工具,如创意细节生成、背景调整、重新照明等,满足专业用户需求。,5、谷歌NotebookLM新增功能:快速总结YouTube精华内容,李彦宏:未来5-10年 生成式AI将使每个人都具备程序员能力
近日,OpenAI 的全球事务副总裁安娜・马坎朱在联合国 “未来峰会” 上发表了关于人工智能偏见的看法。她提到 o1 模型能显著减少 AI 系统中的偏见,但实际测试结果却不如预期。,6、炸了!OpenAI人事大震荡,CTO、首席研究官纷纷宣布离职!