11、Canva开发者平台全面升级:推出新功能和盈利模式,Adobe推出Firefly AI视频模型,Photoshop新增多个AI功能,7、AI玩具设计师来袭:3D玩具设计工具Toy Box Flux,🧠 布贝克离开微软,加盟OpenAI,专注于AGI研究。🤝 微软与OpenAI关系复杂,既是投资者又是竞争对手,双方希望继续合作。🚀 布贝克的加入将推动OpenAI在小型语言模型和AGI研究方面取得突破
💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。,🌟 Gradio5引入企业级安全性,确保应用安全无忧。🚀 新增的AI Playground功能,简化开发流程,让生成应用变得轻松。🔮 Hugging Face规划未来,推出多种新功能,进一步提升AI应用开发体验。,Kimi人工智能助手最近推出了备受期待的语音通话功能,为用户带来了丰富的互动体验。新功能集多样化应用和个性化体验于一身,提升交流效率,满足个性化需求。针对特定场景深化了功能应用,如英语陪练和模拟面试,为学习和职场提供创新解决方案。引入声音克隆技术增添趣味性,持续关注用户反馈,优化扩展语音服务应用范围。,🎵 用户上传照片或视频即可生成匹配氛围的歌曲,提升作品趣味性。📸 不仅适用于搞笑梗图和自拍视频,甚至随手拍的菜单照片也能生成适配音乐🎶 根据图片色调和文字信息匹配音乐风格,让用户产生特定旋律的感觉。
在日常生活中,我们经常拍摄有趣的照片和视频,但缺乏合适的音乐。Suno推出的新功能“Suno Scenes”解决了这一难题,用户可以上传照片或视频生成匹配氛围的歌曲,让照片和视频更生动有趣。,📜 专为长剧本解析设计的动态故事板 AI 生成工具“神笔马良”。🤖 实现剧本智能分析、角色创作、分镜创作台词朗读等功能。🎬 将剧本内容视听化呈现,助力创作者提升作品表现,推动影视行业创新。,🎮 DIAMOND模型能模拟CS:GO游戏,运行速度达每秒10帧。📊 仅使用87小时游戏数据训练,仍能模拟复杂游戏场景。🐛 存在缺陷,如无限跳跃和路径偏离导致模拟崩溃,但未来有改善潜力。
英伟达与麻省理工学院、清华大学合作开发的Sana框架能高效生成高达4096×4096分辨率的图像,且在笔记本电脑GPU上运行。Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。虽存在局限性,但Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。,📜 专为长剧本解析设计的动态故事板 AI 生成工具“神笔马良”。🤖 实现剧本智能分析、角色创作、分镜创作台词朗读等功能。🎬 将剧本内容视听化呈现,助力创作者提升作品表现,推动影视行业创新。,🔥 Pika1.5版本新增四种新特效,包括粉碎、溶解、瘪掉和“ta-da”特效,让视频内容炫目多彩。💰 Pika Labs吸引巨额投资,用户数量迅速增长,显示其受欢迎程度和市场潜力。🎨 提供多样的订阅计划,满足用户不同的创作需求和经济实力。
近日,卡内基梅隆大学的研究团队发布了名为“DressRecon”的新技术,通过单目视频实现高质量的人体重建,尤其适用于宽松衣物和手持物体的场景。该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识捕捉细微几何特征。重建结果生成高保真的三维模型,支持从任意角度渲染,提升了可视化体验。,13、开源多模态模型Molmo 能够识别图像中的物体并生成准确描述,🌟 新发布的Llama-3.1-Nemotron-70B-Instruct模型表现超越OpenAI和Anthropic,标志着AI竞争的重大变化。🚀 Nvidia将其AI发展从硬件扩展到软件,展示出强大的模型开发能力。💻 该模型提供了易于使用的API接口,使更多企业能获取并使用先进的AI技术。
🎮 DIAMOND模型能模拟CS:GO游戏,运行速度达每秒10帧。📊 仅使用87小时游戏数据训练,仍能模拟复杂游戏场景。🐛 存在缺陷,如无限跳跃和路径偏离导致模拟崩溃,但未来有改善潜力。,💡Blackwell GPU需求爆发,未来12个月内完全售罄。🔍主要客户包括AWS、谷歌等大型科技公司,推动市场增长。📈NVIDIA预计2024年将出货数十亿美元的Blackwell GPU,数据中心收入显著增长。,🚖 特斯拉将于10月10日展示Robotaxi无人驾驶出租车,马斯克表示意义重大。🔋 特斯拉CEO马斯克回应电动公交车供暖问题,暗示传统公交车或被淘汰。🚗 网友拍到特斯拉Robotaxi伪装车,外形独特,可能采用Cybertruck设计。
Hugging Face旗下Gradio5发布,致力于简化AI开发,提供企业级安全性和AI Playground功能,进一步推动AI应用开发体验。,🌟 o1模型被称为能显著减少 AI 偏见,但测试结果显示其表现不如预期💡 o1在隐性歧视方面表现优于 GPT-4o,但在显性歧视上却更糟糕。💰 推理模型 o1成本高,运行缓慢,未来仍需在多个方面改进。,6、炸了!OpenAI人事大震荡,CTO、首席研究官纷纷宣布离职!,近日,OpenAI 的全球事务副总裁安娜・马坎朱在联合国 “未来峰会” 上发表了关于人工智能偏见的看法。她提到 o1 模型能显著减少 AI 系统中的偏见,但实际测试结果却不如预期。
美图公司宣布其开发的AI短片创作工具MOKI正式对所有用户开放,为用户提供一站式成片能力,结合AI驱动的脚本、分镜、视频生成、配音、配乐能力,使普通用户能轻松上手,快速创作个性化短片。MOKI在中文语意理解准确性和东方视觉风格上表现出色,未来计划提供更多专业功能。,最近,微软正致力于开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。这反映出人类对于倾诉、理解和陪伴的基本需求。同时,Windows 的新功能 Recall 可深入挖掘用户的数字历史,重现过去的点滴经历。Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。
Nvidia悄然推出了一款名为Llama-3.1-Nemotron-70B-Instruct的新型人工智能模型,表现出色,已超越了OpenAI的GPT-4和Anthropic的Claude3.5,标志着人工智能领域竞争格局的重大变化。该模型在知名AI平台Hugging Face上发布,引起业界关注。Nvidia展示了强大的AI软件开发能力,支持企业探索AI解决方案。然而,用户需谨慎使用,避免错误或滥用。,🛡️ 新规要求企业合规官员认真评估AI的法律风险,避免面临罚款。🤖 企业需主动监控和测试AI应用,确保技术使用合规。👥 司法部将加强对企业合规程序的审查,关注是否有效防范犯罪风险。,4、Mistral AI推超强边缘AI模型Ministral8B,7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为,OpenAI的首席技术官Mira Murati宣布离职,引发了公司高层人事大变动。离职信中表达了对过去工作的感激之情,同时指出团队取得的成就和技术进步。公司首席执行官Sam Altman表示领导层变动是自然发展的一部分,并安排新的人事安排以确保公司稳步发展。
2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元,7、Runway推出百部电影扶持计划
OpenAI 新模型 o1 声称能 “完美” 纠正偏见,但数据并不完全支持,近日,OpenAI 的全球事务副总裁安娜・马坎朱在联合国 “未来峰会” 上发表了关于人工智能偏见的看法。她提到 o1 模型能显著减少 AI 系统中的偏见,但实际测试结果却不如预期。
👁️ 视频互动方式改变:Sieve推出的技术实现视频中眼神接触的自动修复,提升视频吸引力和互动性。🔧 技术优势突出:Sieve的技术快速集成现有应用,解决视频缺乏眼神接触问题,特别适用于演讲者直视镜头场景。⚙️ 实时视线修正机制:AI模型和神经网络精准调整眼神角度,动态处理头部位置变化,保持视频自然流畅。,Cove是一家由前Google Maps核心团队成员创立的AI初创公司,致力于开发新一代智能工作空间,解决AI对话工具在复杂项目协作中的限制。他们推出的可视化工作空间结合AI协作,提供更自然的工作方式,已获得600万美元种子轮融资。,最近德勤发布的报告揭示了数据隐私在生成性人工智能中的重要性,专业人士对此担忧上升。安全和保障被78%的商业领袖列为伦理技术原则之一,欧盟AI法案的实施对公司产生深远影响。,vivo在2024vivo开发者大会上发布了全新蓝心大模型矩阵,升级了语言、语音、图像和多模态能力,提供更强大的性能和功能。新的蓝心大模型矩阵将行业标准提升至新高度,为用户带来更优质的体验。,🌟 o1模型被称为能显著减少 AI 偏见,但测试结果显示其表现不如预期💡 o1在隐性歧视方面表现优于 GPT-4o,但在显性歧视上却更糟糕。💰 推理模型 o1成本高,运行缓慢,未来仍需在多个方面改进。