🎵 用户上传照片或视频即可生成匹配氛围的歌曲,提升作品趣味性。📸 不仅适用于搞笑梗图和自拍视频,甚至随手拍的菜单照片也能生成适配音乐🎶 根据图片色调和文字信息匹配音乐风格,让用户产生特定旋律的感觉。,OpenAI 新模型 o1 声称能 “完美” 纠正偏见,但数据并不完全支持,10、Nvidia发布了70B的新AI模型,碾压GPT-4和Claude3.5
OpenAI 新模型 o1 声称能 “完美” 纠正偏见,但数据并不完全支持,👗 研究团队推出DressRecon技术,通过单目视频实现高质量的人体重建,特别适用于宽松衣物和手持物体的场景。📷 该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识来捕捉细微几何特征。🎥 重建结果不仅生成高保真的三维模型,还支持从任意角度渲染,提升了可视化体验。
✨ 沃尔玛推出 Wallaby 大型语言模型,专注于零售行业数据,旨在提升客户服务体验。🤖 沃尔玛采用多模型组合的方法,灵活应对不同应用需求。🛍️ 升级后的客户支持助手能够更精准地理解客户意图,提供个性化服务。,智谱技术团队发布了CogView3及其升级版CogView3-Plus-3B,标志着AI辅助艺术创作迈入新阶段。CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。开源仓库已开放,推动AI图像生成领域快速发展,文生图技术应用前景广阔。,🌟 新发布的Llama-3.1-Nemotron-70B-Instruct模型表现超越OpenAI和Anthropic,标志着AI竞争的重大变化。🚀 Nvidia将其AI发展从硬件扩展到软件,展示出强大的模型开发能力。💻 该模型提供了易于使用的API接口,使更多企业能获取并使用先进的AI技术。,13、开源多模态模型Molmo 能够识别图像中的物体并生成准确描述,PMRF(后验均值修正流)算法是图像处理领域的一项创新技术,解决了图像恢复中失真与感知质量之间的矛盾,开辟了高质量图像重建的新可能。其独特之处在于在多种图像恢复任务中展现卓越性能,取得了令人瞩目的成绩,平衡了失真和感知质量。
最近德勤发布的报告揭示了数据隐私在生成性人工智能中的重要性,专业人士对此担忧上升。安全和保障被78%的商业领袖列为伦理技术原则之一,欧盟AI法案的实施对公司产生深远影响。,✨ 企业签署《人工智能契约》自愿承诺,强调人工智能治理战略和风险评估。🌐 签署者需关注工作人员人工智能意识,设计系统让用户知晓与人工智能互动。🚀 《人工智能契约》促进企业填补合规真空,鼓励签署者间合规竞争。,🎵 用户上传照片或视频即可生成匹配氛围的歌曲,提升作品趣味性。📸 不仅适用于搞笑梗图和自拍视频,甚至随手拍的菜单照片也能生成适配音乐🎶 根据图片色调和文字信息匹配音乐风格,让用户产生特定旋律的感觉。
🎧 Ola Friend智能体耳机售价1199元,支持智能对话功能。🤖 Ola Friend耳机是随时陪伴在耳边的AI朋友,提供听音乐、学习英语、导游服务等功能。📱 用户需下载豆包APP来充分利用Ola Friend耳机的功能,APP支持搜索信息、答疑解惑、激发灵感等多种功能。,🔒 数据隐私成为2024年生成性AI的主要担忧,关注从22%跃升至72%。📈 78%的商业领袖将“安全和保障”列为伦理技术原则之一,强调安全性的重要性。⚖️ 欧盟AI法案的实施影响深远,促使公司在AI使用上进行必要的调整与合规。
6、OpenAI、谷歌等100多家公司支持欧盟人工智能法案,5、火山引擎发布大模型训练视频预处理方案
OpenAI近期对ChatGPT进行了重大更新,将其从单纯的对话助手转变为综合性信息平台。界面更新包括新增的Canvas功能和移动提示框位置,使用户体验更加便捷。引入的SearchGPT功能让用户可以访问实时网络数据,并与知名出版商合作确保信息可靠性。,13、开源多模态模型Molmo 能够识别图像中的物体并生成准确描述,Molmo是一款开源多模态人工智能模型,基于Qwen2-72B和OpenAI的CLIP,以高效性能和创新功能挑战传统商业模型。其突出特点在于小巧高效、引入指向功能、性能优异、开源性质和全面功能。Molmo的成功归功于高质量训练数据和多样性,展现出色的多模态交互能力。,3、小红书下一个爆火玩法?Suno新功能Suno Scenes给你的“梗图”加分!,🎥 Runway公司设立500万美元基金资助100部原创电影项目。💡 百部电影基金计划支持使用公司生成式视频模型的视频项目。🌟 Runway邀请知名人士担任顾问,致力于发现AI生成视频的实用性和开创性应用。
💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。,🚀 Midjourney即将推出新的在线编辑器,用户可以导入图片并利用深度图和图像修复功能进行编辑。💡 团队正在优化用户界面,以区分新功能与现有图片功能,并讨论首次发布时包含哪些功能。🔧 Midjourney正在开发新工具,使用户更容易管理和切换多个个性化配置,引入更精细的风格个性化系统。,Adobe推出Firefly AI视频模型,Photoshop新增多个AI功能,🎥 Runway公司设立500万美元基金资助100部原创电影项目。💡 百部电影基金计划支持使用公司生成式视频模型的视频项目。🌟 Runway邀请知名人士担任顾问,致力于发现AI生成视频的实用性和开创性应用。
9、惊艳!AI模型DIAMOND可模拟《反恐精英》,单张RTX3090就能运行,🔍 Orion AR 眼镜采用定制的Micro LED显示技术,将数字信息无缝融入现实世界,配备七个高精度摄像头和神秘的神经腕带,用户可以轻松控制数字世界。🌐 Orion 眼镜内置智能AI系统,感知周围环境并预测用户需求,例如根据冰箱食材推荐食谱,提升用户生活便利性。👓 Orion 眼镜设计轻便舒适,配备超大视场角,让用户在室内娱乐和户外探索中获得出色体验,增强社交互动的自然感。,11、AI协作工具Cove完成600万美元融资,前谷歌团队打造类notion可视化工作空间,Adobe推出Firefly AI视频模型,Photoshop新增多个AI功能
OpenAI在最新的版权诉讼中达成协议,同意向原告律师披露用于训练生成性AI模型的数据。这一举措旨在满足版权诉讼的需求,但数据查看过程受到严格控制,确保安全性。未来可能面临更多法规要求,推动AI数据透明度的要求。,🚀 Mistral AI推出Ministral3B和8B,支持高达128,000个token的上下文长度。💡 适合本地翻译、离线助手、数据分析和自主机器人等应用。💰 定价合理,Ministral8B每百万token费用为0.10美元,Ministral3B为0.04美元。,Magnific近日推出的V2图像生成服务在AI图像处理领域掀起了新的波澜,标志着其从高端软件跃升为顶级AI图像生成器,展现了技术创新和用户体验优化的雄心。,OpenAI快凉了的Sora将迎来大升级:生成速度更快、内容更长、质量更高,🚀 Elias Torres从17岁移民美国到创立Agency,展现现实版美国梦的传奇故事。💡 Agency利用AI技术深度学习客户数据,自动化处理客户需求预测、日程安排等任务,填补CRM系统空白。💼 Agency获得1200万美元种子轮融资,得到Sequoia合伙人和HubSpot联合创始人的支持,展望广阔的发展前景。
1、Kimi推出多功能语音通话模式 支持更换声音语速调节,🛡️ FTC针对五家AI公司提起诉讼,指控虚假宣传和欺诈行为。💰 DoNotPay与FTC达成和解,支付193,000美元,承诺停止不实宣传。✍️ Rytr被指提供生成虚假消费者评价功能,同意停止相关服务。,✨ PMRF算法巧妙结合后验均值预测和修正流模型,创造全新图像恢复框架,最大程度减少失真,提升感知质量。🌟 应用广泛,涵盖去噪、超分辨率、修复受损区域和颜色恢复等多个方面,生成自然真实图像。💡 在基准和真实数据集测试中,PMRF表现优异,平衡失真和感知质量,树立新的图像恢复标准。,在数字创意的浪潮中,Toy Box Flux作为一款专注于生成3D玩具设计的人工智能模型,革新了玩具设计的方式。其独特训练方法和精益求精的训练过程为玩具设计注入新鲜血液,展现出令人心动的可爱风格。未来,开发团队计划进一步强化模型性能,为玩具设计领域带来更多可能性。,Midjourney最近公布了一系列令人兴奋的更新和即将推出的新功能,展示了公司在AI图像生成领域的快速发展和创新。团队正积极推进多个项目,注重提升质量和开发核心功能,而不是急于发布新产品。
OpenAI快凉了的Sora将迎来大升级:生成速度更快、内容更长、质量更高,✨ PMRF算法巧妙结合后验均值预测和修正流模型,创造全新图像恢复框架,最大程度减少失真,提升感知质量。🌟 应用广泛,涵盖去噪、超分辨率、修复受损区域和颜色恢复等多个方面,生成自然真实图像。💡 在基准和真实数据集测试中,PMRF表现优异,平衡失真和感知质量,树立新的图像恢复标准。,3、小红书下一个爆火玩法?Suno新功能Suno Scenes给你的“梗图”加分!,研究人员开发的AI模型DIAMOND能够模拟《反恐精英:全球攻势》游戏,运行在Nvidia RTX3090显卡上,每秒10帧的速度。尽管存在一些缺陷,但未来有望通过增加数据和计算能力来改善模型性能。,8、OpenAI 申请法庭驳回马斯克诉讼,称其为 “骚扰” 行为