📹 Firefly AI视频模型让用户通过文本创建和修改视频内容,为创作者们提供全新创作空间。🖼️ Photoshop新增多项AI工具,如移除工具和生成填充,帮助用户更轻松地编辑图像。🔍 Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。,猛了!Meta震撼发布Llama3.2视觉方面吊打所有闭源模型?Meta在其年度Meta Connect2024大会上发布了Llama3.2,旨在提升边缘AI和视觉任务的能力。新推出的Llama3.2模型包括11亿和90亿参数的中型视觉模型,以及1亿和3亿参数的小型模型,特别优化了在移动设备上的使用。
英伟达最新一代Blackwell GPU引发了前所未有的需求,CEO黄仁勋透露未来12个月供应量已售罄,市场对高性能计算的渴望再次得到证实。,10、DressRecon:输入视频就能构建出还原服装细节的3D模型,🔍 智能助手集成搜索、生成内容、分析数据,提高工作效率。💬 通过简单对话获得灵活解答和见解,无需多应用切换。🔐 安全性和隐私保护严格,遵循GDPR和CCPA法规,提供安全可靠的使用环境。
2、Meta AI发布Orion AR 眼镜:你的手机屏幕无缝融入现实世界!Meta AI近日发布了令科技界为之震撼的产品Orion AR 眼镜,这款经过五年潜心研发的增强现实设备不仅外观炫酷,更是瞄准智能手机市场地位,轻便设计和强大功能让它在室内外轻松应对各种场景。,Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。,李彦宏:未来5-10年 生成式AI将使每个人都具备程序员能力
9、惊艳!AI模型DIAMOND可模拟《反恐精英》,单张RTX3090就能运行,5、谷歌NotebookLM新增功能:快速总结YouTube精华内容,3、开源版NotebookLM来了!Podcastfy:输入PDF、文本、网址等即可转换成播客,7、Runway推出百部电影扶持计划,6、OpenAI、谷歌等100多家公司支持欧盟人工智能法案
在数字时代,制作引人入胜的多语言音频内容成为热门话题。谷歌的NotebookLM备受好评,而开源Python软件包Podcastfy引起广泛关注。Podcastfy是开源版NotebookLM,采用先进的生成式人工智能技术,让用户实现更多个性化和规模化的播客制作。,火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。
5、比FLUX快100倍!英伟达联手MIT、清华推出超快AI图像生成模型Sana,笔记本也能秒速出图!,OpenAI 新模型 o1 声称能 “完美” 纠正偏见,但数据并不完全支持,🚀 Sana框架高效生成4096×4096分辨率图像,可在笔记本GPU上运行。🔑 Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。💡 Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。,Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。,Zoom计划推出数字分身功能引发了人们对于深度伪造技术的担忧。虽然这项功能能提高视频创作效率,但也可能带来虚假信息传播的风险。
13、开源多模态模型Molmo 能够识别图像中的物体并生成准确描述,🎥 Runway公司设立500万美元基金资助100部原创电影项目。💡 百部电影基金计划支持使用公司生成式视频模型的视频项目。🌟 Runway邀请知名人士担任顾问,致力于发现AI生成视频的实用性和开创性应用。,近日,OpenAI 的全球事务副总裁安娜・马坎朱在联合国 “未来峰会” 上发表了关于人工智能偏见的看法。她提到 o1 模型能显著减少 AI 系统中的偏见,但实际测试结果却不如预期。
💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。,🚀 Canva吸引开发者构建超过300个应用,累计使用次数超过10亿次。💼 Canva将高级应用纳入Pro订阅,设立5000万美元的开发者创新基金,奖励参与盈利计划的开发者。🔍 Canva推出新API功能,包括内容查询API、设计编辑API、身份验证API和表格API,提供更强大和灵活的应用创建能力。,PMRF(后验均值修正流)算法是图像处理领域的一项创新技术,解决了图像恢复中失真与感知质量之间的矛盾,开辟了高质量图像重建的新可能。其独特之处在于在多种图像恢复任务中展现卓越性能,取得了令人瞩目的成绩,平衡了失真和感知质量。
💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。,这篇文章报道了台积电在全球芯片需求持续上涨背景下,2024年第三季度财报的亮眼表现。公司净利润达到3523亿新台币,同比增长54%,超出市场预期。台积电作为高级芯片制造商,受益于人工智能应用的快速发展,业绩得到显著提升。,🔒 数据隐私成为2024年生成性AI的主要担忧,关注从22%跃升至72%。📈 78%的商业领袖将“安全和保障”列为伦理技术原则之一,强调安全性的重要性。⚖️ 欧盟AI法案的实施影响深远,促使公司在AI使用上进行必要的调整与合规。
Sieve AI初创公司推出的创新技术旨在改变视频互动方式,通过实现视频中眼神接触的自动修复,提升视频内容的吸引力和互动性。该技术能快速集成到现有应用中,解决视频缺乏眼神接触的问题,特别适用于需要演讲者直视镜头的场景。Sieve的实时视线修正技术精妙运用AI模型和神经网络,实现眼神角度调整,保持视频流畅自然。,📈 Llama3.2模型支持在移动设备上进行视觉任务,帮助开发者实现创新。🕶️ 首款Orion AR眼镜被称为“最先进的AR眼镜”,将整合其他可穿戴设备。🎤 Ray-Ban智能眼镜推出实时语言翻译功能,提升用户交流体验。,在这篇文章中,OpenAI向法庭申请驳回马斯克对公司的诉讼,称其为“骚扰”行为。文章揭示了马斯克和OpenAI之间的法律纠纷背景,强调马斯克的指控缺乏证据,并质疑他的法律地位。
2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元,🎬 MOKI专注于AI短片创作,提供动画短片、网文短剧、故事绘本、MV等多种视频内容生产。🤖 MOKI操作简便,用户只需三步即可生成创意短片,包括设定阶段、内容生成阶段和后期制作阶段。🎥 MOKI支持一键生成带配乐的视频内容,虽然目前生成效果有待提升,但产品力得到进一步增强。,Canva最近宣布对其开发者平台进行全面升级,推出一系列新功能,旨在促进应用生态系统的发展和创新。这一举措将为用户带来更丰富、更强大的创意体验,同时为开发者提供更多机会,共同推动设计工具生态系统的发展。
李彦宏:未来5-10年 生成式AI将使每个人都具备程序员能力,近日,卡内基梅隆大学的研究团队发布了名为“DressRecon”的新技术,通过单目视频实现高质量的人体重建,尤其适用于宽松衣物和手持物体的场景。该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识捕捉细微几何特征。重建结果生成高保真的三维模型,支持从任意角度渲染,提升了可视化体验。