📹 Firefly AI视频模型让用户通过文本创建和修改视频内容,为创作者们提供全新创作空间。🖼️ Photoshop新增多项AI工具,如移除工具和生成填充,帮助用户更轻松地编辑图像。🔍 Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。,最近,美国司法部引入了新的要求,要求企业合规官员认真评估AI的法律风险,避免面临罚款。企业需主动监控和测试AI应用,确保技术使用合规。司法部将加强对企业合规程序的审查,关注是否有效防范犯罪风险。
5、火山引擎发布大模型训练视频预处理方案,📝 NotebookLM可以分析YouTube视频转录,提炼关键信息和主题。🔍 用户可通过点击主题获取详细信息并提出问题,NotebookLM还会给出问题建议。🎧 新增支持音频录音功能,用户可搜索转录内容并创建学习指南。,🚀 Sana框架高效生成4096×4096分辨率图像,可在笔记本GPU上运行。🔑 Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。💡 Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。,台积电财报:Q3净利润增长54%达101亿美元,9、惊艳!AI模型DIAMOND可模拟《反恐精英》,单张RTX3090就能运行
🚀 CogView3及CogView3-Plus-3B开源,标志AI辅助艺术创作新阶段。💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。,👁️ 视频互动方式改变:Sieve推出的技术实现视频中眼神接触的自动修复,提升视频吸引力和互动性。🔧 技术优势突出:Sieve的技术快速集成现有应用,解决视频缺乏眼神接触问题,特别适用于演讲者直视镜头场景。⚙️ 实时视线修正机制:AI模型和神经网络精准调整眼神角度,动态处理头部位置变化,保持视频自然流畅。,美图公司宣布其开发的AI短片创作工具MOKI正式对所有用户开放,为用户提供一站式成片能力,结合AI驱动的脚本、分镜、视频生成、配音、配乐能力,使普通用户能轻松上手,快速创作个性化短片。MOKI在中文语意理解准确性和东方视觉风格上表现出色,未来计划提供更多专业功能。
美图公司宣布其开发的AI短片创作工具MOKI正式对所有用户开放,为用户提供一站式成片能力,结合AI驱动的脚本、分镜、视频生成、配音、配乐能力,使普通用户能轻松上手,快速创作个性化短片。MOKI在中文语意理解准确性和东方视觉风格上表现出色,未来计划提供更多专业功能。,欧盟最新推出的人工智能倡议吸引了100多家公司的支持,其中包括OpenAI、谷歌等科技巨头。虽然苹果和Meta选择观望,但行业对人工智能发展的重视和责任感仍然显著。该倡议旨在推动企业自律,为未来人工智能发展奠定基础。,9、美国司法部AI新规:AI 犯错,企业担责,谷歌NotebookLM推出新功能,通过分析视频转录文本提炼关键信息,让用户轻松获取YouTube视频精华内容,提高学习效率。用户可点击主题获取详细信息,提出问题并获得建议,支持音频录音功能,帮助用户搜索转录内容和创建学习指南。,近日,卡内基梅隆大学的研究团队发布了名为“DressRecon”的新技术,通过单目视频实现高质量的人体重建,尤其适用于宽松衣物和手持物体的场景。该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识捕捉细微几何特征。重建结果生成高保真的三维模型,支持从任意角度渲染,提升了可视化体验。
西湖心辰开源中文情感端到端语音大模型Westlake-Omni西湖心辰宣布开源其研发的Westlake-Omni模型,作为全球首个开源的中文情感端到端语音交互大模型。该模型采用离散表示法统一文本和语音模态,注重实时性,提供零延迟体验。具备出色的情感理解与表达能力,生成清晰、自然、富有表现力的中文语音。期望通过开源鼓励更多开发者参与中文情感语音交互技术的发展。,11、DreamWaltz-G:从文本生成生动的3D 可动画头像,Sieve AI初创公司推出的创新技术旨在改变视频互动方式,通过实现视频中眼神接触的自动修复,提升视频内容的吸引力和互动性。该技术能快速集成到现有应用中,解决视频缺乏眼神接触的问题,特别适用于需要演讲者直视镜头的场景。Sieve的实时视线修正技术精妙运用AI模型和神经网络,实现眼神角度调整,保持视频流畅自然。,🛡️ 新规要求企业合规官员认真评估AI的法律风险,避免面临罚款。🤖 企业需主动监控和测试AI应用,确保技术使用合规。👥 司法部将加强对企业合规程序的审查,关注是否有效防范犯罪风险。,8、特斯拉官宣Robotaxi发布时间
8、OpenAI 申请法庭驳回马斯克诉讼,称其为 “骚扰” 行为,9、12亿美元出售Drift后,前HubSpot高管再创业,让AI替你管理客户!,2、美图AI短片创作工具MOKI全面开放 支持生成配乐、细节修改,猛了!Meta震撼发布Llama3.2视觉方面吊打所有闭源模型?Meta在其年度Meta Connect2024大会上发布了Llama3.2,旨在提升边缘AI和视觉任务的能力。新推出的Llama3.2模型包括11亿和90亿参数的中型视觉模型,以及1亿和3亿参数的小型模型,特别优化了在移动设备上的使用。