
西湖心辰开源中文情感端到端语音大模型Westlake-Omni西湖心辰宣布开源其研发的Westlake-Omni模型,作为全球首个开源的中文情感端到端语音交互大模型。该模型采用离散表示法统一文本和语音模态,注重实时性,提供零延迟体验。具备出色的情感理解与表达能力,生成清晰、自然、富有表现力的中文语音。期望通过开源鼓励更多开发者参与中文情感语音交互技术的发展。,2、Meta AI发布Orion AR 眼镜:你的手机屏幕无缝融入现实世界!Meta AI近日发布了令科技界为之震撼的产品Orion AR 眼镜,这款经过五年潜心研发的增强现实设备不仅外观炫酷,更是瞄准智能手机市场地位,轻便设计和强大功能让它在室内外轻松应对各种场景。
OpenAI全新多模态内容审核模型上线:基于 GPT-4o,可检测文本和图像数字时代对内容安全问题的重视日益增强,OpenAI推出了名为“omni-moderation-latest”的多模态内容审核模型,基于最新的GPT-4o技术,能准确识别有害文本和图像。这一更新为开发者提供强大工具,构建更强大的审核系统。新模型支持对文本和图像输入进行审核,尤其在处理非英语内容时表现出色,提高了准确性和检测能力,确保用户在更安全的空间中交流。,最近德勤发布的报告揭示了数据隐私在生成性人工智能中的重要性,专业人士对此担忧上升。安全和保障被78%的商业领袖列为伦理技术原则之一,欧盟AI法案的实施对公司产生深远影响。,Midjourney最近公布了一系列令人兴奋的更新和即将推出的新功能,展示了公司在AI图像生成领域的快速发展和创新。团队正积极推进多个项目,注重提升质量和开发核心功能,而不是急于发布新产品。,Magnific近日推出的V2图像生成服务在AI图像处理领域掀起了新的波澜,标志着其从高端软件跃升为顶级AI图像生成器,展现了技术创新和用户体验优化的雄心。,🚀 Mistral AI推出Ministral3B和8B,支持高达128,000个token的上下文长度。💡 适合本地翻译、离线助手、数据分析和自主机器人等应用。💰 定价合理,Ministral8B每百万token费用为0.10美元,Ministral3B为0.04美元。
🚀 Sana框架高效生成4096×4096分辨率图像,可在笔记本GPU上运行。🔑 Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。💡 Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。,🚀 蓝心大模型矩阵全面升级,包括语言、端侧、语音、图像和多模态大模型。💡 推出30亿蓝心端侧大模型3B,性能提升300%,功耗优化46%,内存减小63%,出词速度达80字/s。🔊 新自研蓝心语音大模型支持自然语义理解、情感表达和同声传译,图像&多模态大模型强化中国特色与东方美学融合生成能力。,最近,美国司法部引入了新的要求,要求企业合规官员认真评估AI的法律风险,避免面临罚款。企业需主动监控和测试AI应用,确保技术使用合规。司法部将加强对企业合规程序的审查,关注是否有效防范犯罪风险。,2、Meta AI发布Orion AR 眼镜:你的手机屏幕无缝融入现实世界!Meta AI近日发布了令科技界为之震撼的产品Orion AR 眼镜,这款经过五年潜心研发的增强现实设备不仅外观炫酷,更是瞄准智能手机市场地位,轻便设计和强大功能让它在室内外轻松应对各种场景。
ChatGPT大变身:新界面引入搜索功能,✨ PMRF算法巧妙结合后验均值预测和修正流模型,创造全新图像恢复框架,最大程度减少失真,提升感知质量。🌟 应用广泛,涵盖去噪、超分辨率、修复受损区域和颜色恢复等多个方面,生成自然真实图像。💡 在基准和真实数据集测试中,PMRF表现优异,平衡失真和感知质量,树立新的图像恢复标准。,🔍 智能助手集成搜索、生成内容、分析数据,提高工作效率。💬 通过简单对话获得灵活解答和见解,无需多应用切换。🔐 安全性和隐私保护严格,遵循GDPR和CCPA法规,提供安全可靠的使用环境。,Nvidia本周股价再创历史新高,市值逼近3.4万亿美元,投资者备受振奋。CEO黄仁勋的个人财富已超1215亿美元,新一代Blackwell芯片需求火爆。Nvidia稳固主导AI芯片市场,市值仅次于苹果,展现强大实力。,9、德勤:72% 专业人士将生成式 AI 的数据隐私列为首要担忧!
8、特斯拉官宣Robotaxi发布时间,💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。,🌟 Gradio5引入企业级安全性,确保应用安全无忧。🚀 新增的AI Playground功能,简化开发流程,让生成应用变得轻松。🔮 Hugging Face规划未来,推出多种新功能,进一步提升AI应用开发体验。,💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。,在这篇文章中,OpenAI向法庭申请驳回马斯克对公司的诉讼,称其为“骚扰”行为。文章揭示了马斯克和OpenAI之间的法律纠纷背景,强调马斯克的指控缺乏证据,并质疑他的法律地位。
✨ 4K图像直接生成:V2版本能直接生成4K质量的图像,提高效率并拓展创作者创作空间。🎨 多样化风格选项:用户只需输入描述性提示,选择分辨率和风格,系统生成优化后的图像,提供丰富的创作可能性。🔧 精细控制与高级功能:提供精细调整工具,如创意细节生成、背景调整、重新照明等,满足专业用户需求。,🚀 Cove完成600万美元种子轮融资,投资方包括Sequoia Capital、Elad Gil、Homebrew。🔑 Cove提供类似Notion的可视化工作空间,用户可自由组织多种内容形式,AI作为协作者直接参与内容创建和优化。💡 Cove配备强大的Chrome扩展,与常用办公工具无缝对接,智能提供帮助,应用场景广泛。
🌟 台积电Q3净利润达101亿美元,同比增长54%。💻 人工智能推动高性能芯片需求,助力业绩增长。🚀 台积电持续扩大生产能力,以满足市场日益增长的需求。,9、德勤:72% 专业人士将生成式 AI 的数据隐私列为首要担忧!
微软AI副总裁跳槽OpenAI 将致力于AGI研究,🚀 Canva吸引开发者构建超过300个应用,累计使用次数超过10亿次。💼 Canva将高级应用纳入Pro订阅,设立5000万美元的开发者创新基金,奖励参与盈利计划的开发者。🔍 Canva推出新API功能,包括内容查询API、设计编辑API、身份验证API和表格API,提供更强大和灵活的应用创建能力。,🚀 Cove完成600万美元种子轮融资,投资方包括Sequoia Capital、Elad Gil、Homebrew。🔑 Cove提供类似Notion的可视化工作空间,用户可自由组织多种内容形式,AI作为协作者直接参与内容创建和优化。💡 Cove配备强大的Chrome扩展,与常用办公工具无缝对接,智能提供帮助,应用场景广泛。
🌟 新发布的Llama-3.1-Nemotron-70B-Instruct模型表现超越OpenAI和Anthropic,标志着AI竞争的重大变化。🚀 Nvidia将其AI发展从硬件扩展到软件,展示出强大的模型开发能力。💻 该模型提供了易于使用的API接口,使更多企业能获取并使用先进的AI技术。,🌟 升级视频AI Sora,生成更长、更高质量视频片段⏱️ 初始版本生成时间过长,存在风格、物理错误问题📈 视频AI市场竞争激烈,Sora需加快步伐以保持竞争力
13、开源多模态模型Molmo 能够识别图像中的物体并生成准确描述,5、比FLUX快100倍!英伟达联手MIT、清华推出超快AI图像生成模型Sana,笔记本也能秒速出图!
Runway公司宣布百部电影基金计划,旨在支持AI技术在电影制作中的应用。该计划提供500万美元现金资助,吸引导演们参与。公司强调灵活性和支持多种视频项目形式。,📈 Llama3.2模型支持在移动设备上进行视觉任务,帮助开发者实现创新。🕶️ 首款Orion AR眼镜被称为“最先进的AR眼镜”,将整合其他可穿戴设备。🎤 Ray-Ban智能眼镜推出实时语言翻译功能,提升用户交流体验。
1、Kimi推出多功能语音通话模式 支持更换声音语速调节,OpenAI全新多模态内容审核模型上线:基于 GPT-4o,可检测文本和图像数字时代对内容安全问题的重视日益增强,OpenAI推出了名为“omni-moderation-latest”的多模态内容审核模型,基于最新的GPT-4o技术,能准确识别有害文本和图像。这一更新为开发者提供强大工具,构建更强大的审核系统。新模型支持对文本和图像输入进行审核,尤其在处理非英语内容时表现出色,提高了准确性和检测能力,确保用户在更安全的空间中交流。