Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。,7、AI玩具设计师来袭:3D玩具设计工具Toy Box Flux
1、Pika1.5重磅上线四个新特效:从粉碎到消失,效果炸裂了!,9、美国司法部AI新规:AI 犯错,企业担责,🌟 Podcastfy是开源Python软件包,可将文本和网络内容转换为多语言音频对话。🎧 用户可以通过Gradio演示应用或HuggingFace体验Podcastfy,操作简单易上手。⚠️ 使用外部内容时,需确保拥有版权和权限,生成的音频内容由AI生成,不模仿现实人物。
猛了!Meta震撼发布Llama3.2视觉方面吊打所有闭源模型?Meta在其年度Meta Connect2024大会上发布了Llama3.2,旨在提升边缘AI和视觉任务的能力。新推出的Llama3.2模型包括11亿和90亿参数的中型视觉模型,以及1亿和3亿参数的小型模型,特别优化了在移动设备上的使用。,最近,美国司法部引入了新的要求,要求企业合规官员认真评估AI的法律风险,避免面临罚款。企业需主动监控和测试AI应用,确保技术使用合规。司法部将加强对企业合规程序的审查,关注是否有效防范犯罪风险。,7、200万用户量!Hugging Face旗下Gradio5发布:用自然语言轻松构建AI应用,西湖心辰开源中文情感端到端语音大模型Westlake-Omni西湖心辰宣布开源其研发的Westlake-Omni模型,作为全球首个开源的中文情感端到端语音交互大模型。该模型采用离散表示法统一文本和语音模态,注重实时性,提供零延迟体验。具备出色的情感理解与表达能力,生成清晰、自然、富有表现力的中文语音。期望通过开源鼓励更多开发者参与中文情感语音交互技术的发展。,🌟 升级视频AI Sora,生成更长、更高质量视频片段⏱️ 初始版本生成时间过长,存在风格、物理错误问题📈 视频AI市场竞争激烈,Sora需加快步伐以保持竞争力
智谱技术团队发布了CogView3及其升级版CogView3-Plus-3B,标志着AI辅助艺术创作迈入新阶段。CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。开源仓库已开放,推动AI图像生成领域快速发展,文生图技术应用前景广阔。,9、美国司法部AI新规:AI 犯错,企业担责,Pika1.5版本再度增加了四种新特效,让用户可以轻松生成炫酷动画。Pika Labs已吸引5500万美元投资,迅速积累50万用户。提供四种灵活的订阅计划,适应不同用户的需求。
7、Runway推出百部电影扶持计划,火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。
智谱技术团队发布了CogView3及其升级版CogView3-Plus-3B,标志着AI辅助艺术创作迈入新阶段。CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。开源仓库已开放,推动AI图像生成领域快速发展,文生图技术应用前景广阔。,微软AI副总裁塞巴斯蒂安・布贝克离开微软加盟OpenAI,将致力于人工通用智能(AGI)的研究。这一转变标志着布贝克的职业转折,也为OpenAI的发展增添了强有力的支持。,🎧 Ola Friend智能体耳机售价1199元,支持智能对话功能。🤖 Ola Friend耳机是随时陪伴在耳边的AI朋友,提供听音乐、学习英语、导游服务等功能。📱 用户需下载豆包APP来充分利用Ola Friend耳机的功能,APP支持搜索信息、答疑解惑、激发灵感等多种功能。
3、Magnific推V2图像生成服务 可直出4K图像,Runway公司宣布百部电影基金计划,旨在支持AI技术在电影制作中的应用。该计划提供500万美元现金资助,吸引导演们参与。公司强调灵活性和支持多种视频项目形式。
在数字化时代,个性化的虚拟形象受到关注。DreamWaltz-G框架通过结合骨骼引导的得分蒸馏和混合3D高斯表示,提升了头像生成的一致性和动画表现力。该框架支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。,Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。
Pika1.5版本再度增加了四种新特效,让用户可以轻松生成炫酷动画。Pika Labs已吸引5500万美元投资,迅速积累50万用户。提供四种灵活的订阅计划,适应不同用户的需求。,7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为,11、Canva开发者平台全面升级:推出新功能和盈利模式,💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。,10、百度世界大会2024即将开启百度宣布2024年世界大会将在上海举行,展示最新技术与产品。文心大模型4.0日均调用量超过7亿次,增长幅度惊人。百度陆续推出工具版和Turbo版本,提升用户体验。百舸AI异构计算平台4.0和千帆大模型平台3.0升级,助力企业更高效利用大模型。智能体生态快速扩大,商户在平台上开发智能体数量庞大。
沃尔玛最近推出了名为Wallaby的大型语言模型,专注于零售行业数据,旨在提升客户服务体验。他们采用多模型组合的方法,灵活应对不同应用需求。升级后的客户支持助手能够更精准地理解客户意图,提供个性化服务。,📈 Llama3.2模型支持在移动设备上进行视觉任务,帮助开发者实现创新。🕶️ 首款Orion AR眼镜被称为“最先进的AR眼镜”,将整合其他可穿戴设备。🎤 Ray-Ban智能眼镜推出实时语言翻译功能,提升用户交流体验。,10、DressRecon:输入视频就能构建出还原服装细节的3D模型,1、Kimi推出多功能语音通话模式 支持更换声音语速调节
5、沃尔玛推出新型人工智能模型 Wallaby,猫眼娱乐发布动态故事板 AI 生成工具“神笔马良”猫眼娱乐推出的“神笔马良”工具为剧本创作者带来极大便利,实现智能分析、角色创作、分镜创作等功能,节省创作者时间和精力。工具还能将剧本内容视听化呈现,助力创作者提升作品表现,推动影视行业创新。,🔑 AIGC和多模态技术深刻改变用户体验🔑 火山引擎探索AI大模型与视频技术融合,提供全方位解决方案🔑 火山引擎开发的预处理方案优化算法和工程层面,提高模型训练效率,✨ PMRF算法巧妙结合后验均值预测和修正流模型,创造全新图像恢复框架,最大程度减少失真,提升感知质量。🌟 应用广泛,涵盖去噪、超分辨率、修复受损区域和颜色恢复等多个方面,生成自然真实图像。💡 在基准和真实数据集测试中,PMRF表现优异,平衡失真和感知质量,树立新的图像恢复标准。,👁️ 视频互动方式改变:Sieve推出的技术实现视频中眼神接触的自动修复,提升视频吸引力和互动性。🔧 技术优势突出:Sieve的技术快速集成现有应用,解决视频缺乏眼神接触问题,特别适用于演讲者直视镜头场景。⚙️ 实时视线修正机制:AI模型和神经网络精准调整眼神角度,动态处理头部位置变化,保持视频自然流畅。
Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。,Kimi人工智能助手最近推出了备受期待的语音通话功能,为用户带来了丰富的互动体验。新功能集多样化应用和个性化体验于一身,提升交流效率,满足个性化需求。针对特定场景深化了功能应用,如英语陪练和模拟面试,为学习和职场提供创新解决方案。引入声音克隆技术增添趣味性,持续关注用户反馈,优化扩展语音服务应用范围。