
🌟 微软正在开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。📂 Windows 的新功能 Recall 能深入挖掘用户的数字历史,重现过去的点滴经历。💬 Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。,🚀 蓝心大模型矩阵全面升级,包括语言、端侧、语音、图像和多模态大模型。💡 推出30亿蓝心端侧大模型3B,性能提升300%,功耗优化46%,内存减小63%,出词速度达80字/s。🔊 新自研蓝心语音大模型支持自然语义理解、情感表达和同声传译,图像&多模态大模型强化中国特色与东方美学融合生成能力。,在数字创意的浪潮中,Toy Box Flux作为一款专注于生成3D玩具设计的人工智能模型,革新了玩具设计的方式。其独特训练方法和精益求精的训练过程为玩具设计注入新鲜血液,展现出令人心动的可爱风格。未来,开发团队计划进一步强化模型性能,为玩具设计领域带来更多可能性。,7、200万用户量!Hugging Face旗下Gradio5发布:用自然语言轻松构建AI应用,12、OpenAI在版权诉讼中将披露训练数据,但仅限律师查看
Adobe在最新的MAX大会上推出了Firefly AI视频模型和多个增强版Photoshop工具,为用户带来了令人振奋的AI新功能。Firefly视频模型让用户通过文本提示创建或修改视频内容,为创作者们提供了全新的创作空间。同时,Photoshop新增的AI工具如移除工具和生成填充功能,让用户更轻松地编辑图像。Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。,研究人员开发的AI模型DIAMOND能够模拟《反恐精英:全球攻势》游戏,运行在Nvidia RTX3090显卡上,每秒10帧的速度。尽管存在一些缺陷,但未来有望通过增加数据和计算能力来改善模型性能。,🔒 数据查看在严格控制的安全环境中进行,禁止携带录音设备。⚖️ 未来可能面临更多法规,推动AI数据透明度的要求。📝 OpenAI同意向律师披露训练数据,满足版权诉讼需要。,微软AI副总裁跳槽OpenAI 将致力于AGI研究
7、AI玩具设计师来袭:3D玩具设计工具Toy Box Flux,3、开源版NotebookLM来了!Podcastfy:输入PDF、文本、网址等即可转换成播客,🌟 新发布的Llama-3.1-Nemotron-70B-Instruct模型表现超越OpenAI和Anthropic,标志着AI竞争的重大变化。🚀 Nvidia将其AI发展从硬件扩展到软件,展示出强大的模型开发能力。💻 该模型提供了易于使用的API接口,使更多企业能获取并使用先进的AI技术。,📜 专为长剧本解析设计的动态故事板 AI 生成工具“神笔马良”。🤖 实现剧本智能分析、角色创作、分镜创作台词朗读等功能。🎬 将剧本内容视听化呈现,助力创作者提升作品表现,推动影视行业创新。,6、炸了!OpenAI人事大震荡,CTO、首席研究官纷纷宣布离职!
Pika1.5版本再度增加了四种新特效,让用户可以轻松生成炫酷动画。Pika Labs已吸引5500万美元投资,迅速积累50万用户。提供四种灵活的订阅计划,适应不同用户的需求。,🚀 Sana框架高效生成4096×4096分辨率图像,可在笔记本GPU上运行。🔑 Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。💡 Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。
在数字创意的浪潮中,Toy Box Flux作为一款专注于生成3D玩具设计的人工智能模型,革新了玩具设计的方式。其独特训练方法和精益求精的训练过程为玩具设计注入新鲜血液,展现出令人心动的可爱风格。未来,开发团队计划进一步强化模型性能,为玩具设计领域带来更多可能性。,3、小红书下一个爆火玩法?Suno新功能Suno Scenes给你的“梗图”加分!,在数字化时代,个性化的虚拟形象受到关注。DreamWaltz-G框架通过结合骨骼引导的得分蒸馏和混合3D高斯表示,提升了头像生成的一致性和动画表现力。该框架支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。,1、Pika1.5重磅上线四个新特效:从粉碎到消失,效果炸裂了!,8、OpenAI 申请法庭驳回马斯克诉讼,称其为 “骚扰” 行为
告别视频录制眼神飘忽!Sieve AI黑科技,实时修正眼神问题,谷歌NotebookLM推出新功能,通过分析视频转录文本提炼关键信息,让用户轻松获取YouTube视频精华内容,提高学习效率。用户可点击主题获取详细信息,提出问题并获得建议,支持音频录音功能,帮助用户搜索转录内容和创建学习指南。,🔍 Orion AR 眼镜采用定制的Micro LED显示技术,将数字信息无缝融入现实世界,配备七个高精度摄像头和神秘的神经腕带,用户可以轻松控制数字世界。🌐 Orion 眼镜内置智能AI系统,感知周围环境并预测用户需求,例如根据冰箱食材推荐食谱,提升用户生活便利性。👓 Orion 眼镜设计轻便舒适,配备超大视场角,让用户在室内娱乐和户外探索中获得出色体验,增强社交互动的自然感。,💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。
13、开源多模态模型Molmo 能够识别图像中的物体并生成准确描述,🎵 用户上传照片或视频即可生成匹配氛围的歌曲,提升作品趣味性。📸 不仅适用于搞笑梗图和自拍视频,甚至随手拍的菜单照片也能生成适配音乐🎶 根据图片色调和文字信息匹配音乐风格,让用户产生特定旋律的感觉。,沃尔玛最近推出了名为Wallaby的大型语言模型,专注于零售行业数据,旨在提升客户服务体验。他们采用多模型组合的方法,灵活应对不同应用需求。升级后的客户支持助手能够更精准地理解客户意图,提供个性化服务。,3、小红书下一个爆火玩法?Suno新功能Suno Scenes给你的“梗图”加分!,OpenAI在最新的版权诉讼中达成协议,同意向原告律师披露用于训练生成性AI模型的数据。这一举措旨在满足版权诉讼的需求,但数据查看过程受到严格控制,确保安全性。未来可能面临更多法规要求,推动AI数据透明度的要求。
李彦宏:未来5-10年 生成式AI将使每个人都具备程序员能力,🚀 Molmo以小巧高效的设计理念挑战传统商业模型🎯 Molmo引入指向功能,拓展人机交互和增强现实应用可能性💡 Molmo在性能评估中表现亮眼,仅次于GPT-4o,排名第二,3、Magnific推V2图像生成服务 可直出4K图像,最近,美国司法部引入了新的要求,要求企业合规官员认真评估AI的法律风险,避免面临罚款。企业需主动监控和测试AI应用,确保技术使用合规。司法部将加强对企业合规程序的审查,关注是否有效防范犯罪风险。
🌟 技术浪潮中的泡沫现象:少数企业将脱颖而出创造社会价值。🚀 AI模型准确性提升:Chatbot能提供可靠答案。💡 技术革命将替代辛苦工作:创造更舒适新工作。,在日常生活中,我们经常拍摄有趣的照片和视频,但缺乏合适的音乐。Suno推出的新功能“Suno Scenes”解决了这一难题,用户可以上传照片或视频生成匹配氛围的歌曲,让照片和视频更生动有趣。,🚀 Canva吸引开发者构建超过300个应用,累计使用次数超过10亿次。💼 Canva将高级应用纳入Pro订阅,设立5000万美元的开发者创新基金,奖励参与盈利计划的开发者。🔍 Canva推出新API功能,包括内容查询API、设计编辑API、身份验证API和表格API,提供更强大和灵活的应用创建能力。
OpenAI近期对ChatGPT进行了重大更新,将其从单纯的对话助手转变为综合性信息平台。界面更新包括新增的Canvas功能和移动提示框位置,使用户体验更加便捷。引入的SearchGPT功能让用户可以访问实时网络数据,并与知名出版商合作确保信息可靠性。,Molmo是一款开源多模态人工智能模型,基于Qwen2-72B和OpenAI的CLIP,以高效性能和创新功能挑战传统商业模型。其突出特点在于小巧高效、引入指向功能、性能优异、开源性质和全面功能。Molmo的成功归功于高质量训练数据和多样性,展现出色的多模态交互能力。,8、美国FTC重拳出击:五家 AI 公司因虚假宣传被起诉!,🤖 Toy Box Flux是专注于生成3D玩具设计的人工智能模型,改变了玩具设计方式。🎨 独特训练方法和精益求精的训练过程为玩具设计注入新鲜血液,展现出可爱风格。🚀 未来计划强化模型性能,为玩具设计领域带来更多可能性。,猛了!Meta震撼发布Llama3.2视觉方面吊打所有闭源模型?Meta在其年度Meta Connect2024大会上发布了Llama3.2,旨在提升边缘AI和视觉任务的能力。新推出的Llama3.2模型包括11亿和90亿参数的中型视觉模型,以及1亿和3亿参数的小型模型,特别优化了在移动设备上的使用。
李彦宏在与哈佛商业评论英文版总编辑的对话中,深入探讨了人工智能的发展趋势、泡沫现象以及AI与人类的未来关系。他认为技术浪潮虽难免泡沫,但少数企业将脱颖而出创造价值。AI模型准确性提升,Chatbot能提供可靠答案。AI发展或遵循历史模式,但仍有机会创造社会价值。技术革命将替代辛苦工作,创造更舒适新工作。中国注重应用驱动,百度重构产品基于大模型,预测生成式AI将提高生产力。,🔍 智能助手集成搜索、生成内容、分析数据,提高工作效率。💬 通过简单对话获得灵活解答和见解,无需多应用切换。🔐 安全性和隐私保护严格,遵循GDPR和CCPA法规,提供安全可靠的使用环境。,7、Runway推出百部电影扶持计划
OpenAI全新多模态内容审核模型上线:基于 GPT-4o,可检测文本和图像数字时代对内容安全问题的重视日益增强,OpenAI推出了名为“omni-moderation-latest”的多模态内容审核模型,基于最新的GPT-4o技术,能准确识别有害文本和图像。这一更新为开发者提供强大工具,构建更强大的审核系统。新模型支持对文本和图像输入进行审核,尤其在处理非英语内容时表现出色,提高了准确性和检测能力,确保用户在更安全的空间中交流。,🚀 Cove完成600万美元种子轮融资,投资方包括Sequoia Capital、Elad Gil、Homebrew。🔑 Cove提供类似Notion的可视化工作空间,用户可自由组织多种内容形式,AI作为协作者直接参与内容创建和优化。💡 Cove配备强大的Chrome扩展,与常用办公工具无缝对接,智能提供帮助,应用场景广泛。,谷歌NotebookLM推出新功能,通过分析视频转录文本提炼关键信息,让用户轻松获取YouTube视频精华内容,提高学习效率。用户可点击主题获取详细信息,提出问题并获得建议,支持音频录音功能,帮助用户搜索转录内容和创建学习指南。,7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为,12、OpenAI在版权诉讼中将披露训练数据,但仅限律师查看