李彦宏在与哈佛商业评论英文版总编辑的对话中,深入探讨了人工智能的发展趋势、泡沫现象以及AI与人类的未来关系。他认为技术浪潮虽难免泡沫,但少数企业将脱颖而出创造价值。AI模型准确性提升,Chatbot能提供可靠答案。AI发展或遵循历史模式,但仍有机会创造社会价值。技术革命将替代辛苦工作,创造更舒适新工作。中国注重应用驱动,百度重构产品基于大模型,预测生成式AI将提高生产力。,5、沃尔玛推出新型人工智能模型 Wallaby,📝 NotebookLM可以分析YouTube视频转录,提炼关键信息和主题。🔍 用户可通过点击主题获取详细信息并提出问题,NotebookLM还会给出问题建议。🎧 新增支持音频录音功能,用户可搜索转录内容并创建学习指南。,✨ Zoom计划推出数字分身功能,将用户视频转化为AI驱动的逼真数字化身,提高异步交流效率。💡 深度伪造技术的普及使得区分真相和虚假信息变得困难,可能导致虚假视频的滥用。🔒 Zoom对安全措施描述模糊,仍需加强保护措施以防止恶意虚假视频的生成。,Runway公司宣布百部电影基金计划,旨在支持AI技术在电影制作中的应用。该计划提供500万美元现金资助,吸引导演们参与。公司强调灵活性和支持多种视频项目形式。
2、vivo发布全新蓝心大模型矩阵,2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元,📈 Llama3.2模型支持在移动设备上进行视觉任务,帮助开发者实现创新。🕶️ 首款Orion AR眼镜被称为“最先进的AR眼镜”,将整合其他可穿戴设备。🎤 Ray-Ban智能眼镜推出实时语言翻译功能,提升用户交流体验。
5、比FLUX快100倍!英伟达联手MIT、清华推出超快AI图像生成模型Sana,笔记本也能秒速出图!,微软AI副总裁塞巴斯蒂安・布贝克离开微软加盟OpenAI,将致力于人工通用智能(AGI)的研究。这一转变标志着布贝克的职业转折,也为OpenAI的发展增添了强有力的支持。
🚀 Canva吸引开发者构建超过300个应用,累计使用次数超过10亿次。💼 Canva将高级应用纳入Pro订阅,设立5000万美元的开发者创新基金,奖励参与盈利计划的开发者。🔍 Canva推出新API功能,包括内容查询API、设计编辑API、身份验证API和表格API,提供更强大和灵活的应用创建能力。,美图公司宣布其开发的AI短片创作工具MOKI正式对所有用户开放,为用户提供一站式成片能力,结合AI驱动的脚本、分镜、视频生成、配音、配乐能力,使普通用户能轻松上手,快速创作个性化短片。MOKI在中文语意理解准确性和东方视觉风格上表现出色,未来计划提供更多专业功能。,📜 专为长剧本解析设计的动态故事板 AI 生成工具“神笔马良”。🤖 实现剧本智能分析、角色创作、分镜创作台词朗读等功能。🎬 将剧本内容视听化呈现,助力创作者提升作品表现,推动影视行业创新。,OpenAI全新多模态内容审核模型上线:基于 GPT-4o,可检测文本和图像数字时代对内容安全问题的重视日益增强,OpenAI推出了名为“omni-moderation-latest”的多模态内容审核模型,基于最新的GPT-4o技术,能准确识别有害文本和图像。这一更新为开发者提供强大工具,构建更强大的审核系统。新模型支持对文本和图像输入进行审核,尤其在处理非英语内容时表现出色,提高了准确性和检测能力,确保用户在更安全的空间中交流。
🌟 台积电Q3净利润达101亿美元,同比增长54%。💻 人工智能推动高性能芯片需求,助力业绩增长。🚀 台积电持续扩大生产能力,以满足市场日益增长的需求。,沃尔玛最近推出了名为Wallaby的大型语言模型,专注于零售行业数据,旨在提升客户服务体验。他们采用多模型组合的方法,灵活应对不同应用需求。升级后的客户支持助手能够更精准地理解客户意图,提供个性化服务。,🌟 o1模型被称为能显著减少 AI 偏见,但测试结果显示其表现不如预期💡 o1在隐性歧视方面表现优于 GPT-4o,但在显性歧视上却更糟糕。💰 推理模型 o1成本高,运行缓慢,未来仍需在多个方面改进。,3、开源版NotebookLM来了!Podcastfy:输入PDF、文本、网址等即可转换成播客,微软AI副总裁跳槽OpenAI 将致力于AGI研究
最近的研究显示,GPT-4具备了面部识别、性别判断和年龄估算能力,准确率超越专业算法,但存在安全隐患。研究揭示了绕过GPT-4安全机制的方法,引发了对大型语言模型安全性的思考。尽管GPT-4在生物识别任务表现出色,研究作者警告不能完全依赖其识别能力。,🔒 数据查看在严格控制的安全环境中进行,禁止携带录音设备。⚖️ 未来可能面临更多法规,推动AI数据透明度的要求。📝 OpenAI同意向律师披露训练数据,满足版权诉讼需要。
英伟达最新一代Blackwell GPU引发了前所未有的需求,CEO黄仁勋透露未来12个月供应量已售罄,市场对高性能计算的渴望再次得到证实。,📜 专为长剧本解析设计的动态故事板 AI 生成工具“神笔马良”。🤖 实现剧本智能分析、角色创作、分镜创作台词朗读等功能。🎬 将剧本内容视听化呈现,助力创作者提升作品表现,推动影视行业创新。
6、OpenAI、谷歌等100多家公司支持欧盟人工智能法案,Midjourney即将推出在线编辑器,V7版本和个性化功能在路上,Cove是一家由前Google Maps核心团队成员创立的AI初创公司,致力于开发新一代智能工作空间,解决AI对话工具在复杂项目协作中的限制。他们推出的可视化工作空间结合AI协作,提供更自然的工作方式,已获得600万美元种子轮融资。
2、美图AI短片创作工具MOKI全面开放 支持生成配乐、细节修改,OpenAI在最新的版权诉讼中达成协议,同意向原告律师披露用于训练生成性AI模型的数据。这一举措旨在满足版权诉讼的需求,但数据查看过程受到严格控制,确保安全性。未来可能面临更多法规要求,推动AI数据透明度的要求。,🎵 用户上传照片或视频即可生成匹配氛围的歌曲,提升作品趣味性。📸 不仅适用于搞笑梗图和自拍视频,甚至随手拍的菜单照片也能生成适配音乐🎶 根据图片色调和文字信息匹配音乐风格,让用户产生特定旋律的感觉。
6、夸张!GPT-4无意中掌握面部识别技术,准确率超越专业算法,1、豆包推出Ola Friend智能体耳机:售价1199元
🌟 微软正在开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。📂 Windows 的新功能 Recall 能深入挖掘用户的数字历史,重现过去的点滴经历。💬 Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。,最近的研究显示,GPT-4具备了面部识别、性别判断和年龄估算能力,准确率超越专业算法,但存在安全隐患。研究揭示了绕过GPT-4安全机制的方法,引发了对大型语言模型安全性的思考。尽管GPT-4在生物识别任务表现出色,研究作者警告不能完全依赖其识别能力。,2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元,李彦宏在与哈佛商业评论英文版总编辑的对话中,深入探讨了人工智能的发展趋势、泡沫现象以及AI与人类的未来关系。他认为技术浪潮虽难免泡沫,但少数企业将脱颖而出创造价值。AI模型准确性提升,Chatbot能提供可靠答案。AI发展或遵循历史模式,但仍有机会创造社会价值。技术革命将替代辛苦工作,创造更舒适新工作。中国注重应用驱动,百度重构产品基于大模型,预测生成式AI将提高生产力。
ChatGPT大变身:新界面引入搜索功能,Molmo是一款开源多模态人工智能模型,基于Qwen2-72B和OpenAI的CLIP,以高效性能和创新功能挑战传统商业模型。其突出特点在于小巧高效、引入指向功能、性能优异、开源性质和全面功能。Molmo的成功归功于高质量训练数据和多样性,展现出色的多模态交互能力。,👁️ 视频互动方式改变:Sieve推出的技术实现视频中眼神接触的自动修复,提升视频吸引力和互动性。🔧 技术优势突出:Sieve的技术快速集成现有应用,解决视频缺乏眼神接触问题,特别适用于演讲者直视镜头场景。⚙️ 实时视线修正机制:AI模型和神经网络精准调整眼神角度,动态处理头部位置变化,保持视频自然流畅。,在日常生活中,我们经常拍摄有趣的照片和视频,但缺乏合适的音乐。Suno推出的新功能“Suno Scenes”解决了这一难题,用户可以上传照片或视频生成匹配氛围的歌曲,让照片和视频更生动有趣。,欧盟最新推出的人工智能倡议吸引了100多家公司的支持,其中包括OpenAI、谷歌等科技巨头。虽然苹果和Meta选择观望,但行业对人工智能发展的重视和责任感仍然显著。该倡议旨在推动企业自律,为未来人工智能发展奠定基础。