
2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元,OpenAI 新模型 o1 声称能 “完美” 纠正偏见,但数据并不完全支持
vivo在2024vivo开发者大会上发布了全新蓝心大模型矩阵,升级了语言、语音、图像和多模态能力,提供更强大的性能和功能。新的蓝心大模型矩阵将行业标准提升至新高度,为用户带来更优质的体验。,📝 NotebookLM可以分析YouTube视频转录,提炼关键信息和主题。🔍 用户可通过点击主题获取详细信息并提出问题,NotebookLM还会给出问题建议。🎧 新增支持音频录音功能,用户可搜索转录内容并创建学习指南。,✨ 4K图像直接生成:V2版本能直接生成4K质量的图像,提高效率并拓展创作者创作空间。🎨 多样化风格选项:用户只需输入描述性提示,选择分辨率和风格,系统生成优化后的图像,提供丰富的创作可能性。🔧 精细控制与高级功能:提供精细调整工具,如创意细节生成、背景调整、重新照明等,满足专业用户需求。
豆包推出Ola Friend智能体耳机,这款集成了人工智能技术的耳机旨在为用户提供一个随时陪伴在耳边的AI朋友。用户可以享受听音乐、学习英语、获取导游服务等多种功能,需要下载豆包APP来充分利用。,OpenAI正着手升级其视频AI Sora,旨在生成更长、更高质量的视频片段。初始版本存在生成时间过长和风格、物理错误问题。视频AI市场竞争激烈,Sora需加快步伐以保持竞争力。,🌟 GPT-4在性别识别测试中达到了100%的完美准确率,超越了DeepFace模型。📊 GPT-4的年龄估算准确率为74.25%,但对年长者的估算可能较宽泛。🔒 研究发现可绕过GPT-4的安全机制,需加强对大型语言模型安全性的研究。,OpenAI近期对ChatGPT进行了重大更新,将其从单纯的对话助手转变为综合性信息平台。界面更新包括新增的Canvas功能和移动提示框位置,使用户体验更加便捷。引入的SearchGPT功能让用户可以访问实时网络数据,并与知名出版商合作确保信息可靠性。,英伟达与麻省理工学院、清华大学合作开发的Sana框架能高效生成高达4096×4096分辨率的图像,且在笔记本电脑GPU上运行。Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。虽存在局限性,但Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。
1、Pika1.5重磅上线四个新特效:从粉碎到消失,效果炸裂了!,在数字化时代,个性化的虚拟形象受到关注。DreamWaltz-G框架通过结合骨骼引导的得分蒸馏和混合3D高斯表示,提升了头像生成的一致性和动画表现力。该框架支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。,10、百度世界大会2024即将开启百度宣布2024年世界大会将在上海举行,展示最新技术与产品。文心大模型4.0日均调用量超过7亿次,增长幅度惊人。百度陆续推出工具版和Turbo版本,提升用户体验。百舸AI异构计算平台4.0和千帆大模型平台3.0升级,助力企业更高效利用大模型。智能体生态快速扩大,商户在平台上开发智能体数量庞大。,🌟 升级视频AI Sora,生成更长、更高质量视频片段⏱️ 初始版本生成时间过长,存在风格、物理错误问题📈 视频AI市场竞争激烈,Sora需加快步伐以保持竞争力
👗 研究团队推出DressRecon技术,通过单目视频实现高质量的人体重建,特别适用于宽松衣物和手持物体的场景。📷 该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识来捕捉细微几何特征。🎥 重建结果不仅生成高保真的三维模型,还支持从任意角度渲染,提升了可视化体验。,🎵 用户上传照片或视频即可生成匹配氛围的歌曲,提升作品趣味性。📸 不仅适用于搞笑梗图和自拍视频,甚至随手拍的菜单照片也能生成适配音乐🎶 根据图片色调和文字信息匹配音乐风格,让用户产生特定旋律的感觉。,Elias Torres的故事展现了现实版的美国梦,从移民少年到科技传奇人物的成功轨迹令人瞩目。他创立的Agency利用AI技术革新客户成功管理领域,填补了CRM系统的空白,引起行业关注。
OpenAI的首席技术官Mira Murati宣布离职,引发了公司高层人事大变动。离职信中表达了对过去工作的感激之情,同时指出团队取得的成就和技术进步。公司首席执行官Sam Altman表示领导层变动是自然发展的一部分,并安排新的人事安排以确保公司稳步发展。,🎵 用户上传照片或视频即可生成匹配氛围的歌曲,提升作品趣味性。📸 不仅适用于搞笑梗图和自拍视频,甚至随手拍的菜单照片也能生成适配音乐🎶 根据图片色调和文字信息匹配音乐风格,让用户产生特定旋律的感觉。,📝 NotebookLM可以分析YouTube视频转录,提炼关键信息和主题。🔍 用户可通过点击主题获取详细信息并提出问题,NotebookLM还会给出问题建议。🎧 新增支持音频录音功能,用户可搜索转录内容并创建学习指南。