
🖥️ GLM-PC语音操控:通过语音指令直接操控电脑,简化工作流程,成为打工人的救星。,谷东科技推出的Star1和Star1S眼镜代表了AI与AR技术的完美结合,提供了全彩显示和强大的AI功能。这些眼镜不仅在设计上考虑了佩戴舒适度,还在技术上实现了高清画质和多模态AI系统的应用。Star1S作为业内首款全彩双目阵列光波导AR眼镜,预计将于12月上市。,📉 苹果2024年“年度iPhone应用”提名名单再次忽视了AI应用的影响。,📈 新模型引入查询-键归一化技术,提高了定制性和响应能力。,🚀 X-Portrait2简化了角色动画流程,实现视频中表情转移至肖像生成动画视频。
🎤 现场朗读创建音色:用户通过实时朗读文本生成专属音色,确保合规与安全。,🚀 Allegro-TI2V支持高达79.2K的上下文长度和720×1280的分辨率,视频生成速度可达每秒15帧。,🔒 强调安全性:Stability AI 采取措施,防止模型被滥用。,11、字节祭出开源秘密武器HybridFlow,大模型训练速度飙升20倍,成本砍到脚脖子!,Fugatto是NVIDIA推出的一款革命性音频生成模型,具备25亿参数,旨在通过文本和音频输入为音乐创作提供灵活支持。该模型突破了传统音频生成的局限,采用创新的数据生成方法和可组合音频表示变换技术,使艺术家和开发者能够实时生成和修改声音。
🌟 OminiControl通过参数重用机制,让图像生成的控制能力更强大,效率更高。,💡 该功能支持详细描述视频场景,为创意表达提供更多可能性,推动AI视频生成技术的发展。,8、谷东科技发布双目全彩AI+AR眼镜:无感佩戴+高清镜头,💸 DeepL Voice降低沟通成本,提高团队合作效率,4、苹果Final Cut Pro11重磅发布 AI全面加持
埃隆·马斯克的人工智能公司xAI在短短16个月内达到了500亿美元的估值,超越了许多竞争对手。与OpenAI相比,xAI的迅速崛起展示了其在AI领域的强大潜力和市场吸引力。公司通过融资和技术创新,尤其是超级计算机的建设,进一步巩固了其在行业中的地位。,夸克全面升级“AI搜题”产品,提升搜题与解题速度与能力,助力用户提升学习效率。夸克AI能力落地于学习场景,让学习更智能。夸克“灵知”学习大模型实力强劲,解决用户痛点,产品能力得到全新发展。
大模型(LLM)如GPT、Llama等在人工智能领域掀起了革命,但高效训练符合人类价值观仍是难题。字节跳动豆包团队开源HybridFlow框架,为RLHF带来新可能性。HybridFlow结合单控制器和多控制器模式,灵活高效执行RLHF数据流,吞吐量提升20.57倍,推动LLM技术发展。,字节跳动推出X-Portrait2肖像动画技术,通过先进的表情编码器模型和生成扩散模型,实现超低成本高效的角色动画创作。该技术能传输细微面部表情,保持高保真度,适用于多种场景。,🎨 Raw模式生成更真实、自然图像,适合人像和自然摄影。,Rhymes AI最近推出的Allegro-TI2V模型,标志着文本到视频生成技术的重大进步。该模型不仅支持高达79.2K的上下文长度和720×1280的输出分辨率,还具备高效的视频生成能力,能够满足创作者在电影、游戏和数字艺术等领域的需求。,OpenAI公司推出了名为ChatGPT search的新功能,用户可以通过对话界面快速获取最新的网络搜索结果,无需跳转到传统搜索引擎,提供实时信息如体育比分、新闻、股票报价等。该功能简化了用户获取有用答案的过程,使用户可以以自然、对话的方式提问,并获得更好的答案。
🚀 xAI在成立16个月内达到了500亿美元的估值,超越了多家竞争对手。,🤖 技术整合包括声音设计API和Taedra工具
📈 相较于基座模型,天工大模型在标准评测集上的推理能力实现了本质提升。,📉 尽管表现出色,但k0-math在处理某些几何问题和简单题目时仍存在局限性,需进一步迭代改进。
🌟 RMBG2.0挑战传统remove.bg,抠图能力堪比付费软件,Luma AI推出了Dream Machine平台,旨在简化高质量图像和视频的创作过程,适合各种技术水平的用户。该平台基于先进的Photon图像基础模型,允许用户通过自然语言或参考图像进行创作,省去复杂的提示工程。Dream Machine的直观设计和强大的功能,如角色参考、镜头运动等。,🚀 HybridFlow框架创新结合单多控制器模式,解耦复杂计算数据依赖,灵活高效执行RLHF数据流。