
🚀 Molmo以小巧高效的设计理念挑战传统商业模型🎯 Molmo引入指向功能,拓展人机交互和增强现实应用可能性💡 Molmo在性能评估中表现亮眼,仅次于GPT-4o,排名第二,✨ 4K图像直接生成:V2版本能直接生成4K质量的图像,提高效率并拓展创作者创作空间。🎨 多样化风格选项:用户只需输入描述性提示,选择分辨率和风格,系统生成优化后的图像,提供丰富的创作可能性。🔧 精细控制与高级功能:提供精细调整工具,如创意细节生成、背景调整、重新照明等,满足专业用户需求。,13、开源多模态模型Molmo 能够识别图像中的物体并生成准确描述,1、Kimi推出多功能语音通话模式 支持更换声音语速调节,美图公司宣布其开发的AI短片创作工具MOKI正式对所有用户开放,为用户提供一站式成片能力,结合AI驱动的脚本、分镜、视频生成、配音、配乐能力,使普通用户能轻松上手,快速创作个性化短片。MOKI在中文语意理解准确性和东方视觉风格上表现出色,未来计划提供更多专业功能。
PMRF(后验均值修正流)算法是图像处理领域的一项创新技术,解决了图像恢复中失真与感知质量之间的矛盾,开辟了高质量图像重建的新可能。其独特之处在于在多种图像恢复任务中展现卓越性能,取得了令人瞩目的成绩,平衡了失真和感知质量。,🚀 Nvidia股价创下138.07美元新高,年内涨幅近180%。📊 公司在AI芯片市场占有率高达70%至95%,市值达3.4万亿美元。💡 CEO黄仁勋表示新一代Blackwell芯片需求“疯狂”,已售罄至明年。,Sieve AI初创公司推出的创新技术旨在改变视频互动方式,通过实现视频中眼神接触的自动修复,提升视频内容的吸引力和互动性。该技术能快速集成到现有应用中,解决视频缺乏眼神接触的问题,特别适用于需要演讲者直视镜头的场景。Sieve的实时视线修正技术精妙运用AI模型和神经网络,实现眼神角度调整,保持视频流畅自然。
✨ 4K图像直接生成:V2版本能直接生成4K质量的图像,提高效率并拓展创作者创作空间。🎨 多样化风格选项:用户只需输入描述性提示,选择分辨率和风格,系统生成优化后的图像,提供丰富的创作可能性。🔧 精细控制与高级功能:提供精细调整工具,如创意细节生成、背景调整、重新照明等,满足专业用户需求。,🚀 蓝心大模型矩阵全面升级,包括语言、端侧、语音、图像和多模态大模型。💡 推出30亿蓝心端侧大模型3B,性能提升300%,功耗优化46%,内存减小63%,出词速度达80字/s。🔊 新自研蓝心语音大模型支持自然语义理解、情感表达和同声传译,图像&多模态大模型强化中国特色与东方美学融合生成能力。,🚀 Elias Torres从17岁移民美国到创立Agency,展现现实版美国梦的传奇故事。💡 Agency利用AI技术深度学习客户数据,自动化处理客户需求预测、日程安排等任务,填补CRM系统空白。💼 Agency获得1200万美元种子轮融资,得到Sequoia合伙人和HubSpot联合创始人的支持,展望广阔的发展前景。
Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。,Elias Torres的故事展现了现实版的美国梦,从移民少年到科技传奇人物的成功轨迹令人瞩目。他创立的Agency利用AI技术革新客户成功管理领域,填补了CRM系统的空白,引起行业关注。,英伟达Blackwell GPU需求暴涨,未来12个月供应量完全售罄,7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为,🚀 蓝心大模型矩阵全面升级,包括语言、端侧、语音、图像和多模态大模型。💡 推出30亿蓝心端侧大模型3B,性能提升300%,功耗优化46%,内存减小63%,出词速度达80字/s。🔊 新自研蓝心语音大模型支持自然语义理解、情感表达和同声传译,图像&多模态大模型强化中国特色与东方美学融合生成能力。
🚀 Elias Torres从17岁移民美国到创立Agency,展现现实版美国梦的传奇故事。💡 Agency利用AI技术深度学习客户数据,自动化处理客户需求预测、日程安排等任务,填补CRM系统空白。💼 Agency获得1200万美元种子轮融资,得到Sequoia合伙人和HubSpot联合创始人的支持,展望广阔的发展前景。,8、美国FTC重拳出击:五家 AI 公司因虚假宣传被起诉!
PMRF(后验均值修正流)算法是图像处理领域的一项创新技术,解决了图像恢复中失真与感知质量之间的矛盾,开辟了高质量图像重建的新可能。其独特之处在于在多种图像恢复任务中展现卓越性能,取得了令人瞩目的成绩,平衡了失真和感知质量。,微软AI副总裁塞巴斯蒂安・布贝克离开微软加盟OpenAI,将致力于人工通用智能(AGI)的研究。这一转变标志着布贝克的职业转折,也为OpenAI的发展增添了强有力的支持。,这篇文章报道了台积电在全球芯片需求持续上涨背景下,2024年第三季度财报的亮眼表现。公司净利润达到3523亿新台币,同比增长54%,超出市场预期。台积电作为高级芯片制造商,受益于人工智能应用的快速发展,业绩得到显著提升。
Canva最近宣布对其开发者平台进行全面升级,推出一系列新功能,旨在促进应用生态系统的发展和创新。这一举措将为用户带来更丰富、更强大的创意体验,同时为开发者提供更多机会,共同推动设计工具生态系统的发展。,🛡️ 新规要求企业合规官员认真评估AI的法律风险,避免面临罚款。🤖 企业需主动监控和测试AI应用,确保技术使用合规。👥 司法部将加强对企业合规程序的审查,关注是否有效防范犯罪风险。,📊 新模型基于GPT-4o技术,支持文本和图像的多模态审核🌍 检测准确率在40种语言中提升42%,尤其在低资源语言上表现优异🔒 新增两类文本审核,提升对违法和暴力内容的识别能力,🎧 Ola Friend智能体耳机售价1199元,支持智能对话功能。🤖 Ola Friend耳机是随时陪伴在耳边的AI朋友,提供听音乐、学习英语、导游服务等功能。📱 用户需下载豆包APP来充分利用Ola Friend耳机的功能,APP支持搜索信息、答疑解惑、激发灵感等多种功能。
11、Canva开发者平台全面升级:推出新功能和盈利模式,研究人员开发的AI模型DIAMOND能够模拟《反恐精英:全球攻势》游戏,运行在Nvidia RTX3090显卡上,每秒10帧的速度。尽管存在一些缺陷,但未来有望通过增加数据和计算能力来改善模型性能。
9、美国司法部AI新规:AI 犯错,企业担责,9、12亿美元出售Drift后,前HubSpot高管再创业,让AI替你管理客户!
火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。,✨ Zoom计划推出数字分身功能,将用户视频转化为AI驱动的逼真数字化身,提高异步交流效率。💡 深度伪造技术的普及使得区分真相和虚假信息变得困难,可能导致虚假视频的滥用。🔒 Zoom对安全措施描述模糊,仍需加强保护措施以防止恶意虚假视频的生成。,🔒 数据隐私成为2024年生成性AI的主要担忧,关注从22%跃升至72%。📈 78%的商业领袖将“安全和保障”列为伦理技术原则之一,强调安全性的重要性。⚖️ 欧盟AI法案的实施影响深远,促使公司在AI使用上进行必要的调整与合规。,📈 Llama3.2模型支持在移动设备上进行视觉任务,帮助开发者实现创新。🕶️ 首款Orion AR眼镜被称为“最先进的AR眼镜”,将整合其他可穿戴设备。🎤 Ray-Ban智能眼镜推出实时语言翻译功能,提升用户交流体验。
最近的研究显示,GPT-4具备了面部识别、性别判断和年龄估算能力,准确率超越专业算法,但存在安全隐患。研究揭示了绕过GPT-4安全机制的方法,引发了对大型语言模型安全性的思考。尽管GPT-4在生物识别任务表现出色,研究作者警告不能完全依赖其识别能力。,10、DressRecon:输入视频就能构建出还原服装细节的3D模型,OpenAI快凉了的Sora将迎来大升级:生成速度更快、内容更长、质量更高,Midjourney最近公布了一系列令人兴奋的更新和即将推出的新功能,展示了公司在AI图像生成领域的快速发展和创新。团队正积极推进多个项目,注重提升质量和开发核心功能,而不是急于发布新产品。
🧠 布贝克离开微软,加盟OpenAI,专注于AGI研究。🤝 微软与OpenAI关系复杂,既是投资者又是竞争对手,双方希望继续合作。🚀 布贝克的加入将推动OpenAI在小型语言模型和AGI研究方面取得突破,告别视频录制眼神飘忽!Sieve AI黑科技,实时修正眼神问题,在数字化时代,个性化的虚拟形象受到关注。DreamWaltz-G框架通过结合骨骼引导的得分蒸馏和混合3D高斯表示,提升了头像生成的一致性和动画表现力。该框架支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。