
👁️ 视频互动方式改变:Sieve推出的技术实现视频中眼神接触的自动修复,提升视频吸引力和互动性。🔧 技术优势突出:Sieve的技术快速集成现有应用,解决视频缺乏眼神接触问题,特别适用于演讲者直视镜头场景。⚙️ 实时视线修正机制:AI模型和神经网络精准调整眼神角度,动态处理头部位置变化,保持视频自然流畅。,📊 新模型基于GPT-4o技术,支持文本和图像的多模态审核🌍 检测准确率在40种语言中提升42%,尤其在低资源语言上表现优异🔒 新增两类文本审核,提升对违法和暴力内容的识别能力,ChatGPT大变身:新界面引入搜索功能,9、12亿美元出售Drift后,前HubSpot高管再创业,让AI替你管理客户!
Magnific近日推出的V2图像生成服务在AI图像处理领域掀起了新的波澜,标志着其从高端软件跃升为顶级AI图像生成器,展现了技术创新和用户体验优化的雄心。,10、欧盟委员会公布《人工智能契约》签署者名单,🚀 Nvidia股价创下138.07美元新高,年内涨幅近180%。📊 公司在AI芯片市场占有率高达70%至95%,市值达3.4万亿美元。💡 CEO黄仁勋表示新一代Blackwell芯片需求“疯狂”,已售罄至明年。,✨ Zoom计划推出数字分身功能,将用户视频转化为AI驱动的逼真数字化身,提高异步交流效率。💡 深度伪造技术的普及使得区分真相和虚假信息变得困难,可能导致虚假视频的滥用。🔒 Zoom对安全措施描述模糊,仍需加强保护措施以防止恶意虚假视频的生成。,🌟 o1模型被称为能显著减少 AI 偏见,但测试结果显示其表现不如预期💡 o1在隐性歧视方面表现优于 GPT-4o,但在显性歧视上却更糟糕。💰 推理模型 o1成本高,运行缓慢,未来仍需在多个方面改进。
📈 Llama3.2模型支持在移动设备上进行视觉任务,帮助开发者实现创新。🕶️ 首款Orion AR眼镜被称为“最先进的AR眼镜”,将整合其他可穿戴设备。🎤 Ray-Ban智能眼镜推出实时语言翻译功能,提升用户交流体验。,11、AI协作工具Cove完成600万美元融资,前谷歌团队打造类notion可视化工作空间,Sieve AI初创公司推出的创新技术旨在改变视频互动方式,通过实现视频中眼神接触的自动修复,提升视频内容的吸引力和互动性。该技术能快速集成到现有应用中,解决视频缺乏眼神接触的问题,特别适用于需要演讲者直视镜头的场景。Sieve的实时视线修正技术精妙运用AI模型和神经网络,实现眼神角度调整,保持视频流畅自然。,🎧 Ola Friend智能体耳机售价1199元,支持智能对话功能。🤖 Ola Friend耳机是随时陪伴在耳边的AI朋友,提供听音乐、学习英语、导游服务等功能。📱 用户需下载豆包APP来充分利用Ola Friend耳机的功能,APP支持搜索信息、答疑解惑、激发灵感等多种功能。
🚀 Westlake-Omni是全球首个开源的中文情感端到端语音交互大模型,注重实时性和零延迟体验。💡 模型具备出色的情感理解与表达能力,能生成清晰、自然、富有表现力的中文语音。🌱 西湖心辰期望通过开源Westlake-Omni模型,促进更多开发者参与中文情感语音交互技术的发展,13、开源多模态模型Molmo 能够识别图像中的物体并生成准确描述,🛡️ 新规要求企业合规官员认真评估AI的法律风险,避免面临罚款。🤖 企业需主动监控和测试AI应用,确保技术使用合规。👥 司法部将加强对企业合规程序的审查,关注是否有效防范犯罪风险。
🎧 Ola Friend智能体耳机售价1199元,支持智能对话功能。🤖 Ola Friend耳机是随时陪伴在耳边的AI朋友,提供听音乐、学习英语、导游服务等功能。📱 用户需下载豆包APP来充分利用Ola Friend耳机的功能,APP支持搜索信息、答疑解惑、激发灵感等多种功能。,🚀 蓝心大模型矩阵全面升级,包括语言、端侧、语音、图像和多模态大模型。💡 推出30亿蓝心端侧大模型3B,性能提升300%,功耗优化46%,内存减小63%,出词速度达80字/s。🔊 新自研蓝心语音大模型支持自然语义理解、情感表达和同声传译,图像&多模态大模型强化中国特色与东方美学融合生成能力。,英伟达Blackwell GPU需求暴涨,未来12个月供应量完全售罄
Midjourney最近公布了一系列令人兴奋的更新和即将推出的新功能,展示了公司在AI图像生成领域的快速发展和创新。团队正积极推进多个项目,注重提升质量和开发核心功能,而不是急于发布新产品。,5、沃尔玛推出新型人工智能模型 Wallaby,🤖 Toy Box Flux是专注于生成3D玩具设计的人工智能模型,改变了玩具设计方式。🎨 独特训练方法和精益求精的训练过程为玩具设计注入新鲜血液,展现出可爱风格。🚀 未来计划强化模型性能,为玩具设计领域带来更多可能性。,🎧 Ola Friend智能体耳机售价1199元,支持智能对话功能。🤖 Ola Friend耳机是随时陪伴在耳边的AI朋友,提供听音乐、学习英语、导游服务等功能。📱 用户需下载豆包APP来充分利用Ola Friend耳机的功能,APP支持搜索信息、答疑解惑、激发灵感等多种功能。,🌟 Kimi 助手更新语音通话功能,提升用户互动体验。🎤 支持实时字幕和可调节声音,交互更自然。🤖 引入声音克隆技术,增加趣味性和应用场景。
11、Canva开发者平台全面升级:推出新功能和盈利模式,Midjourney即将推出在线编辑器,V7版本和个性化功能在路上,猛了!Meta震撼发布Llama3.2视觉方面吊打所有闭源模型?Meta在其年度Meta Connect2024大会上发布了Llama3.2,旨在提升边缘AI和视觉任务的能力。新推出的Llama3.2模型包括11亿和90亿参数的中型视觉模型,以及1亿和3亿参数的小型模型,特别优化了在移动设备上的使用。,猫眼娱乐发布动态故事板 AI 生成工具“神笔马良”猫眼娱乐推出的“神笔马良”工具为剧本创作者带来极大便利,实现智能分析、角色创作、分镜创作等功能,节省创作者时间和精力。工具还能将剧本内容视听化呈现,助力创作者提升作品表现,推动影视行业创新。,这篇文章报道了台积电在全球芯片需求持续上涨背景下,2024年第三季度财报的亮眼表现。公司净利润达到3523亿新台币,同比增长54%,超出市场预期。台积电作为高级芯片制造商,受益于人工智能应用的快速发展,业绩得到显著提升。
2、美图AI短片创作工具MOKI全面开放 支持生成配乐、细节修改,Rabbit R1曾备受关注的AI设备,却仅有5000人每天在使用,销售数据令人堪忧。设备匆忙上市导致用户体验不佳,面临智能手机AI功能强大的挑战。即将推出的全能行动模型或许能改变现状,但前景仍不乐观。
OpenAI全新多模态内容审核模型上线:基于 GPT-4o,可检测文本和图像数字时代对内容安全问题的重视日益增强,OpenAI推出了名为“omni-moderation-latest”的多模态内容审核模型,基于最新的GPT-4o技术,能准确识别有害文本和图像。这一更新为开发者提供强大工具,构建更强大的审核系统。新模型支持对文本和图像输入进行审核,尤其在处理非英语内容时表现出色,提高了准确性和检测能力,确保用户在更安全的空间中交流。,Elias Torres的故事展现了现实版的美国梦,从移民少年到科技传奇人物的成功轨迹令人瞩目。他创立的Agency利用AI技术革新客户成功管理领域,填补了CRM系统的空白,引起行业关注。,4、Mistral AI推超强边缘AI模型Ministral8B,🎧 Ola Friend智能体耳机售价1199元,支持智能对话功能。🤖 Ola Friend耳机是随时陪伴在耳边的AI朋友,提供听音乐、学习英语、导游服务等功能。📱 用户需下载豆包APP来充分利用Ola Friend耳机的功能,APP支持搜索信息、答疑解惑、激发灵感等多种功能。
在数字化时代,个性化的虚拟形象受到关注。DreamWaltz-G框架通过结合骨骼引导的得分蒸馏和混合3D高斯表示,提升了头像生成的一致性和动画表现力。该框架支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。,🔥 Pika1.5版本新增四种新特效,包括粉碎、溶解、瘪掉和“ta-da”特效,让视频内容炫目多彩。💰 Pika Labs吸引巨额投资,用户数量迅速增长,显示其受欢迎程度和市场潜力。🎨 提供多样的订阅计划,满足用户不同的创作需求和经济实力。,Nvidia悄然推出了一款名为Llama-3.1-Nemotron-70B-Instruct的新型人工智能模型,表现出色,已超越了OpenAI的GPT-4和Anthropic的Claude3.5,标志着人工智能领域竞争格局的重大变化。该模型在知名AI平台Hugging Face上发布,引起业界关注。Nvidia展示了强大的AI软件开发能力,支持企业探索AI解决方案。然而,用户需谨慎使用,避免错误或滥用。,11、Canva开发者平台全面升级:推出新功能和盈利模式
Cove是一家由前Google Maps核心团队成员创立的AI初创公司,致力于开发新一代智能工作空间,解决AI对话工具在复杂项目协作中的限制。他们推出的可视化工作空间结合AI协作,提供更自然的工作方式,已获得600万美元种子轮融资。,2、美图AI短片创作工具MOKI全面开放 支持生成配乐、细节修改,5、比FLUX快100倍!英伟达联手MIT、清华推出超快AI图像生成模型Sana,笔记本也能秒速出图!
9、Zoom推数字分身功能:便利还是隐忧?,6、OpenAI、谷歌等100多家公司支持欧盟人工智能法案