OpenAI:如果不使用版权内容,ChatGPT等AI模型不可能开发出来
创始人
2024-05-16 02:48:45
0

原标题:OpenAI:如果不使用版权内容,ChatGPT等AI模型不可能开发出来

IT之家 1 月 10 日消息,ChatGPT 开发商 OpenAI 近日承认,像 ChatGPT 这样的 AI 工具的开发离不开受版权保护的素材,并称如果没有这些素材,这些工具根本无法诞生。据《每日电讯报》报道,OpenAI 在提交给英国上议院通信和数字事务特别委员会关于大型语言模型调查的文件中做出了这一表述。

ChatGPT 和图像生成器 DALL-E 等 AI 模型之所以拥有强大的能力,主要是因为它们通过海量的内容进行训练,其中一部分是从网上公开内容抓取而来,并不总是经过版权持有人的许可(OpenAI 确实会获得部分训练内容的许可)。这种“自由奔放”的抓取方式在学术机器学习研究中由来已久,但随着深度学习 AI 模型近期走向商业化,这种做法也受到了愈加严厉的审查。

OpenAI 在提交给上议院的文件中写道,“由于当前版权涵盖了几乎所有形式的人类表达方式,包括博客文章、照片、论坛帖子、软件代码片段和政府文件,如果不使用受版权保护的内容,就不可能训练当今领先的人工智能模型。”

OpenAI 进一步表示,如果将训练数据仅限于“一个世纪前”的公共领域书籍和图画,将无法训练出“满足当代公民需求”的 AI 系统。

IT之家注意到,去年 12 月《纽约时报》对 OpenAI 和 OpenAI 重要投资者微软提起诉讼,指控他们未经许可在产品中非法使用了该报的内容。OpenAI 于本周一在其网站上对此案作出了回应,称该诉讼毫无根据,并重申了其对新闻业的支持以及与新闻机构的合作关系。

OpenAI 的辩护主要基于“合理使用”的法律原则,该原则允许在特定情况下未经所有者许可有限使用受版权保护的内容。该公司坚称,版权法并不禁止使用此类素材训练 AI 模型。

“使用公开可获取的互联网素材训练 AI 模型属于合理使用,这一观点得到了长期以来广泛接受的先例的支持,”OpenAI 在其周一发布的博客文章中写道,“我们认为,这一原则对创作者是公平的,对创新者是必要的,对美国的竞争力也至关重要。”

这不是 OpenAI 第一次就其 AI 训练数据提出合理使用辩护。早在去年 8 月份,OpenAI 在回应喜剧演员 Sarah Silverman 的版权诉讼时,同样以合理使用为由捍卫了其使用公开可获取素材的做法。OpenAI 宣称,那位喜剧演员对版权范围存在“误解”,没有考虑到“合理使用”等限制和例外条款,而正是这些条款为像大型语言模型这样的前沿人工智能创新留下了必要的发展空间。

相关内容

热门资讯

韦伯望远镜助力,天王星卫星家族... 近日,美国国家航空航天局宣布了一项新的天文发现,詹姆斯·韦布空间望远镜成功捕捉到了一颗围绕天王星旋转...
热点问答|以色列“E1区”定居... 新华社耶路撒冷8月20日电 热点问答|以色列“E1区”定居点建设计划为何引众怒? 新华社记者王卓伦 ...
月牙泉水流为何忽大忽小?“地下... 8月19日,月牙泉“苏醒”让泉城市民游客兴奋不已。8月20日中午12点左右,新黄河记者再次来到五龙潭...
失踪2小时才报警,北京男童为何... 2025年8月9日,一名来自北京的8岁自闭症男孩在大理苍山参加“独立营”时走失。经过几日搜救,8月1...
原创 巴... 据环球网报道,一场停火都快过去俩月的冲突,居然还在舆论场上打得火热。印度那边最近可是忙坏了,又是开新...
来论 | AI浪潮下高校动画专... 随着生成式人工智能技术的飞速发展,动画产业正经历一场由技术进步驱动的深刻变革。 在角色设计、场景搭...
北京又一家“胖永辉”焕新开业!... 近日,历经49天深度调改的永辉超市北京旧宫店,以“胖永辉”全新面貌正式开门纳客。作为北京亦庄第2家学...
A股集体翻红,超3600股上涨... 8月20日,A股市场全天探底回升,截至收盘,沪指涨1.04%,深成指涨0.89%,创业板指涨0.23...
2510套房源 北京首次大规模... 8月19日,在北京保障房中心所属的燕保·马泉营家园的办事大厅内,多位大学生正在办理入住手续。据了解,...
上海街头一女子突然倒地,满脸是... 为了冬天保暖、夏天遮阳 不少市民会在电瓶车龙头上 安装挡风被 但小坊在此提醒 一定要注意安全! 8...