研究:反复使用AI生成的内容来训练AI可造成“模型崩溃”
2025-01-19 【 字体:大 中 小 】

模型崩溃发生得如此迅速且难以察觉。
IT之家 9 月 5 日消息,当地时间 9 月 4 日,据《福布斯》报道,牛津大学的伊利亚・舒梅洛夫博士和他的团队发现,当生成式 AI 软件仅依赖于由 AI 生成的内容时,回答的质量开始恶化。这项研究已经发表在《自然》杂志上。
在最初的两次查询后,答案逐渐偏离准确性,到第五次时,质量显著下降,到了第九次连续查询时,回答已完全退化为无意义的胡言乱语。研究人员将这种生成式 AI 内容的循环过度使用称为“模型崩溃”,即 AI 在不断污染自己的训练集后,输出的内容逐渐偏离现实,最终变得毫无价值。
舒梅洛夫表示:“令人惊讶的是,模型崩溃发生得如此迅速且难以察觉。最初,它会影响到少数数据 —— 那些代表性不足的数据。接着,它会影响输出的多样性,导致差异性减少。有时,你会观察到对多数数据的微小改进,但这种改进掩盖了少数数据表现的恶化。模型崩溃可能带来严重后果。”
研究人员通过一种方法确定了“模型崩溃”现象的存在:使用一个预训练的 AI 驱动的维基百科,然后让 AI 模型基于自己生成的内容进行更新。受污染数据的影响逐渐导致原本的训练集被侵蚀,输出的信息也随之变得难以理解。例如,在第九次查询循环后,研究中的维基百科条目从关于 14 世纪英国教堂尖顶的内容滑稽地变成了一篇关于各种颜色的短尾兔子的论文。
报道称,根据亚马逊网络服务(Amazon Web Services)团队在 6 月发布的另一项研究,大约 57% 的网络文本都经过了 AI 算法的翻译。如果互联网上的人类生成数据迅速被 AI 过滤内容覆盖,且舒梅洛夫的研究发现属实,那么 AI 可能正在“自我毁灭”—— 并同时“毁灭”互联网。
研究得出结论,要实现 AI 的长期可持续发展,唯一方法是确保其能够访问现有的非 AI 生成内容,并持续引入新的人工生成内容。

猜你喜欢

4月29日海亮转债上涨025%,转股溢价率1084%


2月7日基金净值:信澳智远三年持有期混合A最新净值05039,涨088%


万科多只债券上涨


股市中的杠杆:撬动财富的双刃剑


宝洁(PGUS)定价优势消退:Q3价涨量不涨,有机销售额不及预期


【俄国防部:俄“中部”部队集群打击乌军约370个目标】#俄乌局势新进


《政府工作报告》起草组:去年中国吸引外资在全球排第二,在发展中国家居首位


揭秘:合法配资平台中的巨头


上汽通用五菱7月实销108479台:五菱银标销量达到45305台


贵州燃气(600903SH):北京东嘉合计减持297%公司股份 减持计划已实施完成


GEN全胜占据LCK榜首!HLE紧随其后!T1冲进前三!_队伍_状态_排名


港股开盘丨恒生指数开盘涨017% 恒生科技指数涨016%


4月28日甬金转债下跌09%,转股溢价率9279%


民生银行:“电子信用证”福费廷秒放款 供应链金融服务再升级


债市公告精选(4月17日)金科地产公布重整计划多项进展;奥园集团累计未能清偿债务达43833亿元


财信研究评7月外贸数据:外需、基数和价格共致出口降幅扩大


4月29日丰山转债上涨282%,转股溢价率2071%


聚焦城乡融合多态 挖掘农业新质生产力 2025最美村镇评选活动启动


伊朗导弹技术新突破 改写地区军事平衡?专家分析→_卡西姆·_巴西_目标


2025年5月5日北京朝阳区大洋路综合市场价格行情

GEN全胜占据LCK榜首!HLE紧随其后!T1冲进前三!_队伍_状态_排名

港股开盘丨恒生指数开盘涨017% 恒生科技指数涨016%

4月28日甬金转债下跌09%,转股溢价率9279%

民生银行:“电子信用证”福费廷秒放款 供应链金融服务再升级

债市公告精选(4月17日)金科地产公布重整计划多项进展;奥园集团累计未能清偿债务达43833亿元

财信研究评7月外贸数据:外需、基数和价格共致出口降幅扩大

4月29日丰山转债上涨282%,转股溢价率2071%

聚焦城乡融合多态 挖掘农业新质生产力 2025最美村镇评选活动启动

伊朗导弹技术新突破 改写地区军事平衡?专家分析→_卡西姆·_巴西_目标

2025年5月5日北京朝阳区大洋路综合市场价格行情
