当前所在位置:首页 > 在线股票配资平台

研究:反复使用AI生成的内容来训练AI可造成“模型崩溃”

3333

2025-01-19 【 字体:

模型崩溃发生得如此迅速且难以察觉。

IT之家 9 月 5 日消息,当地时间 9 月 4 日,据《福布斯》报道,牛津大学的伊利亚・舒梅洛夫博士和他的团队发现,当生成式 AI 软件仅依赖于由 AI 生成的内容时,回答的质量开始恶化。这项研究已经发表在《自然》杂志上。

在最初的两次查询后,答案逐渐偏离准确性,到第五次时,质量显著下降,到了第九次连续查询时,回答已完全退化为无意义的胡言乱语。研究人员将这种生成式 AI 内容的循环过度使用称为“模型崩溃”,即 AI 在不断污染自己的训练集后,输出的内容逐渐偏离现实,最终变得毫无价值。

被大量信息吓得头晕目眩、表情痛苦的机器人

舒梅洛夫表示:“令人惊讶的是,模型崩溃发生得如此迅速且难以察觉。最初,它会影响到少数数据 —— 那些代表性不足的数据。接着,它会影响输出的多样性,导致差异性减少。有时,你会观察到对多数数据的微小改进,但这种改进掩盖了少数数据表现的恶化。模型崩溃可能带来严重后果。”

研究人员通过一种方法确定了“模型崩溃”现象的存在:使用一个预训练的 AI 驱动的维基百科,然后让 AI 模型基于自己生成的内容进行更新。受污染数据的影响逐渐导致原本的训练集被侵蚀,输出的信息也随之变得难以理解。例如,在第九次查询循环后,研究中的维基百科条目从关于 14 世纪英国教堂尖顶的内容滑稽地变成了一篇关于各种颜色的短尾兔子的论文。

报道称,根据亚马逊网络服务(Amazon Web Services)团队在 6 月发布的另一项研究,大约 57% 的网络文本都经过了 AI 算法的翻译。如果互联网上的人类生成数据迅速被 AI 过滤内容覆盖,且舒梅洛夫的研究发现属实,那么 AI 可能正在“自我毁灭”—— 并同时“毁灭”互联网。

研究得出结论,要实现 AI 的长期可持续发展,唯一方法是确保其能够访问现有的非 AI 生成内容,并持续引入新的人工生成内容。

阅读全文
相关推荐

GEN全胜占据LCK榜首!HLE紧随其后!T1冲进前三!_队伍_状态_排名

GEN全胜占据LCK榜首!HLE紧随其后!T1冲进前三!_队伍_状态_排名
2025LPL第二赛段正如火如荼的进行中,之前一直都是TES打出绝对的统治力,然...

港股开盘丨恒生指数开盘涨017% 恒生科技指数涨016%

港股开盘丨恒生指数开盘涨017% 恒生科技指数涨016%
  12月30日,香港恒生指数开盘涨0.17%,恒生科技指数涨0.16%。小米集...

4月28日甬金转债下跌09%,转股溢价率9279%

4月28日甬金转债下跌09%,转股溢价率9279%
本站消息,4月28日甬金转债收盘下跌0.9%,报115.93元/张,成交额165...

民生银行:“电子信用证”福费廷秒放款 供应链金融服务再升级

民生银行:“电子信用证”福费廷秒放款 供应链金融服务再升级
“自从民生银行推出‘民生E链’福费廷自动放款业务,泡杯茶的功夫供应商就收到了融资...

债市公告精选(4月17日)金科地产公布重整计划多项进展;奥园集团累计未能清偿债务达43833亿元

债市公告精选(4月17日)金科地产公布重整计划多项进展;奥园集团累计未能清偿债务达43833亿元
  【金科地产:重整计划进展及退市风险提示】   金科地产集团股份有限公司发布公...

财信研究评7月外贸数据:外需、基数和价格共致出口降幅扩大

财信研究评7月外贸数据:外需、基数和价格共致出口降幅扩大
外需、基数和价格共致出口降幅扩大2023年7月外贸数据点评全文共2481字,阅读...

4月29日丰山转债上涨282%,转股溢价率2071%

4月29日丰山转债上涨282%,转股溢价率2071%
本站消息,4月29日丰山转债收盘上涨2.82%,报124.02元/张,成交额71...

聚焦城乡融合多态 挖掘农业新质生产力 2025最美村镇评选活动启动

聚焦城乡融合多态 挖掘农业新质生产力 2025最美村镇评选活动启动
活力激荡阡陌,振兴绘就新篇。2025最美村镇评选活动如约而至,该活动由第一财经于...

伊朗导弹技术新突破 改写地区军事平衡?专家分析→_卡西姆·_巴西_目标

伊朗导弹技术新突破 改写地区军事平衡?专家分析→_卡西姆·_巴西_目标
当地时间5月4日晚,伊朗国防部公布一款名为“卡西姆·巴西尔”的新型弹道导弹。据介...

2025年5月5日北京朝阳区大洋路综合市场价格行情

2025年5月5日北京朝阳区大洋路综合市场价格行情
品种 最高价 最低价...