研究:反复使用AI生成的内容来训练AI可造成“模型崩溃”
2025-01-19 【 字体:大 中 小 】

模型崩溃发生得如此迅速且难以察觉。
IT之家 9 月 5 日消息,当地时间 9 月 4 日,据《福布斯》报道,牛津大学的伊利亚・舒梅洛夫博士和他的团队发现,当生成式 AI 软件仅依赖于由 AI 生成的内容时,回答的质量开始恶化。这项研究已经发表在《自然》杂志上。
在最初的两次查询后,答案逐渐偏离准确性,到第五次时,质量显著下降,到了第九次连续查询时,回答已完全退化为无意义的胡言乱语。研究人员将这种生成式 AI 内容的循环过度使用称为“模型崩溃”,即 AI 在不断污染自己的训练集后,输出的内容逐渐偏离现实,最终变得毫无价值。

舒梅洛夫表示:“令人惊讶的是,模型崩溃发生得如此迅速且难以察觉。最初,它会影响到少数数据 —— 那些代表性不足的数据。接着,它会影响输出的多样性,导致差异性减少。有时,你会观察到对多数数据的微小改进,但这种改进掩盖了少数数据表现的恶化。模型崩溃可能带来严重后果。”
研究人员通过一种方法确定了“模型崩溃”现象的存在:使用一个预训练的 AI 驱动的维基百科,然后让 AI 模型基于自己生成的内容进行更新。受污染数据的影响逐渐导致原本的训练集被侵蚀,输出的信息也随之变得难以理解。例如,在第九次查询循环后,研究中的维基百科条目从关于 14 世纪英国教堂尖顶的内容滑稽地变成了一篇关于各种颜色的短尾兔子的论文。
报道称,根据亚马逊网络服务(Amazon Web Services)团队在 6 月发布的另一项研究,大约 57% 的网络文本都经过了 AI 算法的翻译。如果互联网上的人类生成数据迅速被 AI 过滤内容覆盖,且舒梅洛夫的研究发现属实,那么 AI 可能正在“自我毁灭”—— 并同时“毁灭”互联网。
研究得出结论,要实现 AI 的长期可持续发展,唯一方法是确保其能够访问现有的非 AI 生成内容,并持续引入新的人工生成内容。
猜你喜欢
沪指收跌056% 医药股集体下挫
486
发力储能赛道,天能股份回购合资公司股权
9428
魏琪嘉:双轮驱动构建现代化产业体系
9548
南都书单:奥运会主题书单
9428
捷捷微电(300623):3月12日北向资金减持5603万股
5774
南京六合自驾游景区推荐什么
306
关于股票的软件有哪些:你的投资利器指南
7142
铜:维持偏弱震荡
5447
去东北菜馆就点这4道菜,吃着过瘾做着难,老板一看就知是内行
3017
日经股指暴跌超2200点,创历史第二大跌幅
9021
当残障人士与健全人的处境倒置,未来世界会发生什么?
阳光财险持续推进绿色保险 助力“双碳”战略转型发展
加拿大总理卡尼:将“永远不会”屈服于美国的威胁
人气爆棚!“五一”旅游市场“多点开花”
期指主力持仓有所下滑
中国石油申请基于常规测井资料构建孔隙结构综合参数专利, 实现储层孔隙结构有效评价
时尚情报高端酒店拓展日本市场,奢侈品牌巴利被收购
青荷0d3O:🌟【炒股黑科技!手把手教你用DeepSeek智能盯盘】🌟还在手动盯盘累到眼花?三步教你用AI炒股!第一步,准备工作。电脑装上Python38以上版本,打开命令提示符,输入`p
为民营企业提供更有力的资本市场支持
债券投资机构“辽宁行”活动启动 搭建债券投融资交流平台
当残障人士与健全人的处境倒置,未来世界会发生什么?

阳光财险持续推进绿色保险 助力“双碳”战略转型发展

加拿大总理卡尼:将“永远不会”屈服于美国的威胁

人气爆棚!“五一”旅游市场“多点开花”

期指主力持仓有所下滑

中国石油申请基于常规测井资料构建孔隙结构综合参数专利, 实现储层孔隙结构有效评价

时尚情报高端酒店拓展日本市场,奢侈品牌巴利被收购

青荷0d3O:🌟【炒股黑科技!手把手教你用DeepSeek智能盯盘】🌟还在手动盯盘累到眼花?三步教你用AI炒股!第一步,准备工作。电脑装上Python38以上版本,打开命令提示符,输入`p

为民营企业提供更有力的资本市场支持

债券投资机构“辽宁行”活动启动 搭建债券投融资交流平台

