我真的有一座法师塔最新章节_第307章模型崩溃4506第3页_我真的有一座法师塔全文免费阅读

书书小说网>我真的有一座法师塔手机版加入书架章节目录小说详情

手机浏览器扫描二维码访问

第307章模型崩溃4506（第3页）

杨子龙和杜长庚所发现的问题，粗看上去确实有点诡异，相同的数据，被AI处理过一遍，再用来训练另一个AI，效果居然比不上质量更差的人工清洗的数据。

而再用这个训练后的AI生成的数据继续训练AI，无论是训练哪个AI，又会造成性能进一步下降。

这个问题看上去诡异，但实际上，只要稍稍思考一下也就能明白，应该还是数据多样性和复杂性不断被AI简化所造成的问题。

不用说橘子大模型，即使是柚子，生成的数据也不可能是百分之百完全正确的，虽然这些错误可能比人工数据要少，但错误的方式却缺乏多样性和复杂性。

说白了，就是AI聪明的千篇一律，但人类却愚蠢的千奇百怪。

但在种族传承的角度上来说，愚蠢的千奇百怪的人类，却比自己创造出比人类更聪明的AI具备更强的种族传承能力。

窝草？这么一想，孟广康那种傻x，对人类文明的传承贡献还不小？

差点把我的厌蠢症都治好了？

重复使用这种数据进行训练，类似的错误会被大模型认为是真实，从而变成“思想钢印”

，继续产出错误更多的内容。

再用这些内容进行训练，就会产生“偏差-方差权衡”

，也就是说，越大概率的内容被进一步强化，小概率的内容被不断忽视。

越是下一代模型，损失的数据反而会越多。

同时，因为大模型的特性，又会产生“函数近似误差”

，大模型会把学的错误的东西也保留下来，一代代的积累，最终变成全部都是错误，从而丧失纠错能力。

这种情况，确实和近亲繁殖所导致的近交衰退非常类似。

从这个角度上看，AI大模型其实已经具备了一定的生物性。

只不过这种生物种群过于单一，造成了近亲繁殖。

这个问题目前还不算太紧迫，毕竟互联网上可以使用的原始数据非常多，无非就是加大数据组的投入，获取更多的原始数据，增加数据预处理人手和方式就能够解决。

但从长远来看，不，不用太长远，AI的爆发一定是指数级的。

可能两到三年后，互联网上可能超过百分之七十的数据就都是AI所生成的，而人类几乎无法区分这究竟是AI生成的数据还是真实的人工数据。

那时候，AI大模型不管参数有多庞大，可能都会面临由于训练数据被AI生成数据污染，而造成性能下降或崩溃。

“三十万亿。”

方豫快速的估算出了一个数字。

？？？

几个组长都是一脸问号。

“互联网上现存的有效数据，大概能支撑橘子大模型到三十万亿参数的规模，在此之后，就必然会受到近亲繁殖的影响。”

方豫指了指显示器上的数据。

三十万亿，还好还好，现在目前正在训练的橘子大模型不过一万五千亿参数，已经开始初步具备强人工智能的雏形。

三十万亿的大模型，肯定已经实现超级人工智能，那时候，AI生成数据多样性的问题应该已经能找出解决方案了。

那就没什么问题了。

几个组长都松了一口气。

没什么问题了吗？

方豫目光闪动。

就算是橘子大模型实现超级人工智能，只要多样性问题不解决，一样也会有这个问题。

即使使用各种技术手段尽量提升AI数据的复杂性，最后不会造成模型崩溃，这个大模型也注定无法承载自己的愿景。

热门小说推荐

万古天帝

人族少年叶寒，身怀神秘功法天帝诀，入大世界中，与群雄争霸，观万族并起！天地苍茫，今朝我主沉浮！小说关键词万古天帝无弹窗万古天帝txt全集下载万古天帝最新章节阅读...

闪婚厚爱：误嫁天价老公

简然以为自己嫁了一个普通男人，谁料这个男人摇身一变，成了她公司的总裁大人。不仅如此，他还是亚洲首富帝国集团最神秘的继承者。人前，他是杀伐果断冷血无情的商业帝国掌舵者。人后，他是一头披着羊皮的狼，把她啃得连骨头也不剩。...

万古第一神

李天命做梦都要笑醒了。他家的宠物，竟然都是传说中的太古混沌巨兽！他的家鸡，是以太阳为食的‘永恒炼狱凤凰’。他的黑猫，是以雷霆炼化万界的‘太初混沌雷魔’。连他家的小强，都是拥有万亿不死分身的‘万界永生兽’从此，他驾驭十头太古混沌巨兽，化身万古第一混沌神灵，周游诸天万界，踏平无尽神域。万物生灵，诸天神魔，连爬带滚，...

财运天降

陆原语录作为一个超级富二代装穷是一种什么体验？别拦着我，没有人比我更有资格回答这个问题！...

雪中悍刀行

这个江湖。有武夫自称天下第二一甲子。有剑仙一剑破甲两千六。有胆小的骑牛道士肩扛两道。但一样是这个江湖，可能是江湖儿郎江湖死，才初出茅庐，便淹死在江湖中。可能对一个未入江湖的稚童来说，抱住了一柄刀，便是抱住了整座江湖。而主角，一刀将江湖捅了个透！临了，喊一声小二，上酒...

龙王殿

化神境修士陈默，与小师妹双双陨落后，竟然重回地球的高三时代？！前世初恋，陈默不屑一顾。前世敌人，陈默一拳打爆。前世你看我不起？今世我让你望尘莫及！...

书书小说网