手机浏览器扫描二维码访问
每个信使心里有两把钥匙:
?一把钥匙叫Key(K):写着“我是关于什么的钥匙?”(比如“可爱”这把钥匙上写着“毛茸茸+粉色+会卖萌”)
?一把锁叫query(q):是小红分身们的问题
?还有一把礼物叫Value(V):真正的答案内容(“小猫咪”这个词本身)
8个小红分身把自己的问题(query)拿去和每一把钥匙(Key)对一下,
越匹配就叫得越大声(Attention分数越高!)
“可爱”这把钥匙和“毛茸茸的东西?”匹配度97%!
“可爱”和“会喵喵叫的东西?”匹配度94%!
“从前”这把钥匙只匹配2%……几乎没人理他。
于是,8个分身分别收集到了“最该听谁说话”的分数表。
接着,他们冲到“礼物堆”里,只抱走分数最高的那些礼物(Value),
也就是“可爱”这个词里真正藏着的“小猫咪”信息!
8个分身抱着一堆礼物跑回来,合并成一个大礼物箱,
再交给后面真正的传声官(FeedForward层)。
传声官看完礼物箱,大喊:
“原来公主想要‘小猫咪’!我们刚才猜老巫婆错得离谱!”
现在,要把这20级伤心往回传,告诉每个词“你要为这次大哭负多少责”!
伤心开始逆着刚才的路往回跑:
先经过FeedForward门→乘上门的开关灵敏度
再回到8个分身的合并处→分成8股伤心
每股伤心又沿着Attention的路反着跑回去:
?“可爱”这个词收到超级大的伤心信号(因为Attention分数最高)它立刻把自己的权重(V、K、q)调小一点,下次别再把“老巫婆”塞给公主
?“从前”只收到一点点伤心(Attention分数几乎为0),它懒洋洋地说:“不关我事~”
就这样,伤心像水流一样,精准地流向那些“最该负责”的词和连接上。
下一次,当公主再说“从前有一个很可爱的……”
“可爱”这个词已经学乖了,它拼命把“小猫咪”举得高高的,
Attention分数直接99。99%!
模型自信满满地说:“小猫咪!”
公主咯咯笑出声,钻石糖雨哗哗下!
从此,transformer王国的信使们靠着会分身、会投票、会只给真正该负责的人背锅,
让“下一个词公主”几乎再也不哭了。
而这一整套“伤心精准传递大法”,有个很酷的名字:
自注意力机制+反向传播的链式法则(进阶版)
故事到这里,公主和她的分身信使们继续过着一天猜一亿句话的幸福生活。
化神境修士陈默,与小师妹双双陨落后,竟然重回地球的高三时代?!前世初恋,陈默不屑一顾。前世敌人,陈默一拳打爆。前世你看我不起?今世我让你望尘莫及!...
盛夏不老不死了上千年,看尽了想到想不到的各种热闹。没想到,她却也成了别人眼里的热闹,在一群不靠谱参谋的参谋下,屡战屡败,屡败屡战本闲初心不改,这本立志要写回言情了!...
这个江湖。有武夫自称天下第二一甲子。有剑仙一剑破甲两千六。有胆小的骑牛道士肩扛两道。但一样是这个江湖,可能是江湖儿郎江湖死,才初出茅庐,便淹死在江湖中。可能对一个未入江湖的稚童来说,抱住了一柄刀,便是抱住了整座江湖。而主角,一刀将江湖捅了个透!临了,喊一声小二,上酒...
心潮澎湃,无限幻想,迎风挥击千层浪,少年不败热血!...
穿越加重生,妥妥主角命?篆刻师之道,纳天地于方寸,制道纹于掌间!且看少年段玉重活一世,将会过出怎样的精彩?...
简然以为自己嫁了一个普通男人,谁料这个男人摇身一变,成了她公司的总裁大人。不仅如此,他还是亚洲首富帝国集团最神秘的继承者。人前,他是杀伐果断冷血无情的商业帝国掌舵者。人后,他是一头披着羊皮的狼,把她啃得连骨头也不剩。...