再计算每个候选人的支持度占比:
这样,每个人最终的选择概率就会落在
到
之间,并且所有候选人的概率加起来是
(保证了最终一定会选出一位村长)。
比喻解释:冰淇淋店的选择
假设你走进了一家冰淇淋店,店里有四种口味:
?
巧克力(你最爱)
?
香草(你觉得还行)
?
草莓(一般般)
?
抹茶(你不太喜欢)
如果你只是随意选,你可能会纠结,但softmax
规则就像是在你的大脑里装了一个“选择助理”,它根据你对每个口味的喜爱程度(打分),帮你转换成最终的选择概率。例如:
?
你对巧克力的喜爱度是9分,香草7分,草莓5分,抹茶2分。
?
softmax
把这些分数转化成指数值,然后归一化成概率:
结果就是,你有最高的概率选择巧克力,较低的概率选择香草,几乎不会选抹茶。
总结
softmax
函数的本质是:
1。
将原始分数(打分)转换成概率,使得总和为
1。
2。
指数放大优势,让分数高的选项更有可能被选中。
3。