Machine learning就是训练电脑能学会做出正确的选择,而使用的方法就是对正确的例子给出高分(也就是奖励),对不正确的例子给出低分(也就是惩罚)。这和教育孩子的方法几乎一样。
父母教育孩子的方法之所以效果不好,常常就是因为奖励和惩罚的函数没有搞对。所谓有教无类,每个孩子都不一样,所以奖励和惩罚的函数也要因而不同。这里说的奖励和惩罚,不是特指物质上的奖励,身体上的惩罚,是广义上的,奖励就是能让孩子感觉到他(她)那样做就会获得爱和快乐的行为,惩罚就是能让孩子感觉到他(她)那样做就会失去爱和快乐的行为。注意,这是以孩子的内心感受,不是以父母的感受为准。常常是父母自以为的奖励不是奖励,自以为的惩罚不是惩罚,或者父母并不在意的行为就对孩子形成了奖励和惩罚的行为。
让孩子感觉到他(她)无论干什么父母都爱他(她),做了错事也是最多口头上象征的说一下,不痛不痒,就是没有设置好惩罚函数,结果就是溺爱。孩子就学不会正确的行为准则,只会万事以自己为中心,没有包容心和同情心。
另一个极端就是,让孩子感觉到一做错就受到严厉的惩罚,但感觉不到父母太多的爱。也许父母工作很忙,还有其他的孩子要照顾,所以希望每个孩子都听话,但没时间倾听孩子的内心世界。中国的父母在孩子大了一些以后,似乎就没有习惯给孩子拥抱,亲吻,和孩子一起聊天,嬉戏了。经常是父母自己觉得好爱孩子,但孩子感觉不到。这就是没有设置奖励函数,结果就是孩子看不到希望,产生了逆反心理。惩罚最要注意的就是让孩子相信爸爸妈妈还爱他(她),只是对他(她)的某个行为的不认同,这点非常重要。
最糟糕的教育就是小时候溺爱,但大了一些之后,发现不好管了,就转向了严厉惩罚但缺乏爱的另一个极端,这样教育出来的孩子常常性格上有严重的缺陷。父母要能有责任的意识到,孩子小时候性格上的问题是父母自己的问题,是双方的共同的责任,不只是某一个人的任务,更不是老师的,爷爷奶奶的,姥姥姥爷的责任。