淺談動物學習模式 (二)

上回提及到動物學習的兩個模式﹑主宰著情緒反應的其中之一-Classical Conditioning。今天我們就要來談論另一個。

另一個學習模式叫做 Operant Conditioning,有人叫做操作制約,反正也是看了中文字也不懂的就是了。簡單來說,他就是掌管著一個動物會增加或減少進行一個行為的機制。
上一篇我們談論了 Law of Effect,就是說動物進行一個行為與否會被他的後果影響。
除了維持不變外,一個行為只能增加或者減少。
凡是增加行為的,我們叫做 Reinforcement,有人叫做獎勵,有人會叫做增強,總是也是類似的意思。
Reinforcement 可以分為兩種,我用人類的例子來說明好了。
Positive Reinforcement : 就是我們說的獎勵,給你好而且你喜歡的東西。你今天讀書了,你媽媽給你 5000 元的獎金讓你去買東西。然後你去讀書的頻率就會增加了。
Negative Reinforcement : 非專業的中文講法我想不到了,就是把不好的東西拿開。舉個例,你非常害怕蟑螂,你媽媽把你關在一個全都是蟑螂的房間。然後你一讀書,媽媽就會把你解救出來。然後你讀書的頻率就會增加了,因為你為了不再受到恐嚇。
Punishment 就是懲罰,很準確的。
Positive Punishment : 就打一般的打罵什麼都算的。意思就是把你不喜歡﹑害怕﹑甚至痛苦施加於你身上,然後讓你不敢再犯。小時後經常被媽媽打的你應該知道吧。
Negative Punishment : 就是把好的東西拿走。你晚上晚了點回家,然後你媽媽就把你的 PS4 砸掉。然後你以後就不敢晚回家了。
應該很易懂吧?
一般我們說的 非壓迫訓練,就是利用 Positive Reinforcement + Negative Punishment 的方法去進行。有人問為什麼不只用 R+ 去做呢?因為當你不給予獎勵的時候,P- 就自然會出現了。 R 跟 P 是連體嬰,拆不散的。