了解行為訓練背後的科學 –– 增強原理

彭巧蓁

增強原理被廣泛應用在人們的生活,不論是生活或是職場中皆然,甚至許多企業制定規範時也運用了增強原理的概念,增強原理可以用來解釋被訓練者的行為,更可以幫你歸納出造成這些行為背後的原因,行為產生的後果許多時候才是影響行為的主因,以下就簡單介紹增強的四個象限,讓想訓練動物的人對增強理論有更深一層的認識。

我是廣告 請繼續往下閱讀
增強的基本理論

正增強(Positive reinforcement):在對象進行某個行為之後,增加對象喜愛的刺激,使該行為出現的頻率增加。
負增強(Negative reinforcement):在對象進行某個行為之後,移除對象厭惡的刺激,使該行為出現的頻率增加。
正處罰(Positive punishment):在對象進行某個行為後,增加對象厭惡的刺激,使該行為出現的頻率減少。
負處罰(Negative punishment):在對象進行某個行為後,減少對象喜愛的刺激,使該行為的出現頻率減少。

在增強理論中,正負跟增強處罰代表的不是好與壞也不是對與錯

正(Positive):代表的是提供、給予、增加

負(Negativ):代表的是移除

增強(reinforcement):使這一行為在未來發生的頻率上升

處罰(punishment):使這一行為在未來發生的頻率降低

以下舉幾個實際例子

正增強:當狗狗上廁所在正確的位置,給予一塊零食獎勵,使上對地方出現的頻率增加

負增強:上車後沒繫上安全帶,車子發出惱人的聲音提醒直到繫上安全帶後聲音消失,久了人為了不想被那噪音干擾,一上車便乖乖的繫上安全帶。(同時用了正處罰&負增強)

正處罰:當狗狗嘗試進到廚房,卻意外撞倒一堆瓶罐發出一大堆嚇人的聲音,從此狗狗比較不願意進去廚房了,為了避免那嚇人的聲音再次出現。

負處罰:如果員工上班遲到,將會被扣全勤獎金,所以員工盡可能的減少他們遲到的頻率。

通常在訓練的時候能夠並用的是「正增強&負處罰」,「負增強&正處罰」
例子1:
你希望狗狗坐下,卻怎麼喊坐下狗狗就是不肯坐,於是你開始不斷的扯動牽繩(正處罰),當他被拉扯到受不了的時候便坐下,你停止了拉扯(負增強)。

站著的行為受到「正處罰」,而坐下的行為受到「負增強」。

例子2:

當狗狗不願意吃飯時,移除所有對狗狗的關注(對挑食行為負處罰)把他當成空氣,當狗狗願意吃飯時給予關注並大力稱讚

挑食的行為受到「負處罰」,而吃飯的行為受到「正增強」

這些都是使用增強原理訓練之所以會成功背後的理論基礎,那為什麼不能夠用「正增強&正處罰」or「負增強&負處罰」這兩種組合呢?

我曾經看過一名飼主想要訓練家裡狗狗不要對路人吠叫,他帶著狗狗跟零食到公園,當有人經過狗狗開始吠叫時,主人便使勁的拉扯p字鍊,當刺激物離開卻又拿食物獎勵狗狗。

對有人經過時給予「正處罰」,人離開時給予「正增強」

怎麼看都像是在訓練狗狗對人吠叫得更厲害,而非行為矯正。

曾經在「別斃了那隻狗」一書中讀過一則很有趣的故事,在美國有些地區會飼養駱馬當作寵物,也有些地區當成是毛料的來源之一,雖然用食物訓練他們非常有效,但駱馬和馬一樣生性非常膽小(除非從小接觸人類),要能取得駱馬信任能讓人類靠近不是件簡單的差事,駱馬訓練師的作法是用響片告訴駱馬,接下來"不動"的行為將會受到增強,而增強物就是移除厭惡刺激(負增強原理),實際做法是這樣:

當訓練師靠近駱馬2公尺=>駱馬保持不動=>壓下響片=>人類離開

當訓練師靠近駱馬1.5公尺=>駱馬保持不動=>壓下響片=>人類離開

當訓練師靠近駱馬1公尺=>駱馬保持不動=>壓下響片=>人類離開

當訓練師靠近駱馬0.5公尺=>駱馬保持不動=>壓下響片=>人類離開

(圖片來源:Liné1-Picture taken   https://commons.wikimedia.org/w/index.php?curid=2072146)

整個訓練的主導權掌握在駱馬手上,他只要持續保持不動,就能讓令人害怕的人類離開,當駱馬能夠忍受人類在旁邊時,這時候正增強物(食物)就可以派上用場了,利用離開(解除壓力)來當成增強物,是Horse whisperer(馬語者)常用的技巧。

增強原理也常被使用在兩性關係中,當男性主動幫忙洗碗的時候,女性不妨大力稱讚一下,慢慢的你會發現男性願意幫忙洗碗的頻率越來越高了,懂得這些基本的訓練原理,在訓練任何動物時都可以事半功倍哦!

圖片來源:shutterstock.com、wikipedia( Liné1-Picture taken )

我是廣告 請繼續往下閱讀
鞋槓人生