響片訓練理論篇(I)操作性制約

2021-01-21 訓狗網


響片訓練(Clicker Training)理論篇


I.操作性制約(Operant Conditioning)


現在提到訓狗,無論是職業訓練師,或者是訓練愛好者,甚至一些狗主人越來越多都會說道一個詞:操作性制約(Operant Conditioning,簡稱OC)。那麼究竟什麼是操作性制約?它的原理是什麼?它又是從何而來的呢?


讓我們先來解釋幾個名詞:


行為:狗狗做的一些動作,如坐、跳、松繩牽引散步等等


強化:給予或移除一個可以增加某個行為發生頻率的刺激因素。


懲罰:給予或移除一個可以減少某個行為發生頻率的刺激因素。


強化物:某種獎勵的學名。


排斥物:通常用來指一些讓狗狗反感而儘可能想避免的東西。


一、OC及四個象限OC是一種學習理論,主要遵循的是「桑代克的效果律(Thorndike's law of effect)」。所謂效果律指的是得到強化的行為就越可能發生;得不到強化的行為就越不可能發生。(譯者註:聽起來好像還蠻簡單的嘛!)


後來有個叫B.F. Skinner的人將就桑代克的效果律發揚光大,還造了一個詞叫OC,即操作性制約,專門用來指這種動物學習理論。從廣義上來說,Skinner把改變行為的方法分為四種:正強化、負強化、正懲罰和負懲罰,也稱為OC的四個象限。


1、正強化(給予強化物):當動物發生某種行為後,通過給予某個刺激因素能使動物感到滿意、愉快或興奮,從而使這種行為得到鼓勵(增加發生頻率)的方法。例如,當狗坐下後餵食物給它,或是當兒子拿到獎學金時,你告訴他你為他感到自豪。


2、負強化(移除排斥物):當動物發生某種行為後,通過給予或者威脅給予之後又馬上移除某個刺激因素能使動物感到滿意、愉快或興奮,從而使這種行為得到鼓勵(增加發生頻率)的方法。例如小孩為了不挨罵而打掃房間;給狗狗帶止吠項圈,如果狗狗叫就會被電擊。為了避免這種不舒服的感覺,狗狗就會不叫了。


3、正懲罰(給予排斥物):當動物發生某種行為的時候或之後,通過給予某個刺激因素能使動物感到反感、痛苦或悲傷,從而使這種行為得到抑制或弱化(減少發生頻率)的方法。例如小孩淘氣時狠狠打一頓;當狗狗看到你回家便興奮地撲上來時,你用膝蓋頂它的胸口之類。


4、負懲罰(移除強化物):當動物發生某種行為後,通過移除某個刺激因素能使動物感到反感、痛苦或悲傷,從而使這種行為得到抑制或弱化(減少發生頻率)的方法。例如小孩又哭又鬧的時候,就拿走他的冰淇淋;同樣當狗狗看到你回家便興奮地撲上來,希望引起你的注意時,你轉過身背對著它,不理睬它或者乾脆就離開房間。


二、強化與懲罰


以上四種方法可以組合使用,從而得到、養成或者改掉某種行為。例如,你可以同時使用正強化和負懲罰的方法來訓練狗狗隨行:當狗狗乖乖地跟在身邊隨行時,你可以用食物來獎勵它。當狗狗想拽著你前進時,你就馬上站住不動,拉緊牽引繩讓它不能前進(這正是它想要的)。等它乖乖地不亂跑了,你再繼續前進。


你可以發現,有些方法是比較溫和的,人道的,但有些方法對動物來說就比較殘忍,痛苦一些。事實上,懲罰,尤其是正懲罰,有著非常嚴重缺陷,有時甚至會帶來一些極端的訓練後遺症。因為要先給予或威脅給予排斥物,負強化才能發揮作用,因此也不算是個好的選擇。


除了以上四種操作性制約的象限之外,Skinner還提出一個消弱理論,指的是如果某種行為得不到任何強化,那麼就算是之前已經形成了條件反射,這種行為也會逐漸消失或改變。例如,我們去別人家拜訪,敲了半天的門也沒有人來開門。結果我們最終就會放棄敲門這個行為。如果狗狗無論如何努力也無法打開罐子拿到裡面的餅乾的話,它最後也會放棄嘗試。


我們可以將消弱理論和四個象限結合起來使用,例如,當狗狗亂叫的時候,你不去理它(——消弱);當它不叫了,你就獎勵食物(——正強化)。


但是,當你想要針對的是一種可以自我獎勵的行為時,單靠消弱的方法就不行了。例如狗狗亂咬鞋子的行為。雖然你可以用消弱的方法,對狗狗的行為不予理睬,視而不見,但是由於咬鞋子本身對狗狗來說就是一種獎勵,因此僅僅用消弱的方法是不足以改變狗狗這種行為的。


三、強化物


從上面我們所說的操作性制約可以知道,強化物扮演著非常重要的角色。其實我們每個人每天都在為了強化物而工作。就像我寫這篇文章,部分的原因也是為了可以得到強化物——愛狗人士的回應。在這點上,狗狗和人是一樣的。


強化物也分為兩種:


本能型強化物:動物天生就覺得有獎勵作用的強化物,不需要後天的學習就能起到強化作用。例如,食物、水、性、捕獵等等。


反射型強化物:本身不具備強化作用,但因常常伴隨本能型強化物而出現,久而久之,經過動物多次學習之後,也可以起到和本能型強化物一樣的作用的強化物。


對人而言,金錢就是一種反射型強化物。錢本身不過是一張紙,最開始的時候並不具備強化功能。但是,當錢和一些本能型強化物,如食物、衣服、房子等等,聯繫起來以後,它就變成了反射型強化物。


對狗狗來說,諸如「乖」、「真聽話/可愛」之類的表揚、讚美如果可以經常伴隨著食物同時出現的話,也可以慢慢成為反射型強化物。在響片訓練中,響片其實也是一個反射型強化物,因為它經常伴隨本能型強化物一起出現,慢慢的響片發出的「咔嗒」聲對狗狗來說就是意味著食物即將出現。


關於強化物最關鍵的一點就是:應該是由動物,而不是訓練師或主人,決定哪些是強化物。一些狗狗只對某幾種特別的食物有反應,有些卻更喜歡玩棒球。訓練師的工作就是找出那些適合狗狗的強化物,繼而利用它來為我們服務。


另外,無論是本能型強化物還是反射型強化物,它們對狗狗產生的效果是不同的。哪怕是屬於同一類的強化物的效果也是不同的。例如有些狗狗喜歡雞肉多過牛肉,有些狗狗喜歡玩具多過食物,有些則相反。因此我們如果可以將所有對自己的狗狗有強化效果的東西列一個清單,並且按照效果強弱進行排序,哪個的強化效果最強,哪個其次,哪個再弱一點,依此類推。然後根據訓練的難易程度,使用不同的強化物刺激狗狗以達到我們的目的。舉例來說,對大多數狗狗來說,餅乾是弱效果的強化物,而雞肉是強效果的強化物。當我們在家裡訓練時,就可以使用餅乾作為強化物。因為在家這個環境裡,餅乾的強化效果已經足夠了。可是如果換到室外進行訓練,由於環境變得更複雜,讓狗狗精力分散的因素比較多,這時我們就可以考慮用效果更強的雞肉來作為強化物以達到讓狗狗專心訓練的目的。同樣,如果讓狗狗在家裡一聽到呼喚就馬上跑過來,可能只要一塊雞肉就夠了。可是如果要到了公園裡,我們想要達到同樣的目的,可能就需要一大塊的雞胸肉了。


四、操作性制約和響片訓練的關係


估計能耐心看到這裡的人應該不多吧。可能已經有人忍不住要問:你之前講了這麼多,到底和響片訓練有什麼關係呢?其實,如果把OC比作一個集合的話,響片訓練就像是它的一個子集。OC就是響片訓練的理論基礎。還記得我們之前說過,響片只不過是一個反射型強化物。只有當我們深入了解了OC,了解它是如何運作以及為什麼運作時,我們才能成為一名更出色的訓練師。


OC理論是以我們上面提到的5個原理作為基礎。每個原理都可以作為改變行為的方法。而響片訓練並不是利用到所有的這5個原理。不管你相不相信,到現在為止,響片訓練還沒有一個準確的、官方的定義。你可能從這個人聽到的關於響片訓練的解釋和從另外一個人那聽來的完全不同。但是,作為當代響片訓練的最積極的倡導者Karen Pryor,將響片訓練定義為通過正強化、消弱和極少的負懲罰培養以及完善(動物)行為的方法。具體來說,在響片訓練中,我們使用正強化來訓練動物做出我們想要的行為,而使用消弱和(極少的情況下)負懲罰來減少或最終改掉動物身上我們所不想要的行為。


為了形象說明OC的5個原理和響片訓練的關係,我們可以把響片訓練看作是一個餅狀圖,那么正強化佔了其中三分之二的份額,其次是消弱,再次是負懲罰,而正懲罰和負強化僅僅是非常小的一部分。一個理想的、完整的、可靠的訓練計劃應該完全由正強化、消弱和極少的負懲罰組成(如下圖)。


我們為什麼要花這麼多時間和精力來分析這些理論性的東西呢?有兩個原因:


1、這樣我們不至於混淆基本的概念。例如,在日常生活中,「正」和「負」通常用來指好和壞。但是在OC和響片訓練中,「正」指的是給予,「負」指的是移除。同樣的,「懲罰」在我們日常生活中常常和一些不好的東西聯繫在一起,但是在OC中,懲罰只不過用來指抑制或弱化(減少發生頻率)某些行為。


2、如果只是知其然而不知其所以然,那麼響片訓練將只不過是提供一些訓練方法,而這些方法有些可能對你的狗狗有效,有些則無效。為什麼會這樣呢?因為如果我們不明白隱含在響片訓練中的這些行為原理,那麼我們就不能對訓練環境進行有效評估,然後搞清楚為什麼這個方法有效或者,更重要的是,為什麼會無效,進而根據每隻狗狗的個性特點進行因材施教。


作為一名響片訓練者,我們是不主張在訓練中使用負強化和正懲罰的,儘管有的時候這兩種方法看起來很有效。這是因為這兩種方法存在一些很嚴重的問題:


1、很難正確使用;


2、有負作用,如讓受訓者產生恐懼心理和攻擊性;


3、推廣很容易,但分寸卻很難把握;


4、主要依賴於恐懼、痛苦或威脅;


5、會阻礙動物主動學習行為的能動性。


而最後一點,也就是會阻礙動物學習的主觀能動性,是正懲罰和負強化與響片訓練最格格不入的地方。響片訓練可以訓練出一些在通常情況下幾乎是不可思議的動作,而這些動作除了需要訓練師精心安排訓練計劃之外,在更大程度上需要靠動物自己不斷去摸索、去嘗試、去試探,有時候是正確的,有時候是錯誤的,有時候成功,但有時候也會失敗。如果因為一些努力嘗試卻失敗而受到懲罰的話,狗狗以後還會心甘情願地去嘗試新的東西嗎?


對於很多剛剛了解響片訓練的新手而言,當他們一聽說訓練時要放棄使用正懲罰和負強化的方法時就裹足不前了。他們的心裡會產生諸多懷疑和擔心。這是因為他們先入為主的認為,如果缺少了排斥物,訓練就不能達到預期的目的。事實上,到目前為止還沒有一項研究表明正懲罰(強化)就一定比負懲罰(強化)有效。也就是說,理論上,這四種方法都是有效的。雖然結果表面上看起來相同,但過程和意義卻大相逕庭。關於這一問題,我會在下一節中詳細說明。


訓練,醫療諮詢請掃描添加訓犬網

長按微信號xunquanwang複製搜索添加

點擊右上角「┇」可分享到朋友圈。

想看更多相關問題請點左下角↙閱讀原文。


相關焦點

  • 響片訓練是什麼?泰迪犬如何進行響片訓練?
    大家都知道,養了泰迪犬肯定避免不要進行各種訓練的,關於一些基礎的坐下、別動、握手等訓練可能了解的比較多,若是說到深層一些的估計就沒什麼概念了,比如說響片訓練,知道的有多少呢?響片訓練最初是在用不適合傳統服從訓練的動物身上的,比如海豚和鴿子,後來響片訓練在動物中擴大了適用範圍,包括狗、馬、羊等。平時我們在訓練泰迪犬的時候首先要學會和泰迪犬狗頭,要花費很多的時間去讓泰迪犬理解你要想訓練什麼、怎麼做是對的、口令是什麼、鼓勵的語言是什麼,這讓訓練話費了很多時間,但狗狗理解程度卻很低。
  • 狗狗訓練大法——響片訓練
    對於訓練狗狗這個話題大家都不陌生,但是說起響片訓練是不是就不了解了?響片訓練最初是用在不適合傳統服從訓練的動物身上的,比如海豚和鴿子,後來響片訓練在動物訓練中擴大了使用範圍,包括狗、馬、羊等。平時我們在訓練狗狗的時候要首先學會和狗狗溝通,要花費很多的時間去讓狗狗理解你想要訓練什麼、怎麼做是對的、口令是什麼、鼓勵的語言是什麼,這讓訓練花費了很多時間,但狗狗的理解程度卻很低。甚至訓練者的指令、獎勵的發音、音量、語調的不同都會使訓練速度減慢。但是響片訓練很好的規避了這個問題,我們可以用口哨、響板等能夠發出固定聲音的東西代替聲音,對於耳聾的狗狗可以用震動項圈來代替。
  • 斯金納的操作性條件作用理論
    此部分知識為教育心理學中一般學習理論的內容,屬於教招考試的重點也是易錯點。通常以單多判為主,主要是例子反選,偶爾會出現在簡答題中。難度適中,需要考生結合實驗加以理解,並學會舉一反三。斯金納認為,人和動物的行為有兩種:應答性行為和操作性行為。應答性行為是由特定刺激所引起的,是經典條件作用的研究對象。而操作性行為則不與任何特定刺激相聯繫,是有機體自發作出的隨意反應,是操作性條件作用的研究對象。操作性行為主要受強化規律的制約。二者的區別在於應答性行為是先有刺激再有行為,操作性行為是先有行為再有刺激。
  • 馬犬訓練技巧大揭秘---響片
    響片訓練是與你家寵物溝通的科學新方法,比下令式的標準訓練法簡單,你可以響片訓練任何動物,無論年紀,馬犬幼犬很愛響片訓練,老狗學會新把戲,你也可以響片訓練貓咪、鳥類和其他寵物,以下是一些簡單的入門步驟:>把響片按下再放開會發出嘎達聲,然後給賞。
  • 響片訓練的原理
    在文章右上角點按鈕「┇」可分享到您朋友圈響片訓練原理你可能在網上看過很多版本的響片原理,到底什麼才叫響片訓練,訓寵網給你一個很簡單的比喻,你的狗狗就是一家餐館,狗狗的動作就是菜單上的菜式,狗有很多動作,你看到的菜單上也有很多的菜式,挑選你喜歡的菜式(狗狗的動作),只有餐館做出了你喜歡的菜式,
  • 什麼是響片訓練法以及運用響片訓練法需要什麼?一起來看看吧!
    一起來了解一下,什麼是響片訓練法?響片訓練法是國際新興的一種訓練方法,著名心理學家史金納是最早想到將響片 運用到動物訓練中的人,之後他的助手Karen pryor著手研究了這一課題,直到1992 年一場科學家和訓練師的研討會後,這種訓練方法才被正式推廣應用,並掀起了一陳 強烈的響片訓練法狂潮。現在,此法已經普遍應用於狗、海豚、魚、馬、鳥、烏龜、 大象等動物的訓練中。
  • 經典性條件反射與操作性條件反射理論的異同
    大部分考生在複習教育心理學學習理論一章時,會感到這一章人物多、理論多,尤其在行為主義這一部分,涉及的心理學家都做了很多相關的理論,大家會感到理解起來不太容易也會出現混淆。今天中公教育李筱琛老師就跟大家探討一下行為主義的兩個理論——經典性條件反射理論與操作性條件反射理論的異同,避免考生們在複習時出現混淆。
  • 響片訓練狗的好處有哪些?
    在沒有響片之前,當狗狗做出錯誤的行為時,主人只能通過責罵或者拉扯項圈來懲罰狗狗,狗狗如果經常受到懲罰,就容易扼殺狗狗的積極性和探索欲,雖然懲罰的方式可以讓狗狗有著較高的服從性,但狗狗卻失去了活力,目前工作犬、護衛犬的訓練依然還是採用「懲罰法」來進行的,但對於家養犬,對狗子的要求並不高,完全可以採用「響片法」來訓練狗狗。
  • 響片訓練是怎麼回事
    響片訓練是美國海豚訓練師Karen Pryor女士力推的犬只訓練方式,在國外興盛達十年之久。今日除了寵物家犬訓練之外,也應用於警犬、導盲犬、殘障人士輔助犬及搜救犬訓練,且造就許多狗秀、敏捷競賽、服從競賽等冠軍犬,對於家犬問題行為解決也成效斐然。響片訓練的世界沒有處罰,也不需要處罰,帶給飼主與狗狗全新的愉快相處模式,增加狗狗對飼主及這個世 界的信任感。
  • 響片訓練法在各種訓練中的具體應用有哪些?一起來看看吧!
    響片訓練除了可以改正許多不良行為外還可以用在很多的訓練中,如:定點排洩、捜尋、追蹤、握手、鞠躬、起立、拜託、翻滾、裝死、關門、開燈、拾回等,下面舉例介紹一下響片在各種訓練中的應用。用響片訓練法訓練籠物犬等待,訓練目標:運用響片讓寵物犬學會等待。訓練器具:響片、食物。訓練步驟:①選擇一個安靜的環境,讓寵物犬坐下,主人向後退一步,按下 響片,給予食物獎勵。
  • 響片訓練吧!
    響片訓練吧! (Got Puppy Nipping?Take the Clicker Approach )原文出處:http://www.clickertraining.com/node/168作者:凱倫.布萊爾博士(Karen Pryor),推廣響片訓練的第一人譯者:黃薇菁(Vicki)譯文出處:動物的事奇摩部落格  幼犬都喜歡玩耍摔角、輕咬對方,當牠們和人類的共同生活時,牠們同樣想這麼做
  • 響片訓練時候常犯的五個錯誤
    響片訓練時常犯的5個錯誤(5 Mistakes People Make When Clicker
  • 比較操作性條件反射與經典性條件反射
    比較操作性條件反射與經典性條件反射這部分內容分別了解操作性條件反射的特點與經典條件反射的特點並且掌握它們之間的區別和聯繫,對於我們的做題有很大幫助「經典條件反射」和「操作性條件反射」這兩個學習理論在《教育心理學》中處於非常重要的地位,在歷年教師資格證和教師招聘考試中也是一個。
  • 操作性條件反射
    各位考生,今天為大家分享的內容是心理學中很容易疑惑的知識點:操作性條件反射的理論內容。這章學習完後會覺得很亂,人物一堆。怎樣來解決這個問題?推薦兩個方法:(1)畫出思維導圖:思維導圖是指畫出根目錄下的子目錄,這個方法對學習知識一目了然。
  • 操作性條件反射與經典性條件反射的區別與聯繫
    操作性條件反射與經典性條件反射分別了解操作性條件反射的特點與經典條件反射的特點並且掌握它們之間的區別和聯繫,對於我們的做題有很大幫助「經典條件反射」和「操作性條件反射」這兩個學習理論在《教育心理學》中處於非常重要的地位,在歷年教師資格證和教師招聘考試中也是一個。而很多考生在備考過程中,總覺得這兩個理論比較難理解,也不太好區分清楚。
  • 大家知道響片訓練法是怎樣的嗎?一起來看看吧!
    響片訓練是指用一個固定的 聲音作為給予獎賞的信號,是職業需要用到的東西下面列出一些基本器械在馴貓時 是很有用的:用做獎勵的食物 ,湯匙響片能發出其他特殊聲音的東西 ,胸背帶和牽引帶 貓籠 小玩具,裝有涼水的噴霧器 ,和被動懲戒有關的其他訓導器。馴獸師常用的方法之一,因為不涉 及懲罰,所以對貓很有效。每次貓 正確地做出規定動作後,即按-下響片,發出「咔嗒」的聲音,告訴 它做得對。
  • 斯金納的強化理論
    斯金納的強化理論斯金納根據「迷箱實驗」,提出了操作性條件作用理論。他認為,人和動物的行為有兩種:應答性行為和操作性行為。應答性行為是由特定刺激所引起的,是經典條件作用的研究對象。而操作性行為則不與任何特定刺激相聯繫,是有機體自發作出的隨意反應,是操作性條件作用的研究對象。操作性行為主要受強化規律的制約。
  • 經典條件反射與操作性條件反射的異同
    另一種條件反射叫操作性條件反射.美國心理學家斯金納把一隻餓鼠放入實驗箱內.當它偶然踩在槓桿上時.即餵食以強化這一動作.經多次重複.鼠即會自動踩槓桿而得食.在此基礎上還可以進一步訓練動物只對某一個待定信號.如燈光.鈴聲出現後.作出踩槓桿的動作.才給以食物強化.這類必須通過自己某種活動(操作)才能得到強化所形成的條件反射.稱為操作性條件反射或工具性條件反射.
  • 心理學考點之斯金納的操作理論
    心理學考點之斯金納的操作理論 http://sichuan.hteacher.net 2019-03-14 15:49 四川教師招聘 [您的教師考試網]
  • 「經典條件反射」與「操作性條件反射」對比分析
    「經典條件反射」和「操作性條件反射」這兩個學習理論在《教育心理學》中處於非常重要的地位,在歷年教師資格證和教師招聘考試中也是一個。而很多學員在備考過程中,總覺得這兩個理論比較難理解,也不太好區分清楚。下面中公講師就此問題和大家做一個簡單的介紹,希望能為大家的學習提供一些幫助。經典條件反射和操作性條件反射都屬於條件反射的範疇。