首页 > 自媒体 > 知心萌宠 > 都是狗做对就奖励,我和专业训犬师有何不同?

都是狗做对就奖励,我和专业训犬师有何不同?

 
作者:知心萌宠
我回来的时候它很热情的亲我,该不该奖励它?它大部分时间都很听话,我老想奖励它,会不会太频繁了呢?奖励总是要给吃的吗?怎样的奖励最有效呢?这次我们就来谈谈奖励。我们曾经说过,对狗狗而言除了食物,还有很多行为可以成为奖励。

我回来的时候它很热情的亲我,该不该奖励它?

它大部分时间都很听话,我老想奖励它,会不会太频繁了呢?

奖励总是要给吃的吗?怎样的奖励最有效呢?这次我们就来谈谈奖励。

都是狗做对就奖励,我和专业训犬师有何不同?

大家曾经讲过,对狗狗来讲除开食材,也有许多方式可以变成奖励。在明白什么叫奖励以后,如何正确应用奖励,才可以把奖励实际效果利润最大化,让狗狗更高兴。

奖励必须让狗狗感觉到!每只狗狗都有自己独特爱好,都会重视某些奖励,比如大多数狗狗都不能抵挡零食的诱惑。而且不同奖励在狗狗心目中的地位,可能每一刻都不同。

都是狗做对就奖励,我和专业训犬师有何不同?

举例说明,一个鸡肉干,在上一刻是极具诱惑力的奖励。可是这一刻它身旁多了一大群狗狗,此刻它我想去流浪玩。对你的夸奖、抚摩、一块鸡肉干都觉得枯燥无味,给它一句“去玩吧狼人杀”,才算是时下最具备吸引的奖励。

都是狗做对就奖励,我和专业训犬师有何不同?

也就是说,你可以把让狗狗分心的事物,转换成强化行为的奖励,这种狗狗能感知到并强烈认同的奖励,对正向引导良好行为会发挥最大功效。

奖励必须立即,和惩罚一样,因为延迟奖励总会是强化错误的行为。

举例说明,假如狗狗在和别的狗玩,听见招唤马上狂奔回家你身旁,夸赞就不要给的太晚了。由于狗狗很有可能会无趣坐着或是向你扑跳,而晚来的奖励就变为夸奖坐着或扑跳。略微一慢,奖励的情形很有可能就彻底不一样。

都是狗做对就奖励,我和专业训犬师有何不同?

延迟奖励还有其他风险,就是产生“抑制好习惯”的悲剧效果。举例说,如果狗狗听话地回到你身边,却因为扑跳而受到惩罚,这项惩罚不但强烈抑制扑跳行为,也部分抑制了良好的召回行为,最后狗狗听到你的召唤就不想回来了。你应该立即奖励狗狗的正确行为,也应该立即惩罚狗狗的不良行为,这样才能强化好习惯和抑制坏习惯。

都是狗做对就奖励,我和专业训犬师有何不同?

有关什么时候该奖励、何时不应该奖励小动物,就会有许多的科研汇报。小动物社会心理学科学研究采用了多种不一样的强化奖励体制:

连续强化(CR) | 固定比率(FR)| 固定时距(FI)| 变化比率(VR)| 变化时距(VI)| 区辩性(DR)

别怕,因为上面很多奖励机制都只适用于学术研究,生活中并不实用

持续强化实际上只发生在试验室里边,一般通过电脑控制分派奖励。持续强化在警犬训练层面能起到的作用非常比较有限,最先没有训练者,能那麼精准持续地为狗狗的每一个恰当回复给与奖励;其二狗狗假如接纳持续强化功效,一开始会积极主动学习培训,迅速就会烦厌抵触,这类奖励无法长期执行。

一样的,假如应用固定不动时距奖励,就相当于大家每一个月按时发放工资,总之你都了解无论正中间是否有懒惰,到点就会发放工资,有些人就会在中间懒惰。那样的奖励时长体制,一样对狗狗没有什么实际效果。

都是狗做对就奖励,我和专业训犬师有何不同?

推荐你使用“变化强化”的方式,去处理给予奖励的时机。变化包括正确行为的执行次数,或者一个正确行为执行时间的变化。

好吧说人话,例如我们要狗狗学会坐下这个指令,那么第1次做到有奖励,第4次、第12次、第17次、第20次分别也有奖励。把5次奖励变化地分配到20次正确回应中,而不是平均的进行分配。

假如要狗狗学好清静等候,大家很有可能要等待5秒、等候20秒、等待13秒、等候34秒的情况下给与奖励,而不是每一次做到15秒时给与奖励。

如果你用奖励诱发狗狗开展培训时,可以从一开始就应用变化的体制。

如果狗狗一开始就做对了,然后你要尽快开始降低奖励的比率,要求它做出两次正确的行为才给予一次奖励。

有一点十分关键,不必让狗狗每一次作出一样的情形都必定得到奖励。假如那样做,它的确会学得迅速,但也会忘掉得迅速。假如奖励的机会是不经意和随机性的,它会学得迅速,也会还记得更坚固,会更加倍努力好的表现。

都是狗做对就奖励,我和专业训犬师有何不同?

为什么变化性的强化奖励能有如此的实际效果?本来它得到的奖励总数是比持续强化少得多。

如果连续奖励,狗狗确实得到更多奖励,但也更容易对奖励感到厌倦,失去兴趣和新鲜感,奖励就没有意义了。

除此之外,狗狗了解即使自身回复得晚了,只需回复,也会出现奖励,那我都急什么急?乃至感觉“总之此次不做对,下一次做对了也会出现奖励”,那麼此次不想做,就下一次再做呗。

为什么双十一大家发疯一样买买买?因为知道错过了可能就没机会,如果天天双十一,你还会疯狂买买买吗?

玩抓娃娃,你不断的投币机进来,一次又一次讨人喜欢的玩偶都是在边沿翻转,你心痒难耐煎熬,总希望下一次它就会掉到你的手上。在通过持续的思索、勤奋、投币机以后,你努力了远远超过小孩自身的花费,总算抓到了一个小孩!这一次奖励的满足感,使你再次进到下一次的投币机……

狗狗也是一样,通过你变化机制的训练,它知道会有奖励,但不知道什么时候有。当没有奖励的时候,它不放弃也不埋怨,只会继续努力的表现。

都是狗做对就奖励,我和专业训犬师有何不同?

总会有一些情况下你手头恰好没零食,这时你并不一定心急担忧,因为你平常的练习已经奠定良好基础,它依然会出现恰当的反映。

大脑和计算机不同点,是能感受到生命中心态的微小变化。一样一个捡球的个人行为,每一次狗狗的回复全是有细微差别的。除开在上面说的任意变化以外,大家更应当仔细观察狗狗每一次表现的细微差别,去奖励它最优异的这些表现。

都是狗做对就奖励,我和专业训犬师有何不同?

10次捡球,第3次反应快,第4次等待特别有耐心,第12次特别专注又愉快,这都是我们可以加强奖励的时机,让狗狗知道它有越好的表现,会得到越及时、强烈的奖励,最优秀的一次表现甚至可以获得超级大奖。

都是狗做对就奖励,我和专业训犬师有何不同?

根据对机会、表现的掌握,大家熟练掌握奖励去对狗狗开展培训和个人行为强化,练习就成为一个非常有意思的互动小游戏,并且是一个学海无涯、精雕细琢的全过程。狗狗的个人行为、心态、性情,都是在整个过程中获得正方向的正确引导和营造,你终究会得到一个愈来愈心有灵犀、服从意识高、心理状态正脸积极主动的生活伴侣。

参考

Dinsmoor, James A. (2004) " The etymology of basic concepts in the experimental analysis of behavior ." Journal of the Experimental Analysis of Behavior , 82 (3): 311-316.

Michael, Jack. (1975) " Positive and negative reinforcement, a distinction that is no longer necessary; or a better way to talk about bad things ." Behaviorism , 3 (1): 33-44.

相关文章
戈赞:正确奖励狗狗的方式你都get到了吗?
戈赞:正确奖励狗狗的方式你都get到了吗?
「超易懂超详细」教你养好狗狗
「超易懂超详细」教你养好狗狗
狗狗不小心帮忙破案了,警局奖励一包狗粮,上台领奖时太滑稽了
狗狗不小心帮忙破案了,警局奖励一包狗粮,上台领奖时太滑稽了

很多铲屎官常常羡慕别人家的狗狗会什么什么技能,觉得自家狗干啥啥不行,吃饭第一名。这种心态就像咱们父母的心态,对于狗狗并不公平,说不定它们啥时候就立功了。就像下面这个故事中的狗狗,可能它也不知道自己还会“破案了”。

狗狗爱翻垃圾桶,你的方法用对了吗?
狗狗爱翻垃圾桶,你的方法用对了吗?

近日抖音上东北女人教训狗狗翻垃圾桶的视频火了,在搞笑的同时,也有多东西值得我们反思!想不明白狗狗为什么总是喜欢翻垃圾桶,是狗粮不好吃,还是罐头没味道,为什么狗狗总是钟情于翻垃圾桶。相信狗狗喜欢翻垃圾桶是让所有铲屎官最头疼的问题之一...