首页 > 自媒体 > 知心萌宠 > 都是狗做对就奖励，我和专业训犬师有何不同？

都是狗做对就奖励，我和专业训犬师有何不同？

2021-05-31

　

作者：知心萌宠

我回来的时候它很热情的亲我，该不该奖励它？它大部分时间都很听话，我老想奖励它，会不会太频繁了呢？奖励总是要给吃的吗？怎样的奖励最有效呢？这次我们就来谈谈奖励。我们曾经说过，对狗狗而言除了食物，还有很多行为可以成为奖励。

我回来的时候它很热情的亲我，该不该奖励它？

它大部分时间都很听话，我老想奖励它，会不会太频繁了呢？

奖励总是要给吃的吗？怎样的奖励最有效呢？这次我们就来谈谈奖励。

都是狗做对就奖励，我和专业训犬师有何不同？

大家曾经讲过，对狗狗来讲除开食材，也有许多方式可以变成奖励。在明白什么叫奖励以后，如何正确应用奖励，才可以把奖励实际效果利润最大化，让狗狗更高兴。

奖励必须让狗狗感觉到！每只狗狗都有自己独特爱好，都会重视某些奖励，比如大多数狗狗都不能抵挡零食的诱惑。而且不同奖励在狗狗心目中的地位，可能每一刻都不同。

都是狗做对就奖励，我和专业训犬师有何不同？

举例说明，一个鸡肉干，在上一刻是极具诱惑力的奖励。可是这一刻它身旁多了一大群狗狗，此刻它我想去流浪玩。对你的夸奖、抚摩、一块鸡肉干都觉得枯燥无味，给它一句“去玩吧狼人杀”，才算是时下最具备吸引的奖励。

都是狗做对就奖励，我和专业训犬师有何不同？

也就是说，你可以把让狗狗分心的事物，转换成强化行为的奖励，这种狗狗能感知到并强烈认同的奖励，对正向引导良好行为会发挥最大功效。

奖励必须立即，和惩罚一样，因为延迟奖励总会是强化错误的行为。

举例说明，假如狗狗在和别的狗玩，听见招唤马上狂奔回家你身旁，夸赞就不要给的太晚了。由于狗狗很有可能会无趣坐着或是向你扑跳，而晚来的奖励就变为夸奖坐着或扑跳。略微一慢，奖励的情形很有可能就彻底不一样。

都是狗做对就奖励，我和专业训犬师有何不同？

延迟奖励还有其他风险，就是产生“抑制好习惯”的悲剧效果。举例说，如果狗狗听话地回到你身边，却因为扑跳而受到惩罚，这项惩罚不但强烈抑制扑跳行为，也部分抑制了良好的召回行为，最后狗狗听到你的召唤就不想回来了。你应该立即奖励狗狗的正确行为，也应该立即惩罚狗狗的不良行为，这样才能强化好习惯和抑制坏习惯。

都是狗做对就奖励，我和专业训犬师有何不同？

有关什么时候该奖励、何时不应该奖励小动物，就会有许多的科研汇报。小动物社会心理学科学研究采用了多种不一样的强化奖励体制：

连续强化（CR） | 固定比率（FR）| 固定时距（FI）| 变化比率（VR）| 变化时距（VI）| 区辩性（DR）

别怕，因为上面很多奖励机制都只适用于学术研究，生活中并不实用。

持续强化实际上只发生在试验室里边，一般通过电脑控制分派奖励。持续强化在警犬训练层面能起到的作用非常比较有限，最先没有训练者，能那麼精准持续地为狗狗的每一个恰当回复给与奖励；其二狗狗假如接纳持续强化功效，一开始会积极主动学习培训，迅速就会烦厌抵触，这类奖励无法长期执行。

一样的，假如应用固定不动时距奖励，就相当于大家每一个月按时发放工资，总之你都了解无论正中间是否有懒惰，到点就会发放工资，有些人就会在中间懒惰。那样的奖励时长体制，一样对狗狗没有什么实际效果。

都是狗做对就奖励，我和专业训犬师有何不同？

推荐你使用“变化强化”的方式，去处理给予奖励的时机。变化包括正确行为的执行次数，或者一个正确行为执行时间的变化。

好吧说人话，例如我们要狗狗学会坐下这个指令，那么第1次做到有奖励，第4次、第12次、第17次、第20次分别也有奖励。把5次奖励变化地分配到20次正确回应中，而不是平均的进行分配。

假如要狗狗学好清静等候，大家很有可能要等待5秒、等候20秒、等待13秒、等候34秒的情况下给与奖励，而不是每一次做到15秒时给与奖励。

如果你用奖励诱发狗狗开展培训时，可以从一开始就应用变化的体制。

如果狗狗一开始就做对了，然后你要尽快开始降低奖励的比率，要求它做出两次正确的行为才给予一次奖励。

有一点十分关键，不必让狗狗每一次作出一样的情形都必定得到奖励。假如那样做，它的确会学得迅速，但也会忘掉得迅速。假如奖励的机会是不经意和随机性的，它会学得迅速，也会还记得更坚固，会更加倍努力好的表现。

都是狗做对就奖励，我和专业训犬师有何不同？

为什么变化性的强化奖励能有如此的实际效果？本来它得到的奖励总数是比持续强化少得多。

如果连续奖励，狗狗确实得到更多奖励，但也更容易对奖励感到厌倦，失去兴趣和新鲜感，奖励就没有意义了。

除此之外，狗狗了解即使自身回复得晚了，只需回复，也会出现奖励，那我都急什么急？乃至感觉“总之此次不做对，下一次做对了也会出现奖励”，那麼此次不想做，就下一次再做呗。

为什么双十一大家发疯一样买买买？因为知道错过了可能就没机会，如果天天双十一，你还会疯狂买买买吗？

玩抓娃娃，你不断的投币机进来，一次又一次讨人喜欢的玩偶都是在边沿翻转，你心痒难耐煎熬，总希望下一次它就会掉到你的手上。在通过持续的思索、勤奋、投币机以后，你努力了远远超过小孩自身的花费，总算抓到了一个小孩！这一次奖励的满足感，使你再次进到下一次的投币机……

狗狗也是一样，通过你变化机制的训练，它知道会有奖励，但不知道什么时候有。当没有奖励的时候，它不放弃也不埋怨，只会继续努力的表现。

都是狗做对就奖励，我和专业训犬师有何不同？

总会有一些情况下你手头恰好没零食，这时你并不一定心急担忧，因为你平常的练习已经奠定良好基础，它依然会出现恰当的反映。

大脑和计算机不同点，是能感受到生命中心态的微小变化。一样一个捡球的个人行为，每一次狗狗的回复全是有细微差别的。除开在上面说的任意变化以外，大家更应当仔细观察狗狗每一次表现的细微差别，去奖励它最优异的这些表现。

都是狗做对就奖励，我和专业训犬师有何不同？

10次捡球，第3次反应快，第4次等待特别有耐心，第12次特别专注又愉快，这都是我们可以加强奖励的时机，让狗狗知道它有越好的表现，会得到越及时、强烈的奖励，最优秀的一次表现甚至可以获得超级大奖。

都是狗做对就奖励，我和专业训犬师有何不同？

根据对机会、表现的掌握，大家熟练掌握奖励去对狗狗开展培训和个人行为强化，练习就成为一个非常有意思的互动小游戏，并且是一个学海无涯、精雕细琢的全过程。狗狗的个人行为、心态、性情，都是在整个过程中获得正方向的正确引导和营造，你终究会得到一个愈来愈心有灵犀、服从意识高、心理状态正脸积极主动的生活伴侣。

参考

Dinsmoor, James A. (2004) " The etymology of basic concepts in the experimental analysis of behavior ." Journal of the Experimental Analysis of Behavior , 82 (3): 311-316.

Michael, Jack. (1975) " Positive and negative reinforcement, a distinction that is no longer necessary; or a better way to talk about bad things ." Behaviorism , 3 (1): 33-44.

奖励狗狗行为表现习惯训练有奖等待 训犬师 惩罚时机 鸡肉干 坐下

: 知心萌宠
不能因为咱俩有过节，你就把我当节过。

相关文章

奖励机制在狗狗训练中的应用

对狗狗正确的奖励和惩罚方法

: 你家狗狗总是叫不回来?这6招狗狗召回术，可以帮到你!
有些狗狗就属于“撒手没”类型，一带出去就撒欢子跑，主人的叫唤也置之不理，所以对狗狗进行唤回训练是非常有必要的。你家狗狗总是叫不回来？这6招狗狗“召回术”，可以帮到你！食物“召回术”训练最好在室内进行...

: 狗狗训练的十个基本动作：从坐下到打滚的完美指南!
1. 站立，动作要领：用食物引导狗狗站立，并逐渐让狗狗习惯在指令后站立。随着训练的进行，你可以逐渐减少食物的引导，而是使用口令或手势来让狗狗站立。这个过程可能需要一些时间和耐心，因为狗狗需要学会理解和响应你的指令。