为什么你家的狗狗怎么教都不听?那是你没有正确地进行奖励和惩罚
训练狗狗这件事情,其实看起来十分简单。用一句话概括,那就是,做对了就奖,做错了就罚。然而就是这么简单的一句话,很大一部分的狗主都没能够好好地做到。原因很简单,因为狗狗是一只活物。狗狗有着自己不一般的想法,主人需要根据狗狗的日常生活习惯,来调整对狗狗的奖励和惩罚方式。更为重要的是:需要及时进行反馈。如何给予狗狗正确的反馈,是一个训犬师最为基本的能力。今天,就来给大家讲一讲,狗狗做错到底该如何惩罚、做对了又该如何奖励狗狗。
对狗狗来说什么是奖励?
狗狗的价值观体系和人类的不一样,对于它们来说,水和食物是奖励,玩具玩耍都是奖励,主人的抚摸、称赞、眼神交流也是奖励,甚至你让它静静地呆在你的身边,对它来说也是一种奖励,因为它能感知得到你的亲近。
但每只狗狗都有自己的兴趣和爱好,所以它们会对不同的奖励产生不同的反应。作为主人的我们,需要找到狗狗最为喜欢的奖励方式来训练它们。
举例说明,假如你假如狗狗在和别的狗玩,听见招唤马上狂奔回家你身旁,夸赞就不要给的太晚了。由于狗狗很有可能会无趣坐着或是向你扑跳,而晚来的奖励就变为夸奖坐着或扑跳。那样的状况十分普遍,可是在日常的日常生活之中,许多主人并不会注意到这一个问题。
实际上如此的延迟奖励还会继续造成一个问题,便是会将本来要想的狗狗作出的合理个人行为被抑止。狗狗会为此而感觉,作出准确的行为表现是并没有奖励的,后边的一个无意义个人行为,才算是得到奖励的重要。
奖励要立即,延迟奖励容易犯错
关于何时该奖励、何时不该奖励动物,就有成千上万的科学研究报告。动物心理学研究使用了好几种不同的强化奖励机制:
持续加强(CR) | 固定不动比例(FR)| 固定不动时距(FI)| 转变比例(VR)| 转变时距(VI)| 区辩性(DR)
然而在生活当中,根本不适用!因为上面很多奖励机制都只适用于学术研究,生活中并不实用。
例如持续加强,实际上只发生在试验室里边,一般通过电脑控制分派奖励。持续加强在警犬训练层面能充分发挥的作用非常比较有限,最先没有训练者,能那麼精准持续地为狗狗的每一个恰当回复给与奖励;其二狗狗假如接纳持续加强功效,一开始会积极主动学习培训,迅速就会烦厌抵触,这类奖励无法长期执行。
所以一般,我们都是使用变化强化的方法,变化包括正确行为的执行次数,或者一个正确行为执行时间的变化。让狗狗知道做对了有奖励,但是不知道你会不会给奖励。这样的不确定性,能强化狗狗的专注度,提升训练的效果。
什么时候奖励才是最好的?
转变奖励会让狗狗更为紧密配合,由于狗狗了解,自身立刻开展回复有机会得到奖励,只回复不立即连获得奖励的很有可能也没有。为了更好地能获得自已愿意的物品,狗狗就会更为拼命地相互配合主人,得出回复。
而大家则可以借助这一特点,来调整狗狗的主要表现和反映。由于人和计算机不一样,我们都是可以根据主要表现的好坏开展奖励,让它的个人行为显得更加出色。假如开展10次捡球,第3次反映快,第4次等候尤其有耐心,第12次特别潜心又开心,这是大家加强奖励的机会,让狗狗了解它有越好的主要表现,会取得越立即、明显的奖励,最优异的一次主要表现乃至可以得到超强巨奖。
只要我们正确地奖励狗狗,狗狗就会不断强化正确的行为。有奖励当然会伴随着惩罚,惩罚也是一般狗主人引发狗狗不良行为的主要原因。
无效的惩罚等于虐待
不听话的狗狗,比小孩更闹心,许多狗主人都以前要想动手能力杀狗。有的人不理智一下就过去,有的人就确实着手了。尽管大家并不建议杀狗,但大家没改变命运的工作能力,只有看见这些狗主人们用打过来做为惩罚。
不过想要告诉各位的是,无效的惩罚,其实和虐待狗狗没什么区别。因为同一种问题而多次惩罚狗狗,却没有看到成效。那么就说明,你的惩罚是无效的。这个时候,我们就需要反思一下,是不是哪个环节出现了问题,要更改管教方法了。
更为多见的便是乱叫,狗狗一直吠叫,主人只能用责骂的方法来回复狗狗,狗狗并搞不懂自己做不对哪些,但因为对状况的不理解,狗狗会由于慌乱而越来越清静。尽管看起来责骂合理,但实际上是在耗费自身与狗狗中间的信赖和关联。
狗狗是一种活在当下的生物,如果你的惩罚和奖励不够及时,那么狗狗就忘掉了它们刚才做了什么事情。狗狗跳上沙发尿尿,被你看见凶了一顿,这是立即惩罚;狗狗在你上班时,在沙发上拉了泡尿,4小时后你回家发现,再叫它过来把头按上去暴打一顿,这是延迟惩罚。
为什么延迟惩罚没有作用?因为你延迟惩罚以后,狗狗看见你,是在很开心地想要跟主人打招呼,然而你这个时候呼它一巴掌。它当时的想法就是,我是不是不该和你打招呼?还是不该和你亲近?或者是,主人已经不爱它了?狗狗就会误会了你惩罚它的意思,最终导致人狗之间的感情破裂,狗狗的不良行为越发严重。
使用有效并带有指示的责备
与惩罚对比,口头上责备实际效果要好很多。用口头上责备可以立即执行,并且可以间隔一段距离,终究来到狗狗眼前很有可能还需要花时间。标示性的责备自身就确立和含有数据的,惩罚则二者皆无。“慢一点!”、“坐着!”、“离开!”、“松嘴!”、“清静!”、“出来!”,全是合理标示性的责备案例,仅用一个词就要狗狗了解2件事:第一,根据气愤的语调,它了解自身即将犯错误了;第二,怎样纠正错误。
主人的声音和语调在责备狗狗,传出的语言命令也马上告知狗狗如何纠正。那样它不仅能防止大量惩罚,更能为优良的听从得到奖励。
让狗狗有机会做正确的事!
直接惩罚狗狗,虽然可以制止狗狗的错误行为,但问题在于,你有教它怎么做才是正确的吗?作为主人,我们应该在制止了狗狗的错误行为以后,引导狗狗做出正确的反应。
如果作为狗主人,我们只是一味地惩罚和制止狗狗的行为,狗狗就只会知道,在你面前做什么事情不会挨打。一旦狗狗明白它在某些情况下不用受罚,它就会成为奸诈的捣蛋鬼,当你不在场时就乱搞。
仅有有效地应用奖励和惩罚,大家能够有效地解决狗狗日常出現的个人行为问题。我们在日常生活中总是会不自觉地忽略了一些关键点,这种小细节会由于主人长期性不正确的反映,促长了狗狗的各种不良行为。因此如今才会发生上门服务警犬训练那样的服务项目,训犬师上门服务对你和狗狗中间的交互开展观查,再帮你挑选出不科学的姿势。实际上警犬训练并不是是练习狗狗,反而是教主人,如何正确地和狗狗开展共处。
你能明确你日老对狗狗惩罚和奖励全是恰当的吗?大约,绝大多数人都不敢百分之百夸下海口吧。
参考文献
尹恩.邓巴. 邓巴博士研究生养宠物古兰经[M]. 当代世界出版社, 2013.
迪利?美国总统布什. 狗狗心思望你知[M]. 度假旅游人民出版社, 2010.
Pryor, K. (1985). Don't shoot the dog!. Toronto: Bantam Books.
Dinsmoor, James A. (2004) " The etymology of basic concepts in the experimental analysis of behavior ." Journal of the Experimental Analysis of Behavior , 82 (3): 311-316.
Michael, Jack. (1975) " Positive and negative reinforcement, a distinction that is no longer necessary; or a better way to talk about bad things ." Behaviorism , 3 (1): 33-44.