昨日のブログ<犬のごほうびトレーニングの落とし穴:「ごほうびがないとしないんです!」という方は必読です>に続いて、ごほうびトレーニングの大きな落とし穴についてお話します。
今回はよくある質問「どうやってほめたらいいのかわからないんです」についてです。この疑問をいだいている飼い主さんは、おそらく犬のこと、そしてトレーニングの仕組みをかなり誤解していると考えられます。
●ごほうびトレーニングの報酬は何なのか?
ごほうびトレーニング(陽性強化トレーニング)を取り入れている飼い主さんからの質問に「どうやって褒めたらいいのかわからないんです。」という質問があります。これはトレーニングの手順が曖昧になっているために起きる間違いです。
陽性強化法の方程式はこうです。↓
犬にオスワリという → 犬が座る → 報酬を与える
この報酬の部分に「褒める」を置き換えるとこうなります。
犬にオスワリという → 犬が座る → 報酬を与える=褒める
どのように褒めたらいいのかわからないという飼い主さんは、報酬として褒めるという行動を使っています。ごほうびが「褒めること」なので、犬が褒められていることを喜んでいる場合でなければこの方程式は成り立ちません。
これは正の強化(陽性強化)法を用いた行動修正や行動学習における報酬の原理です。つまり報酬=ごほうびとして使用するものは、動物に行動を起こさせることができる「適切なもの」であるという原理です。報酬が行動を起こさせる動機にならなければ学習は成立しません。
さて、そこで質問ですが、報酬として飼い主が褒めるという行為を与えることは、報酬として適切なのでしょうか?褒める行為を報酬に使った結果、犬がオスワリといっても座らなくなったのであれば報酬としての効果はなく適切ではなかったということになります。
●なぜ飼い主は大げさに犬を褒めるのか?
しかし、飼い主はこう考えるのです。自分の褒め方が足りないのだと、犬にわかるように褒めなければいけないと思ってしまうようです。飼い主は「褒めるというごほうび」をもらって喜んでいる犬の反応を得ようとして大げさな褒め方をします。大きな声で「おりこうさんね~~」とか「グーッド」といいながら犬の顔をくちゃくちゃになるまでなで回します。この飼い主の興奮に対して当然犬は興奮します。ハアハアいったり、とびついたり、走り回ったりすることもあるかもしれません。この犬の反応を見て飼い主は犬が喜んでいると思います。飼い主の「褒める」という報酬を喜んで受け取ってくれたのだと勘違いするわけです。
しかし、そのうちにオスワリといっても犬は座らなくなります。むしろ、犬の方は座るともみくちゃに撫でらるという嫌なことをされるわけですから、警戒して座らなくなることもあります。撫でられたあとにブルブルと身震いをすることもあるでしょう。飼い主の興奮にストレスを感じ自分を落ち着かせるシグナルまで出しています。ところが飼い主は褒め方が足りないから犬が座らないのだと思って褒め方はもっと大げさになります。それでも結局のところ犬はオスワリをしなくなり、今度はオヤツを手にもってオスワリをさせるという形に変えます。報酬の種類を変えて対応をするわけです
報酬を食べものに変えるとオスワリする確率は高まります。飼い主に褒められることよりも、オヤツの方が犬にとっては座る行動を起こす動機が高まるからです。ところが犬によってはオヤツを見せてもオスワリをしなくなります。この流れについては昨日ブログに書きましたので復習してください。
● 飼い主が犬を大げさに褒めるようになった理由は他にもある
大げさに褒めるやり方が広まってしまったのは他にも理由があります。それは、本やネットの情報です。本やネットやテレビで紹介されるしつけ方について質問されることがあります。その多くはいい加減で曖昧なものばかりですが、その中には「犬が行動したら(オスワリしたら)大げさに褒めることが大切です」というものがあります。
なぜこのような情報が広がってきたのかというと、トレーニングのある現場では大きな声で犬の胸を軽く叩きながら褒めるような仕草を交えて犬に声をかけているドッグトレーナーを見かけることがあるからではないでしょうか?この手法は正の強化ではなく、多くは負の強化のトレーニングのために使われています。
負の強化(陰性強化)法の学習過程は次のようになります。
犬にオスワリという → 犬に嫌なことが起きる→ 犬が座る → 犬の嫌なことがなくなる
犬のトレーニング(訓練)に使用される、鉄製のチョークチェーンやハーフチェックという犬に一定の刺激を与える道具を使用してオスワリを教える場合にはこの負の強化法が使われています。
犬にオスワリという → 犬の首がチェーンで一瞬締まる → 犬が座る →チェーンが緩む
この原理が負の強化トレーニングです。国内でも正の強化(陽性強化)トレーニングが普及する前は、この負の強化(陰性強化)トレーニングで犬の訓練やしつけが行われることも多くありました。現在でもこうしたやり方は学習の方法のひとつとして使用されています。
このトレーニングは犬の性質やトレーニング道具(チョークチェーンやハーフチェックの首輪)の使う技術によって犬のダメージがかなり違ってきます。犬は首にショックを与えられるという嫌なことを体験します。犬によっては精神的なダメージを受けてしまい、オスワリどころか他の行動を起こさなくなるほどへこんでしまうことがあるからです。オスワリのあと全く動かなくなってしまう犬もいます。ところが、他の行動もこの方法で教えていくためには犬に何かの行動を起こしてもらう必要があります。そのため回復を図るために大げさに犬を褒めることで回復を図ろうとしてするようです。
もちろん、大げさに褒める必要があるのは技術のないトレーナーです。チョークチェーンなどを使った負の強化法のトレーニングの技術が高ければ、どの道具が犬に与える影響も予測できるので選択を間違えることも少なく、またチェーンの締め方と緩め方も調整できるため犬のダメージも少ないのです。ということは大げさに褒める必要はないということです。一般の飼い主さんにはあまり向きません。自分の技術が上がるまでに犬に与えるダメージが大きすぎるからです。
● 褒める報酬がいらないなら犬はどうしてオスワリするの?
犬を褒めてあげることは大切なことです。しかし、犬を大げさに褒めている必要はないのです。
報酬としての褒めることは必要ありません。かといってオヤツで釣ることを推奨もしません。では報酬は必要ないのかということですが、オペラント条件付けの正の強化(陽性強化)の枠を抜け出れば犬に報酬を与える必要はありません。ところが犬の側には報酬があります。それを動機付けといいます。
犬にとって、いや人にとっても大切な報酬は内的な動機付けによって成り立っています。つまり、できるということ、やったということ、もっと深くいえば社会に所属しているということです。犬はとても感受性が高いため、飼い主の反応によって自分の行動が適切であり飼い主に認められたことを理解できます。もちろんここには関係性が影響します。お前なんかに認められたくないよという人の前では協力的な態度は示しません。それは社会的な行動として当たり前のことです。
人間の中は誰にでも好かれたいしよく思われたいという気持ちもときどきはもしくはいつもあることを否定できません。しかし、そういう表向きの社交性は犬にはありません。そこがまた犬の魅力でもあり信頼できる動物でもある理由です。犬の場合は好かれたいという自分の評価を気にするような行動ではありません。社会的な関係を重要視できれば、犬は必要なときに自ら協力的な態度を示してくれるでしょう。飼い主が犬に甘える行動をとっているならこの関係はなかなか獲得できません。犬を甘やかしたいという気持ちは、犬に好かれたいという気持ちの裏返しであることもあります。犬はその社会性を通して感じたことを行動で表現してくれます。そして人に成長の機会を与えてくれます。そう思うととてもありがたい存在だと思います。
犬を侮るなかれ。犬はシンプルでわかりやすく正直なだけなのです。