前回ブログのつづきです。
【犬に関する統計の悪質極まりない使い方】
●統計ってゆーヤツは・・・
統計ってヤツは、ちゃんと取ればものすごい信頼性のあるものになりますけれど、実はその性質上ヒジョーに厄介なモンなんです。
統計でとても大切なことは、その手法の”透明性”と”連続性”、そして”分析”と”抽出の仕方”です。
◇手法の透明性
手法の透明性っていうのは、たとえば
カツオ「ねえさーん、ゲーム買ってよ~!クラスの10人中9人がゲーム買ってもらってるんだよぅ~!90%の確率ってことだよ!」
みたいなことを言われた場合、サザエとしてはこう切り返しますね?
サザエ「その10人っていうのは誰と誰なの?カツオが選んだ10人でしょ?その10人じゃなくて姉さんが選んだ10人でも9人が買ってもらっているかしら~?または、学年全体の150人中だと何人になるのかしら~?」
ようするに、統計を取る手法が明らかになっていなければ「自社調べ」みたいなことをやっても何の信憑性もないってことですね。
よくありますよね~ 『顧客満足度99%!(自社調べ)』みたいなヤツ(笑)
統計は、その手法の透明性を見れば、それが信頼に値する統計かどーかがある程度わかるってことになります。
◇連続性
統計の連続性ってゆーのは、たとえば
『毎日自宅の門の前を何匹のノラネコが通るか』
を調べている人がいたとします(←?)
24時間調べるわけにはいきませんから、1日のうちの1時間だけ調べることにして、それを仮に単純に24倍して1日のノラネコ通行量としていたとしましょう。
きっと、単純に24倍するのは統計として間違えでしょうが、ともかくその人はそうすることにしました。
なぜならその人はそれを年間で集計して、ノラネコの通行量の年ごとの推移だけを知りたかったからです。
さて、この人が去年まで5年間、ずーーっと朝の6時~7時の間でノラネコをカウントしていたのに、今年から急に、13時~14時の間でノラネコをカウントするように手法を変更したとしましょう。
その人が去年と今年を比較して自宅前のノラネコ通行量の増減を知りたい時に、単純にその数を比較してもいいと思いますか?
いいわけありませんよね?
だって調査している時間帯がぜんぜん違うんですから比べるイミがありません。
このように、統計を取る手法を何らかの理由で変更した場合は、変更前のデータと変更後のデータには連続性がなくなっちゃいますから、そこを補正する難しい計算をいちいちする必要があるんです。
もちろん、統計を人に示す時には、どの時点でどんな変更を加え、それを補正するためにどんな手法を用いたかまでキッチリ説明しなくては公正性が保たれません。
余談ですが、厚労省の統計不正問題で一番問題視されている点は、まさにこの部分です。
法律で決められた手法と違った手法を用いて統計を取っていたことはもちろんトンデモないんですが、更に悪質なことに統計手法をある時期にコソっと変えて、こともあろーに変更前のデータとシレっと並べて比較していたってトコロなんです。
◇分析
分析ってゆーのは、統計データをどう解釈するかってことで、まさに統計の数字たちに意味合いを持たせて命を吹き込む作業のことです。
でも、この分析がなかなかクセモノで・・・
例えばコップに水が半分入っているのを見て
「半分も入ってるっ♪」
と感じる人と
「半分しか入ってない」
と感じる人がいるように、まったく同じ統計数字を見てもその分析の仕方によって導かれる結論がまったく違ってしまうことがあるんですね。
◇抽出の仕方
抽出の仕方がなぜ重要かとゆーと・・・
たとえば、自宅前のノラネコを毎日カウントしていたさっきの物好きな人を例にしてみましょう。
その人にやっぱり物好きなある人が
「あなた、家の前のノラネコの数を数えてるらしいですね?ちなみにどのくらいのノラネコが通るんです?」
と尋ねたとしましょう。
このとき、どう答えるかは訊かれた人の自由なんです。
もし、ノラネコの通行量を少なく見せたかったら
「そうですねぇ~・・・たとえば昨日の13時~14時にここを通ったノラネコは1匹だけでしたよ」
と答えるかもしれません。
もし、ノラネコの通行量を多く見せたかったら
「今日の13時~14時にここを通ったノラネコは5匹いましたから、1日にすると24倍して120匹・・・それを年間に直すと365倍だから・・・延べ43800匹も通るってことになりますね。」
と答えることもできるでしょう。
どっちもウソじゃないけれど、恣意的にどの数字を抽出して、どのような見せ方をするかによって印象はガラリと変わってくるってことですね。
●子犬の八週齢規制の検討会資料
さて・・・ここからがやっと本題なんですが・・・
まずは、「八週齢規制ってなに?」という方は以前このブログで書いたコチラ↓の記事をお読みください。
問題行動の原因その3【すべての人間の問題】②
↑この記事中でお話したように、
「子犬を母犬や兄弟犬と引き離す時期は、生後八週齢以上経過してからにすること」
という、既に欧米では常識となっている八週齢規制を日本でも法律として取り入れるかどうかの検討を日本政府の環境省は検討していたんです。
そして、その検討結果が先日遂に発表されました!!
ところが・・・その結果は次のようなものでした。
(先に言うけど、読まなくていいよ~)
ーーーーーーーー
まとめ
因子分析による個々の行動因子ではなく、主成分分析によって得られた「問題行動全般」を表した成分が、解析において適切であった。この「問題行動全般」の成分スコアに対して、一般化線形モデルを実施したところ、店舗導入日齢を3群に分けた、またはそのまま用いた場合問題行動全般のスコアの回帰係数は日齢3群で0.3程度、店舗導入日齢で-0.019であった。「問題行動全般」の成分スコアに対して、重回帰分析を実施したところ、導入日齢を3群に分けた、またはそのまま用いた場合店舗導入日齢による影響は、決定係数R2で、日齢3群で0.009、店舗導入日齢で0.009-0.01。また、問題行動の成分スコアが高い個体のみを抽出した解析においても、その頻度の有意差、店舗導入日齢3群間の差は認められなかった。
ーーーーーーーー
読まなくていいって申し上げたのは、この「まとめ」だけ読んでも何がなんやらイミフメーな内容だからです。
ちなみに文中で「3群」って呼んでいるのは
1群=46-49日齢引き離し群
2群=50-56日齢引き離し群
3群=57-69日齢引き離し群
ってことです。
上記の文を日本語に翻訳すると、つまりは
母犬と子犬の引き離し時期を46-49日齢にしても、50-56日にしても、57-69日にしても、その後の問題行動にたいした差はありませんでしたぁ~~~!!
って言ってるんです(-_-;)
とろこが・・・!! いや、ところが・・・!
この報告書には最初にお話した統計に欠かせない大事な要素のうち
”手法の透明性” と ”分析”の仕方に大変恣意的なカラクリを感じるんですねぇ~!
どう恣意的かってゆーと、この統計(アンケート結果)を集計する際に、数字をこねくり回した挙げ句、なんとしても
「八週齢規制なんてウチの国では別に必要なくね?!」
って結論を導き出そうと必死な感じがヒシヒシと伝わってくるんです。
また、結論の数字が導き出される過程もわざと解りづらくしているような不親切な報告書の内容になっています。
その手口がどのくらいイヤラシイものか、わたしにうまく説明できるかあまり自信がないのですが、次回、なるべく解りやすくご説明してみたいと思います。
もし、ご興味があれば報告書そのものが環境省のHPにありますので読んでみてください。
どれだけ解りづらいイジワルな報告書かってことだけは少なくともおわかりいただけることと思います。↓↓↓
問題の報告書
<今日のPetHotel11!>
朝の海岸さんぽ♪
今日も春らしいいい陽気だねぇ~♪
ボスはまた海岸で
新たなボールをゲット♪
今回のボールは剥がせそうにないねぇ(笑)
ナツ「あれ?チャコは?」
チャコ「ふふふ・・・・」
カメさんかっ!!
午後のおさんぽ♪
Cちゃんは今回最後のお散歩だね!
またすぐ会えるけど・・・(*^_^*)
後発隊をいい子に待っていたCちゃんと
としおだけど・・・
としおはすぐにタイクツになっちゃって・・・
ホリホリが始まりました(^_^;)
としお「ブラジルのみなさ~~~ん!!」
ゴールデンのMちゃんが久々に
お泊りに来てくれたよ♪
Mちゃんも、ウチの子たちも
ちゃーんと覚えていたね!!
としお「はじめましてです~」
お姉さん大好きなとしおは大喜び♪
Mちゃん「あらあら・・・こちらこそ
ヨロシクね~~!」
中型犬以上の女子にはキビし目なナツも
まったく吠えません
「なんだ・・・Mちゃんか~♪」
仲良くなれたの!
ヨカッタねぇ~~(*^_^*)
中年になっても変わらぬ愛らしさを持った
Mちゃん・・・見習いたいね(-_-;)
あ・・・この前ウンチがゆるくなって
ご心配下さっていたみなさーん
としおはスッカリよくなりましたので
ご安心くださいませ
(お薬1回飲んだだけで完治!)
0 件のコメント:
コメントを投稿