272.
インデックスページへ戻る第4回 ギモンを解決!一問一答質問11 多変量解析とは何か?(その1)質問9、質問10で多変量解析を学ぶ前のおさらいをしてきました。今回からいよいよ医学統計でよく用いられる多変量解析についてご説明します。医学や薬学で用いられるデータは、人間や動物といった多種多様なものが複雑に絡み合って得られるものがたくさんあり、多くの種類(3つ以上)のデータ、つまり、多変量データと考えられます。そのため医学や薬学の研究では、多変量解析を適用すべき場面がしばしばあるのです。■解決したいテーマ多変量解析とは何かを知ってもらうために、多変量解析で解決できるテーマを3つほど取り上げてみましょう。医学的な事例だと難しくなりがちですので、一般的でなじみやすい事例で説明していきます。●テーマ1ドラッグストアでサプリメントなど、ある商品の売上をアップさせたいとき、どうすればよいでしょういろいろなアイデアがあると思います。チラシを印刷して店の近隣エリアにある住宅のポストに投函するとか、タウン誌に広告を出すなど広告費を増やして、どんどん宣伝するというのも1つの方法でしょう。また、店舗アルバイトの人員を増やすことで売上アップを狙うのもよいかもしれません。もちろん、単に広告費を増額して、あるいは店員の数を増やして売上を伸ばすというだけのアイデアが採用されるほど、ドラッグストアの本部は甘くはありません。しかし、あなたが、「広告費やアルバイト店員数の売上に対する影響度」、具体的には「広告費を1万円使えば、売上がどれほど増えるかといった広告費の売上への貢献度」などを数値に表し、売上を予測できたとすれば、あなたのアイデアはすぐにGoサインが出るでしょう。それでは、売上に対する影響度、貢献度はどのように数値化し、予測値をどのように算出すればよいでしょうか。●テーマ2人間ドックでの患者さんへの簡単な問診票の回答結果から、ある疾患に罹患している可能性を診断する仕掛けはどのようになっているのでしょう最近、食欲がない、軽い腹痛など調子が優れないと感じているときに、毎年の定期健診で受診している人間ドックにいきました。さっそく簡単な問診票が渡され、その質問に答えたところ、人間ドックの担当医から、「がんの疑いがあるので精密検査が必要です」と診断されました。どうすれば、簡単なアンケートだけで、こんな大胆な診断ができるのでしょうか。できるとすれば、どんな方法で行っているのでしょうか。●テーマ3大学受験の前に学科の得意・不得意によって、文系クラスか理系クラスかを決める仕掛けはどのようになっているのでしょう皆様の中にもこのような経験をされた方がいるかもしれません。高校2年から3年に進級するとき、学科の得意・不得意によって文系クラスか理系クラスかを決められてしまうケースがあります。英語や国語の点数が高いから文系、数学や物理の点数が高いから理系と決められるのは、納得がいきません。なぜなら、英語には文法があり理系能力も要求されます。また数学には文章問題があり、文系能力も要求されるからです。「英語の得点のうち80%が文系能力、20%が理系能力」、「数学の得点のうち10%が文系能力、90%が理系能力」といったことが解析で導き出せないものでしょうか。もし、このようなことが数値化できれば、真の文系能力、理系能力がわかりますね。■多変量解析で解決するテーマ1~3について、多変量解析はどのような考え方で解決しているかを解説します。●テーマ1ドラッグストアでサプリメントなど、ある商品の売上をアップさせたいとき、どうすればよいでしょう予測したいサプリメントXの売上金額、広告費、店員数のデータを直近の6年間について調べ、表1としてパソコン(Excel)に入力し、多変量解析のソフトで処理します。多変量解析は、いろいろな数値を算出します。広告費を1万円使用したとき売上は8万円アップ、店員1人を投入すると売上は539万円アップするといった売上貢献度を算出します。広告費、店員数を0としたときの最少売上を算出します。その値は1,148万円です。2017年の広告費は1,300万円、店員数は14人です。表1 事例の売上金額、広告費、店員数などのデータ(1)広告費1万円に対する売上貢献度は8万円なので、2017年の広告費による売上は、広告費1,300万円に売上貢献度8万円を掛けた値である1億400万円だといえます。(2)店員数1人に対する売上貢献度は539万円なので、2017年の店員による売上は、店員数14人に売上貢献度539万円を掛けた値である7,546万円だといえます。(3)何もしなくても見込める最少売上は1,148万円です。図に示した1億400万円、7,546万円、1,148万円を加算することによって、2017年の売上ポテンシャル(予測値)は1億9,094万円となります。図 2017年の売上ポテンシャル(予測値)2017年は、広告費を1,300万円、販売員数を14人投入すれば、サプリメントXは1億9,094万円の売上を見込めるということがわかりました。●テーマ2人間ドックでの患者さんへの簡単な問診票の回答結果から、ある疾患に罹患している可能性を診断する仕掛けはどのようになっているのでしょうすでに確認されているがん患者のグループと、健康な人のグループとの問診票のアンケート回答結果から診断を行います。診断は、アンケートに回答してもらった、喫煙の有無、飲酒の有無などで行います。がんの有無と各質問項目との相関関係を調べ、がんであるかどうかを判別する関係式を作ります。がん判別得点=a1×質問(1)+a2×質問(2)+…+定数ここで示したa1、a2は、各質問ががん判定にとってどのくらい大事なのかを表した数値と考えてください。この関係式をパソコンにセットします。あとは人間ドックに来院した人の問診票の結果をパソコンに入力すると、その回答は関係式にインプットされ、がんの有無を調べる得点が計算されます。この値が「+」であればがんの可能性あり、「-」であれば可能性なしということになります。●テーマ3大学受験の前に学科の得意・不得意によって、文系クラスか理系クラスかを決める仕掛けはどのようになっているのでしょう表2で各科目の文系能力へのウエイトのa1、a2、…を求めます。同様に理系能力のウエイトb1、b2、…を求めます。表2 文系、理系ウエイトの算出生徒の各科目の得点をx1、x2、…とします。文系能力、理系能力は、次の関係式によって求められます。文系能力得点=a1x1+a2x2+a3x3+a4x4+a5x5理系能力得点=b1x1+b2x2+b3x3+b4x4+b5x5表3に、ある生徒の5科目が次の得点であるときの文系能力得点、理系能力得点を求めます。表3 ある生徒は文系か、理系か文系能力得点=0.8×80十0.1×50+0.9×90+0.3×60+0.4×70 =64+5+81+18+28=196 平均39.2理系能力得点=0.2×80+0.9×50+0.1×90+0.7×60+0.6×70 =16+45+9+42+42=154 平均30.8よって、この生徒の平均点は70点、そのうち文系能力は39.2点、理系能力は30.8点と求められ、文系能力のほうが高いことがわかりました。以上、解決方法を述べました。すべてのテーマに共通して言えることがあります。どのテーマも関係式(モデル式ともいう)を作り、この関係式を用いて解決しているということです。この関係式を作ること、すなわち「関係式に用いる係数を求めること」が、多変量解析の役割なのです。多変量解析の応用範囲は広く、最初の出発点は心理学でしたが、現在では、変数間の関係を取り扱うのであれば、あらゆる分野に応用されています。その分野は、人類学から、考古学、物理学、経済学、教育学、気象学、家政学、社会学までと多岐にわたり、研究所、行政省庁、企業、そしてマーケティング業務などと多様なシチュエーションで活用されています。どのジャンル、テーマも多変量解析を適用して解決する場合、関係式を用いています。ここまで、多変量解析とは何かを知ってもらうために、一般的でなじみやすい事例で説明しました。次回は、多変量解析で取り扱うデータや、解析の種類および解析手法名について説明していきます。今回のポイント1)多変量解析は関係式(モデル式)を作り、その関係式を使って、課題を解決する!2)多変量解析の役割は、この関係式に用いる係数を求めること!3)多変量解析の応用範囲は広く、変数間の関係を取り扱う場合であれば、医学はもちろんその他のあらゆる分野で応用されている!インデックスページへ戻る