iPadで一対比較

◆解説


一対比較法は、2つの素材を対にして評価し、素材間の心理的距離を間接的に尺度構成する手法です。
評価する特性は、一次元であることが想定できる特性(例 大きいー小さい)である必要があります。
一対比較は大きく分け、2つの刺激対に対して、優劣を評価するサーストン法・ブラッドレイ法と、評点(5件法など)により評価を行うシェッフェ法があります。


◯サーストン法


サーストン法は、優劣を評価する一対比較法です。
全対を評価することで、素材間の差を心理的な距離として推定し、尺度として1次元で表現します。
各素材の尺度上の距離が統計的に異なるかどうかを調べるため、サーストン法のケースVで分析を実行しています。
実験のデータがケースVの仮定を満たさない場合には、別途適切なケースで分析し直す必要があります。
また、サーストン法の場合、組み合わせの評価が一方に極端に偏った場合(例えば、比率が0.98より髙い場合)、
正規分布表から組み合わせの尺度の差を得ることができません。
そこで一方に極端に偏った場合には、欠損値として扱い、ギュークリクセンの方法などの欠損のある場合の
分析を行うこととなります(本アプリでは欠損処理には対応していません)。

◯シェッフェ法


シェッフェ法は、2つの素材の距離を評定(本アプリでは5段階)し、素材間の心理的距離を間接的に尺度構成する手法です。
全対を評価することで、素材間の差を心理的な距離として推定することができます。
各素材の尺度上の距離が統計的に異なるかどうかを調べるため、分散分析で判定します。
各素材間のどこに統計的に有意な差があるかどうかを調べるため、ヤードスティック信頼区間により判定しています。

◯シェッフェ法とその変法


シェッフェ法とし、シェッフェの原法と3つの変法(芳賀の変法、浦の変法、中屋の変法)の4つの手法があります。
・シェッフェの原法
1対ごとに異なる参加者が評価し、順序効果を考慮する手法です。
全対の回数は(素材の数)×(素材の数-1)となり、素材が5つの場合には、20回となります。

・芳賀の変法
1対ごとに異なる参加者が評価し、順序効果を考慮しない手法です。
全対の回数は(素材の数)×(素材の数-1)/2となり、素材が5つの場合には、10回となります。

・浦の変法
全対を1人の参加者が評価し、順序効果を考慮する手法です。
全対の回数は(素材の数)×(素材の数-1)となり、素材が5つの場合には、20回となります。

・中屋の変法
全対を1人の参加者が評価し、順序効果を考慮しない手法です。
全対の回数は(素材の数)×(素材の数-1)/2となり、素材が5つの場合には、10回となります。

◯順序効果の有無


事前に比較する素材により順序効果が強く生じることが想定される場合には、順序効果を評価できる手法を選択する必要があります。
例えば、食品の場合には先に評価したもののの方がおいしく感じるなど、順序効果の影響が大きいと考えられます。
一方、錯視のような視覚的な図形は空間配置効果があることが知られているが、同時に比較できる場合には順序の効果はほとんどないとも考えることができます。

◯一意性の検定


この検定により、参加者ごとに判断が一貫しているかを評価することができます。
ただし、一人の参加者が全ての組み合わせを評価する手法(サーストン法、浦の変法、中屋の変法)でのみ行うことができます。
A,B,Cの3つの素材を評価する際に、Aしかし、実際に評価を行うとA=Cや、A>Cと評価されてしまい、一貫した評価がなされないことがあります。
このような3者間で順位がつけられない状態を一巡三角形と呼びます。
このような結果になる理由としては、(1)参加者の評価能力が低い、(2)素材の差がほとんどない、(3)組み合わせの効果があるという3つの可能性があります。
もし、(1)に該当する場合には、一意性の検定の結果から参加者をデータの分析から除外することが妥当であると考えられます。
素材が4個以上の場合であっても3者関係に分割することで一貫性の評価が行えます。
この一巡三角形の数(d)を計算し、カイ二乗検定により統計的に有意な順位であるかを判定することができます。
ただし、検定の特性上、素材の数が5個以下の場合、一巡三角形が0個であっても有意な順位があることにはなりません。
つまり、素材の数が6個以上でないと検定の結果を有効に活用できない点に注意が必要です。

◯本アプリでの一意性の判定方法


このアプリでは、2つのルールで一意性の判断を行なっています。どちらかで一意性がないと判断された時に、junk判定がなされます。
(1)素材間の各評価で必ず差が弁別できること:評定の時、5段階評定で真ん中の評価(つまり弁別できない)がある時には、一意性がない(junk)と評価します。
そのため一意性を問題にしたいのであれば、教示でできるだけ優劣をつけるよう言うことと優劣がつく素材を使用することをお勧めします。
(2)一意性の検定:素材の数によって判断の基準が変わります。
・素材が4個以下の場合、一意性は判断できません。
・素材が5個の場合、一巡三角形の数(d)が0個の場合には一意性あり、1個以上の場合には一意性ない(junk)と判断しています。ただし、検定の有意水準が通常の5%ではなく、12%水準での検定となり、通常の検定と比べてゆるい基準となっている点に注意してください。
・素材が6個の場合、一巡三角形の数(d)が1個以下の場合には一意性あり、2個以上の場合には一意性ない(junk)と判断しています。
・素材が7個の場合、一巡三角形の数(d)が3個以下の場合には一意性あり、4個以上の場合には一意性ない(junk)と判断しています。
・素材が8個〜10個の場合、素材の数と一巡三角形の数(d)に基づきカイ二乗検定を行い、判定します。

◯一致性の検定


この検定により、評価を行った集団の判断の一致性を評価することができます。
ただし、一人の参加者が全ての組み合わせを評価する手法(サーストン法のうち全対を一人で評価する方法、浦の変法、中屋の変法)でのみ行うことができます。
組み合わせ全体に対して、好みが一致しない組み合わせの数を計算し、カイ二乗検定により統計的に有意に一致しているかを判定することができる。

◯参考文献


サーストン法、浦の変法、中屋の変法の尺度構成、統計的検定に関しては、佐藤(1985)の計算式を参考にしています。
素材が5個の場合の一致性の判断には、Kendall(1948)の一対比較に置ける素材数ごとの一巡三角形の数(d)の頻度の表を根拠としています。

文献リスト
佐藤 信(1985).「統計的官能検査法」 日科技連出版社

  • Kendall, M. (1948). RANK CORRELATION METHODS, Charles Griffin & Company Limited.
解説ページ更新日:2017/01/06