対応分析を行い各文書(各回答者)のスコアを出力する #833
Replies: 2 comments
-
バグは直しましたバグを修正したバージョンを3.Alpha.15fとして先ほどリリースしました。 対応分析を行って各文書(各回答者)のスコアを出力される場合には、このバージョンに更新していただくのが簡単だと思います。Rを使う必要がなくなり、「データ表の種類」を「抽出語×文書」にして対応分析を行い、結果をCSV形式で保存するだけでよくなります。「抽出語×文書」なので、抽出語スコア・文書(回答者)スコアの順に保存されています。文書(回答者)スコアだけを取り出してお使いいただけます。 ただ、ケース数が減少する問題は依然として残っていますのでご注意下さい。添付画像のように文書番号(回答者番号)が併せて保存され、どの文書(回答者)が削除されたか分かるようにはしています。添付画像の場合、先頭から数えて27番目の文書(回答者)が省かれていることが分かります。 なおKH Coderの更新ですが、確実なのはいったん「khcoder3」を削除して、ダウンロードした最新版でやり直していただくという方法です。(最近のバージョンをお使いであれば上書き解凍(Unzip)で問題なく更新できるはずではあるのですが…) |
Beta Was this translation helpful? Give feedback.
-
ケース数の減少対策なお以下の手順で、省かれたケースのところに自動的に空行を入れられました。
添付画像のような結果になりました。こうすれば、他の変数を含むデータと簡単に連結できると思います。 |
Beta Was this translation helpful? Give feedback.
-
対応分析を行い各文書(各回答者)のスコアを出力する方法はあるかという旨のご質問を余所でいただきました。
バグによるエラー
本来は「データ表の種類」として「抽出語×文書」を選択して対応分析を実行し、その結果をCSV形式で保存すれば良いのですが、現時点(3.Alpha.15e)ではKH Coderのバグのため、この操作がエラーになります。
このエラーはRを使う以下の手順で回避できますが、修正版をすでに公開しましたのでKH Coderを更新していただくのが簡単かと思います。詳しくは別途のコメントに書きましたので、このページの下の方をご覧ください。
ケース数の減少
結果を見ると、入力データよりも文書数(回答者数)が減っている場合があります。これは分析対象の語を1つも含まない文書(回答者)が分析から省かれているためです。もし、他の変数との相関を見るために、他の変数を含むデータと結合するような場合には大きな問題になるでしょう。この対策については、別途のコメントに書きましたので、このページの下の方をご参照ください。
一応可能ですがやはりコーディングがお勧め?
以上の操作によって、各文書(各回答者)のスコアを出力して使用することは一応可能です。
しかし単に面倒だというだけでなく、「抽出語×文書」表を使う対応分析は、データの形式上、寄与率の低い(数パーセント)成分が数多く抽出されます。そしてどの成分を分析に使うのかという(やや難しい)選択が必要になります。さらに、これはあくまで私自身の現在の考えですが、分析者が注目したい多様なコンセプト・トピック・事柄みたいなものを、統計的方法・自動処理だけで常に上手く取り出せるとは限らないと思います。
このため、開発者としてはこの方法を使うよりもコーディングをお勧めしています。対応分析や共起ネットワークのような多変量解析から、おもしろそうな成分/コンセプトが見つかったら、それらに関係する語群を手動で指定するのがコーディングです。テキストファイルの中で語を指定して、「コーディングルール・ファイル」を作成します。チュートリアルに付属の「theme.txt」を見て、同じような内容のファイルを「サクラエディタ」「秀丸」「メモ帳」のようなテキストエディタで作ります。
そうすれば、どんな人の回答にそれらの語が含まれるかを他の変数との「クロス集計」で分析できます。また「コーディング結果の出力」で、回答にそれらの語を含むかどうかを0と1のダミー変数で出力できます。「文書検索」画面で「tf順」を選べば、それらの語を多く含む実際の回答を閲覧できます。
コーディング以外では
手動のコーディングではなく、統計的方法を使うことにこだわりたい場合は、寄与率の低い成分が数多く抽出される対応分析よりも、NMFやトピックモデルと呼ばれるような方法が良いかもしれません。NMFやトピックモデルでは、「成分」にあたるものの数を、手で指定できます。ライブラリやコマンドを調べる必要がありますが、Rで実行できるかと思います。(上記の理由からあまりお勧めしないのですが…)
Beta Was this translation helpful? Give feedback.
All reactions