コーディング結果が不正確に見える #880
Replies: 5 comments
-
こんにちは、樋口です。書き込みありがとうございます。 「紛争処理」という語が強制抽出されている状態で,コーディング結果の方も見てみていただくといかがでしょう。
現在スクリーンショットを出していただいてるのは1.のみですが,2.や3.の状況はいかがでしょう。 |
Beta Was this translation helpful? Give feedback.
-
この件、再度検証してみました *紛争処理 *紛争処理 1746 5.41% *紛争処理 *紛争処理 1715 5.32% |
Beta Was this translation helpful? Give feedback.
-
こんにちは、樋口です。書き込みありがとうございます。 なにはともあれ,前処理をもう一度行ってみていただけるでしょうか。もし,お使いのKH Coderのバージョンは最新版(3.Alpha.17j)でない場合には,最新版にしてから,再度プロジェクト作成,前処理を行ってみていただけますと幸いです。 それでも同じ結果になりますでしょうか。 もし同じ結果になる場合は,以下のコーディングルールで文書検索を行って,何かヒントがないかどうか探ってみていただければと存じます。
もしかして強制抽出欄に入力したリストの上の方に「○○紛争」のような指定があると,「○○紛争処理」という文字列からは「○○紛争」と「処理」の2語が抽出され,「紛争処理」という語は抽出されていないかもしれません。 どうしても問題が解決しない場合は,データファイルと強制抽出欄で指定している語のリストをお送りいただければ,こちらで検証することも可能ですのでご検討ください。 |
Beta Was this translation helpful? Give feedback.
-
前処理をやり直すことで、この問題は解決しました |
Beta Was this translation helpful? Give feedback.
-
こんにちは、樋口です。書き込みありがとうございます。 前処理の途中で(Windowsを終了するなどして)KH Coderを終了してしまったり,あるいはその他の折にKH Coderが異常終了したりといったことで,データベースが壊れていたのかもしれません。前処理を再度実行すると,プロジェクトのデータベースがほぼ1から再作成されるので,そうしたデータベース破損の問題を修正できます。 |
Beta Was this translation helpful? Give feedback.
-
以下のような簡単なコーディングルールを作って「紛争処理」という言葉をもつテキストをグループしようとしています
*紛争処理
紛争処理 | 弁護士会 | 審査会 | 斡旋 | 調停 | 仲裁
画像をみると、「強制抽出語」として「紛争処理」はちゃんと抽出されているのですが、コーディング結果をエクスポートすると、どの類型にも分類されていません
h1の整数番号をキーにして、元のテキストとコーディング結果を並べて、どの分類にもコーディングされなかったテキスト(400件程度)に、注目すべき特徴語がないかチェックしているところです
こういうことがたまにあって、試行錯誤しているのですが、自分の何か単純ミスを疑いつつ、なかなかすっきりしません
なにか考えられる原因等は考えられないでしょうか
Beta Was this translation helpful? Give feedback.
All reactions