テキスト中に全角バックスラッシュ「\」があると前処理に失敗する #645
Replies: 8 comments
-
こんにちは、樋口です。書き込みありがとうございます。 チュートリアルの「こころ」データを分析できているならば,KH Coderは正常に機能していると考えられます。入力データに原因があるのかもしれません。 前処理を実行する前に,メニューから「前処理」「テキストのチェック」を選択し,自動修正を「実行」していただくと,いかがでしょうか? |
Beta Was this translation helpful? Give feedback.
-
早速のご返信、ありがとうございます。
「テキストのチェック」は正常に終わり、『分析対象ファイル内に既知の問題点は発見されませんでした。前処理を安全に実行できると考えられます。』と表示されます。 |
Beta Was this translation helpful? Give feedback.
-
前処理を実行しますと、1分も経たないうちにこのようなエラーメッセージが表示され、OKを押すとKH Coderが落ちてしまいます。。 |
Beta Was this translation helpful? Give feedback.
-
こんにちは、樋口です。書き込みありがとうございます。 それは不思議ですね。お書きいただいたエラーを見ますと,データ中に半角バックスラッシュ「\」が存在しそうなのです。半角バックスラッシュや半角シングルクォート「'」を検索して,削除してから前処理を実行してみるといかがですか? 【追記】 |
Beta Was this translation helpful? Give feedback.
-
半角バックスラッシュ、半角シングルクォート、どちらもテキストファイル上に存在していませんでした。 他にどのようなことが原因として想定されますでしょうか? |
Beta Was this translation helpful? Give feedback.
-
こんにちは、樋口です。書き込みありがとうございます。 うーん,全角の「\」はいかがでしょう? |
Beta Was this translation helpful? Give feedback.
-
樋口先生、ありがとうございます。 お騒がせいたしました。ありがとうございました。 |
Beta Was this translation helpful? Give feedback.
-
こんにちは、樋口です。書き込みありがとうございます。 いえいえ,本来は全角の「\」があっても問題なく動作すべきですので,今し方そのように修正いたしました。この問題はLinuxおよびMac上で発生していましたが,次期リリース以降では発生しないはずです。 |
Beta Was this translation helpful? Give feedback.
-
樋口先生、お世話になります。
KH Coderを使って日本語の文章を解析しようとしているのですが、うまくいかないため質問させて頂きます。
現象としては、15000行ほどの日本語テキストデータに対して「前処理の実行」をすると、KH Coderが下記のエラーを吐いて落ちてしまいます(エラーは文末に転記します)。
実行環境は、Mac Mojave 10.14.6にXQuartz 2.7.11 (xorg-server 1.18.4)をインストールし、KH Coder(khcoder3)を実行しています。
下記の対処法はすべて試しましたが、効果がありませんでした。
・Macの再起動
・KH Coderの再インストール
・セキュリティソフトやファイアウォールの停止
・dep/mysql-5.6.17/khc.cnfをテキストエディタで開き,3行を追加して上書き保存
default-storage-engine=MyISAM
default-tmp-storage-engine=MyISAM
skip-innodb
・< や >、絵文字が解析対象ファイルに混じっていないことを確認
また、チュートリアルの日本語の「こころ」に前処理を行うと、正常に実行されます。
英語文章のデータは問題なく処理されており、日本語だけに起こる問題のようです。
上記以外の対処法がございましたら、ご教示頂けますと幸いです。
よろしくお願いいたします。
ターミナル表示内容(クリックで表示)
Beta Was this translation helpful? Give feedback.
All reactions