KH Coder の分析対象言語 (現代語・古代語) について #1177
-
お使いのKH CoderのバージョンKH Coder 3 (Base Edition アカデミック・ライセンス) 購入予定 ご質問の内容をお書きくださいKH Coder で古フランス語・中仏語のテクスト分析を行うことは可能でしょうか ? このサイト (https://khcoder.net/FAQ.html#kobun) によれば、古代日本語の分析については可能であるとのことですが、その他の言語の古代語の分析は可能でしょうか ? |
Beta Was this translation helpful? Give feedback.
Replies: 1 comment 1 reply
-
インストールしたそのままの状態では、日本語の古文も、古フランス語・中仏語も分析できません。 ですが古文用の形態素解析辞書「古文用UniDicS」をインストールして、MeCabとKH Coderの設定を行なうことで、日本語の古文を分析できるようになります。近世江戸口語、近世上方口語、近世文語、中世口語、中世文語、和歌、中古和文、上代語などの中から、ご自身のデータに適した辞書をお選びください。 ご覧いただいたFAQ項目で示しているのは、だいぶ古いバージョンの中古和文UniDicを使うよう設定した例です。新しいバージョンを使われる際は、品詞構成が変わっていないかといったことを確認しつつ、設定していただくのが確実です。 フランス語に関しては、こうした古文用の辞書、古文用UniDicSにあたるものが、存在するのかどうかも私はわかりません。存在しても、KH Coderで使用している形態素解析ソフトでその辞書を使えるのかどうかが問題になります。分析できないとお考えいただくのが確実かと思います。現代フランス語を分析する設定で、重要な一部の語を「強制抽出」で取り出しながらカウントするといった形がせいぜいではないかと思います。 なおGoogle検索をすると、古フランス語の形態素解析(lemmatization + pos tagging)を行なう試みはあるようです。ただ、成果が誰でも使える形になっているのかどうかよくわかりませんでした。 |
Beta Was this translation helpful? Give feedback.
インストールしたそのままの状態では、日本語の古文も、古フランス語・中仏語も分析できません。
ですが古文用の形態素解析辞書「古文用UniDicS」をインストールして、MeCabとKH Coderの設定を行なうことで、日本語の古文を分析できるようになります。近世江戸口語、近世上方口語、近世文語、中世口語、中世文語、和歌、中古和文、上代語などの中から、ご自身のデータに適した辞書をお選びください。
https://clrd.ninjal.ac.jp/unidic/download_all.html#unidic_chj
ご覧いただいたFAQ項目で示しているのは、だいぶ古いバージョンの中古和文UniDicを使うよう設定した例です。新しいバージョンを使われる際は、品詞構成が変わっていないかといったことを確認しつつ、設定していただくのが確実です。
フランス語に関しては、こうした古文用の辞書、古文用UniDicSにあたるものが、存在するのかどうかも私はわかりません。存在しても、KH Coderで使用している形態素解析ソフトでその辞書を使えるのかどうかが問題になります。分析できないとお考えいただくのが確実かと思います。現代フランス語を分析する設定で、重要な一部の語を「強制抽出」で取り出しながらカウントするといった形がせいぜいではないかと思います。
なおGoogle検索をすると、古フランス語の形態素解析(lemmatization + pos tagging)を行なう試みはあるようです。ただ、成果が誰でも使える形になっているのかどうかよくわかりませんでした。
https://aclantho…