新聞記事データについて #890
Unanswered
kishimoto97
asked this question in
1.2 Q&A (in Japanese)
新聞記事データについて
#890
Replies: 2 comments
-
こんにちは、樋口です。書き込みありがとうございます。 新聞データベースサイトの場合は,データを自動的に取り出すこと(スクレイピング)を規約で禁じているところがほとんどだと思います。したがって,1つ1つコピペということになるでしょうか。もしもコピペでの収集まで規約で禁じられていた場合は,手入力でしょうか。 #KHCoderの本にも書きましたが,90年代以降くらいの新聞記事なら,日外アソシエーツが販売しているデータ集を利用できます。ただし,記事を検索して取り出すためのプログラムを自分で書く必要がある点にご注意下さい。データの収集・整備は,なかなか一筋縄では難しい時が多いように思われます。 |
Beta Was this translation helpful? Give feedback.
0 replies
-
樋口さま
丁寧なご回答誠にありがとうございます。
試行錯誤しつつやっていきます。
2020年1月9日(木) 14:59 HIGUCHI Koichi <[email protected]>:
… こんにちは、樋口です。書き込みありがとうございます。
新聞データベースサイトの場合は,データを自動的に取り出すこと(スクレイピング)を規約で禁じているところがほとんどだと思います。したがって,1つ1つコピペということになるでしょうか。もしもコピペでの収集まで規約で禁じられていた場合は,手入力でしょうか。
#KHCoderの本 <https://amzn.to/36y6GfQ>
にも書きましたが,90年代以降くらいの新聞記事なら,日外アソシエーツが販売しているデータ集
<http://www.nichigai.co.jp/sales/corpus.html>
を利用できます。ただし,記事を検索して取り出すためのプログラムを自分で書く必要があります。
—
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub
<https://github.com/ko-ichi-h/khcoder/issues/139?email_source=notifications&email_token=AOHECKXMPE3W3K2SLUTRM33Q424N5A5CNFSM4KEI7HH2YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOEIPCZRA#issuecomment-572402884>,
or unsubscribe
<https://github.com/notifications/unsubscribe-auth/AOHECKUFRW4S32DEWRNDOMTQ424N5ANCNFSM4KEI7HHQ>
.
|
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
樋口様
お世話になっております。
論文のため、新聞記事を分析したいと考えているのですが、その際、新聞データベースサイトから一つ一つコピーペーストする以外に方法はないのでしょうか。
khcoder側の問題ではないかもしれませんが、ご教授いただけると大変助かります。
Beta Was this translation helpful? Give feedback.
All reactions