国立国語研究所、『国民之友コーパス』(Ver.1.0)を公開(2014-10-01)

国立国語研究所コーパス開発センターが『国民之友コーパス』(Ver.1.0)を公開した(2014-10-01)。

・『国民之友コーパス』(Ver.1.0)
http://www.ninjal.ac.jp/corpus_center/cmj/kokumin/
・近代語のコーパス
http://www.ninjal.ac.jp/corpus_center/cmj/kokumin/
・国立国語研究所コーパス開発センター
http://www.ninjal.ac.jp/corpus_center/
・国立国語研究所
http://www.ninjal.ac.jp/

『国民之友』(民友社、1887年~1898年)は徳富蘇峰らが刊行していた雑誌であり、日本で初の本格的な総合雑誌として知られている。今回公開されたのは全372号のうち1号~36号(1887年~1888年)の全文の形態論情報(単語情報)付きコーパスだ。総語数は約101万語、著者数は80名以上とのこと。

さらに、利用条件としてクリエイティブ・コモンズを採用し、「表示 – 非営利 – 改変禁止 3.0 非移植(CC BY-NC-ND 3.0)」というポリシーをとっている。また、公開後、すぐに改訂が行われ(2014-10-08)、現在はVer.1.1となっている。

なお、これは、国立国語研究所が中心になって進めている

・NINJAL通時コーパスプロジェクト
http://historicalcorpus.jp/

の成果である。