国立国語研究所コーパス開発センター、『明六雑誌コーパス』を公開(2012-10-31)

meiroku

国立国語研究所コーパス開発センターが『明六雑誌コーパス』を公開した(2012-10-31)。

・『明六雑誌コーパス』
http://www.ninjal.ac.jp/corpus_center/cmj/meiroku/
・国立国語研究所コーパス開発センター
http://www.ninjal.ac.jp/corpus_center/
・国立国語研究所
http://www.ninjal.ac.jp/

これは明治6年(1873年)に森有礼、福澤諭吉、加藤弘之、中村正直、西周、西村茂樹、津田真道、箕作秋坪、杉亨二、箕作麟祥らが結成した明六社の学術啓蒙雑誌である『明六雑誌』(1874~1875年)の全文約18万語分のテキストコーパスで、

・XMLファイル
・形態論情報タブ区切りデータ
・コーパス検索ツール『ひまわり』用のデータ。

の3種類が提供されている。

また、このコーパスは、クリエイティブ・コモンズに基づき、「表示 – 非営利 – 改変禁止 3.0 非移植(CC BY-NC-ND 3.0)」という条件で公開されていることも注目に値するだろう。

なお、同じようにクリエイティブ・コモンズを採用しているコーパスとしては、情報通信研究機構による

・Wikipedia日英京都関連文書対訳コーパス
http://alaginrc.nict.go.jp/WikiCorpus/
・日本人1200人による英語コーパス・The NICT JLE (Japanese Learner English) Corpus
http://alaginrc.nict.go.jp/nict_jle/

や、神戸大学の石川慎一郎さんによる

・アジア圏英語学習者コーパスCEEAUS
http://language.sakura.ne.jp/s/ceeaus.html

・山室信一、中野目徹校注『明六雑誌』(上)(岩波文庫、1999年、1092円)
http://www.amazon.co.jp/gp/product/4003313011/arg-22/
・山室信一、中野目徹校注『明六雑誌』(中)(岩波文庫、2008年、1092円)
http://www.amazon.co.jp/gp/product/400331302X/arg-22/
・山室信一、中野目徹校注『明六雑誌』(下)(岩波文庫、2009年、1260円)
http://www.amazon.co.jp/gp/product/4003313038/arg-22/