情報通信研究機構(NICT)、Wikipedia日英京都関連文書対訳コーパスを公開(2010-10-27)

WikiCorpus

情報通信研究機構(NICT)がWikipedia日英京都関連文書対訳コーパスを公開している(2010-10-27)。

・Wikipedia日英京都関連文書対訳コーパス
http://alaginrc.nict.go.jp/WikiCorpus/
・情報通信研究機構情報分析研究室
http://www2.nict.go.jp/univ-com/info_analysis/
・情報通信研究機構多言語翻訳研究室
http://www2.nict.go.jp/univ-com/multi_trans/
・情報通信研究機構(NICT)
http://www.nict.go.jp/

これはWikipediaの日本語記事のうち京都関連のものを英語に翻訳し、日英両語の対訳にしたコーパスデータである。

なお、データそのものは学校、鉄道(交通関連)、旧家、建造物、神道、人名、地名、伝統文化(一部の現代文化を含む)、道路、仏教、文学、役職・称号、歴史、神社仏閣、天皇というカテゴリ別に公開されている。

また、データは、クリエイティブ・コモンズに基づき、「表示 – 継承 3.0 非移植(CC BY-SA 3.0)」という方針で公開されている。