National Institute for Japanese Language and Linguistics (2019)
National Institute for Japanese Language and Linguistics
(Ogiso Toshinobu,Takada Tomokazu)
国立国語研究所は日本語研究の中核的拠点として、様々な研究資料や言語資源を整備・公開しています。それらの多くはウェブ上で利用可能となっています。代表的なものとして以下のようなものがあります。
■現代日本語書き言葉均衡コーパス(BCCWJ)
https://pj.ninjal.ac.jp/corpus_center/bccwj/
現代日本語の書き言葉の多様性を把握するために構築したコーパスで、書籍、雑誌、新聞、白書、ウェブ、法律などから無作為に抽出した約1億語のテキストに形態論情報、文書構造タグを付与し、オンラインおよびDVDで公開しています。