「20世紀初期総合雑誌コーパス」の構築による確立期現代語の高精度な記述
【研究分野】国語学
【研究キーワード】
コーパス / 記述研究 / 現代語確立期 / 総合雑誌 / 女性雑誌 / XML / 構造化テキスト / 検索システム / 形態素解析 / 言語の記述研究 / 20世紀初期
【研究成果の概要】
年の情報技術の進展が,日本語研究を大きく進展させる可能性をもつ方向として,電子化された大量の資料(コーパス)を,コンピューター処理を交えて活用することで,従来には望めなかった高精度な記述を達成することがあげられる。本研究では,高水準のコーパスを構築し,これを活用した高精度の記述研究を展開することで,コーパスを用いた日本語研究を新しい段階に進めることを目指した。
具体的な研究対象を,現代語の書き言葉が確立する20世紀初期によぐ読まれた雑誌に定め,これを「20世紀初期総合雑誌コーパス」として構築し,このコーパスを対象に,さまざまな側面から研究を実践した。「20世紀初期雑誌コーパス」は,当時もっともよく読まれた総合雑誌『太陽』を対象とした『太陽コーパス』と,女性を読者とする雑誌のなかでよく読まれた『女学雑誌』『女学世界』『婦人倶楽部』を対象とした『近代女性雑誌コーパス』からなる。『太陽コーパス』は,CD-ROM版を出版社を通して刊行し,『近代女性雑誌コーパス』は,CD-ROMを配布する形で公開した。
(1)「20世紀初期総合雑誌コーパス」の構築方法に関して,(1)資料の選定方法,(2)資料特性を生かした電子化の方法,(3)電子化テキストを言語コーパスとして活用するためのソフトウェアの開発の三つの局面から研究を進め,文献資料をもとにコーパスを構築する方法論の研究を進展させた。
(2)「20世紀初期総合雑誌コーパス」を活用した記述研究は,文字・表記,語彙,文法,文体の各側面から,問題となる個別現象を詳細に検討し,コーパスデータから機能的に導き出される言語特徴を整理していくことを通して,幅広く展開させた。
(1)(2)の研究成果は,主要部分は論文集としてまとめて刊行したほか,学術誌などにも掲載された。
【研究代表者】