各コンテンツ・データの紹介
1.縦断調査文字化データ(「会話データ」)
メインコンテンツである会話の文字化データは,縦断調査に沿って,外国人分散地域1年目,2年目,集住地域1年目,2年目の4つのページから構成されています。それぞれについて10~13件の文字化データを公開しており,OPIレイティング(日本語レベル),性別,出身国,母語,職業,日本滞在期間等の情報を参照し,文字化データを閲覧・ダウンロードできるようにしてあります。文字化データは,テキスト形式とPDF形式の両方で提示しています。これは,前者は発展研究等を行う際に加工等がしやすいように,後者は印刷がしやすいように考慮しているためです。
文字化データについては,地域日本語の学習者の会話の談話構造や語彙の使い方などをできる限り見やすく表示するように心がけ,文字化の枠組みもそれに沿う形で調整しました。詳しくは「文字化の枠組みについて」をご覧ください。
ユーザーが談話データ全体を見渡すことで,学習者が自らの興味に基づいた「語り」の中でどのような話題を選択し,また適切な言語表現を表出しているかの傾向を読み取ることができれば幸いです。
2.「研究・分析例」
本プロジェクトでは,これらのデータのパイロット的研究として,いくつかの大会で成果を発表する機会を持ってきました(野山他2008, 2009)。音声データの文字化者が気付いたOPI談話の特徴等が主な内容ですが,その発表資料を,今後データを使って分析する際に参考になるよう公開していく予定です。研究分析例としていくつかの観点が考えられます。例えば,ある特定の年の特定の地域におけるデータを横断的に観察することで,方言の影響や使用語彙の傾向の分析等を行うことが可能です。また,特定の学習者の1年目と2年目のデータを比較することで,日本語レベルの変化と言語生活の状況などの相関性を見ることもできるでしょう。
現段階では,本サイトはあくまで研究の材料を叩き台として提供することを第一目標としているので,データや関連情報を使って,誤用分析や談話分析,あるいは福祉言語学的実践研究等,本グループとの共同研究が実現できれば幸いです。もちろん,このデータをもとに,本グループが想定していない独創的な分析が生まれることがあればそれも幸いです。
3.追加データ・報告書等(「パイロットデータ」)
前述の通り,本ウェブサイトでは,縦断調査による外国人分散地域・集住地域の1年目・2年目のデータに加え,補足的に約50件の文字化データも公開していきます。それには,生活者としての外国人にとどまらず,一般的な日本語学校等の学習者や,日本語を母語としない大学教職員等のデータが含まれます。初級から超級まで様々な文字化データを参照することで,多様な日本語学習者の実態を把握することが期待されます。
また,補足情報として,海外のデータベースづくりについての情報や,一部の音声データを公開していきます。音声データによって,特に方言の使用等,文字化データでは伝わらない音声・音韻的情報や,テスターと学習者の相互行為の様子など,会話の臨場感が少しでも伝われば幸いです。