発話対照データベース
1. データベース概要
このデータベースは,日本語学習者(中国語,韓国語,タイ語母語話者)による日本語の発話と,それとほぼ同内容の母語発話とを収集・整理したものです。また比較のため,同じ課題に基づく日本語母語話者の日本語発話データも収集しています。
発話課題は「スピーチ」「ロールプレイ(あらすじあり/あらすじなし)」の2カテゴリに分かれています。
このページでは,日本語・母語発話を文字化したデータを公開します。
2. データ数
発話者数は,
- 中国語母語話者(CN):69名
- 韓国語母語話者(KR):70名
- タイ語母語話者(TH):51名
- 日本語母語話者(JP):57名
です。これらの方々が,スピーチ4課題,ロールプレイ4課題について発話しています(学習者は日本語及び母語で,日本語母語話者は日本語のみで発話しています)。
3. データ収集
データ収集は,以下に示すように,第1期,第2期の2回に分けて行いました。
発話者数 | 収集時期 | 収集場所※1 | ロールカード※2 | 学習者の日本語RP発話者※3 | SPOT※4 | |
---|---|---|---|---|---|---|
第1期 | CN:49 | 2002~2003 | CN:日本国内 | あらすじあり | 学習者同士 | 非実施 |
KR:49 | KR:日本・韓国 | |||||
TH:31 | TH:日本・タイ | |||||
JP:37 | JP:日本国内 | |||||
第2期 | CN:20 | 2003~2004 | CN:中国 | あらすじなし | 学習者と日本人 | 実施 |
KR:21 | KR:韓国 | |||||
TH:20 | TH:タイ | |||||
JP:20 | JP:日本国内 |
※1:第1期の発話者は,出身地,日本滞在歴等の条件が統制されていませんが,第2期の発話者については,「北京/ソウル/バンコクまたはその隣接地域の出身者」「1か月以上の日本滞在経験はない」という条件で統制されています。
※2:第1期のロールプレイのロールカードは,話のあらすじまで指定されていますが,第2期のロールカードは状況設定のみが指定され,話の進め方は発話者に任されています。
※3:第1期の日本語ロールプレイは,学習者同士が「日本人になったつもりで,日本語で」行いましたが,第2期のロールプレイは学習者と日本人とが行いました。
※4:第2期の発話者には,発話の録音の前に,短時間で実施できる日本語テストであるSPOT(Simple Performance-Oriented Test)を実施し,その点数を記録しました。