国立国語研究所
日本語学習者会話データベース 縦断調査編

はじめに

データベース構築の背景

 1990年の入管法の改正・施行以来,我が国に在留する外国人登録者数は増加の一途を辿り,家族を伴った外国人定住者の数も増えてきています。現在,多様な言語・文化背景を持った幅広い年齢層の人々が,地域社会のさまざまな場面で,日本人と多様なかかわりを持ちながら生活していますが,今後もこの状況は続くものと推測されます。こうした多様な価値観を持った人々が共存する社会を多文化共生社会とするならば,社会状況に応じた外国人受入れのための適切な方策が必要となってくるとともに,日本語の学習を必要とする住民(言語生活者)の需要に応じた言語教育の展開も,ますます期待されてくることでしょう。


データベースの目的

 このデータベースは,こうした展開の充実へ向けた基礎資料として活用されるべく,以下の1.~3.を目標として構築されるものです。

1.多文化共生社会に対応した日本語教育方法・内容の構築に向けた基礎資料を提供すること
2.多角的な観点からのデータベース作りを試み,成果を報告することによって,複合領域としての日本語会話研究や日本語教員養成の新たな展開に貢献すること
3.口頭能力テストの重要性や多義性について喚起するとともに,その評価の過程やフィードバック等を通じて得られる情報の有意義性に関する認識の深化を促すこと

 本プロジェクトでは,少数(20数名)の縦断(同一の対象者を定期的に調査した)データとともに,多数(300人以上)の横断(異なる対象者を大量に調査した)データも収集し,ウェブ上に公開しています(「日本語学習者会話データベース」)。


データベース公開の意義

 「日本語会話データベース 縦断調査編」は,ウェブサイト公開により全世界の人々が無料でアクセスできるようになっています。ユーザーが,縦断調査の対象地域(外国人分散地域と集住地域)を選んで,調査1年目と2年目における,OPIテスターと学習者の会話データを閲覧することができます。また,簡単な検索システムを使うことで,レベルや性別,職業などの位相ごとに閲覧したいデータを抽出できるようになります。また,関連する調査や分析・発表例などの資料も紹介しており,いずれも,コピーやダウンロード等が可能です。

 このように縦断調査の成果を広く公開することには,以下の3つの意義があると考えられます。

1.地域の日本語教育,言語生活の実態を広く知ってもらうことができる。
2.研究者,学生,学習者,教育関係者,地域のボランティア等の,あらゆる人が閲覧できる。

 すなわち,データの汎用性の向上,また地域日本語教育の実態を広く知ってもらうことです。 従来の会話の分析・研究データは,会員登録制であったり有料であったりするために, 日本語学・日本語教育学の専門家だけが自己の調査という目的のために使用できる場合が多かったものと思われます。 しかしながら,ウェブで簡単にリンクを辿りながらデータを閲覧・ダウンロードできることで, 他分野の視点から日本語会話を観察する研究者・学生や,地域での日本語の諸活動に携わるボランティアなど, あらゆる主体がデータを活用することが可能となるでしょう。近年叫ばれる日本語教育・言語教育の多様化や, 領域横断的・協働実践的な研究の在り方を考える際に,これらの意義は大切にしたいことであるといえます。

3.調査の軌跡,分析例を示すことで,社会言語学の研究・実践の在り方を共有できる。

 すなわち,広く公開し,専門家以外の人にも使ってもらうことで,今後の研究,教育,地域活動等の在り方を考えるための叩き台にすることです。 地域日本語会話の縦断調査の軌跡を,文字化資料やその分析例とともに提示することで, 閲覧者が地域生活者としての日本語学習者の言語生活の実態を知ることができるようなデータベースの構築を目指します。 これらの資料を,各ユーザーがそれぞれ独自のやり方で活用し,より多様な日本語・言語生活の在り方を考え, それを共有するきっかけを考えることができれば幸いです。


 これらの意義を最大限に実現するため,現段階においては,ウェブサイト及び各文字化データ,資料等を,用途を明確化せずに示しています。 ユーザーがそれら資料を閲覧・ダウンロードし,共同研究や実践の課題を探求したり,各自の方法で分析したりすることが期待されます。 また,今後同じような形式や機能のデータ集積が行われ公開されることが望まれます。


各コンテンツ・データの紹介

1.縦断調査文字化データ(「会話データ」)

 メインコンテンツである会話の文字化データは,縦断調査に沿って,外国人分散地域1年目,2年目,集住地域1年目,2年目の4つのページから構成されています。それぞれについて10~13件の文字化データを公開しており,OPIレイティング(日本語レベル),性別,出身国,母語,職業,日本滞在期間等の情報を参照し,文字化データを閲覧・ダウンロードできるようにしてあります。文字化データは,テキスト形式とPDF形式の両方で提示しています。これは,前者は発展研究等を行う際に加工等がしやすいように,後者は印刷がしやすいように考慮しているためです。

 文字化データについては,地域日本語の学習者の会話の談話構造や語彙の使い方などをできる限り見やすく表示するように心がけ,文字化の枠組みもそれに沿う形で調整しました。詳しくは「文字化の枠組みについて」をご覧ください。
 ユーザーが談話データ全体を見渡すことで,学習者が自らの興味に基づいた「語り」の中でどのような話題を選択し,また適切な言語表現を表出しているかの傾向を読み取ることができれば幸いです。


2.「研究・分析例」

 本プロジェクトでは,これらのデータのパイロット的研究として,いくつかの大会で成果を発表する機会を持ってきました(野山他2008, 2009)。音声データの文字化者が気付いたOPI談話の特徴等が主な内容ですが,その発表資料を,今後データを使って分析する際に参考になるよう公開していく予定です。研究分析例としていくつかの観点が考えられます。例えば,ある特定の年の特定の地域におけるデータを横断的に観察することで,方言の影響や使用語彙の傾向の分析等を行うことが可能です。また,特定の学習者の1年目と2年目のデータを比較することで,日本語レベルの変化と言語生活の状況などの相関性を見ることもできるでしょう。
 現段階では,本サイトはあくまで研究の材料を叩き台として提供することを第一目標としているので,データや関連情報を使って,誤用分析や談話分析,あるいは福祉言語学的実践研究等,本グループとの共同研究が実現できれば幸いです。もちろん,このデータをもとに,本グループが想定していない独創的な分析が生まれることがあればそれも幸いです。


3.追加データ・報告書等(「パイロットデータ」)

 前述の通り,本ウェブサイトでは,縦断調査による外国人分散地域・集住地域の1年目・2年目のデータに加え,補足的に約50件の文字化データも公開していきます。 それには,生活者としての外国人にとどまらず,一般的な日本語学校等の学習者や,日本語を母語としない大学教職員等のデータが含まれます。初級から超級まで様々な文字化データを参照することで,多様な日本語学習者の実態を把握することが期待されます。
 また,補足情報として,海外のデータベースづくりについての情報や,一部の音声データを公開していきます。音声データによって,特に方言の使用等,文字化データでは伝わらない音声・音韻的情報や,テスターと学習者の相互行為の様子など,会話の臨場感が少しでも伝われば幸いです。


会話の実際と文字化の枠組み

 文字化データ内の記号等については,凡例をご覧ください。ここでは文字化担当者の気付き及び文字化の方針が,具体的にどのように文字化に反映されているのかを例を挙げながら示します。


1.会話データの外形的側面について

 学習者の音声・文法、あるいは丁寧体/普通体の使い分けなどといった会話データの外形的特徴については,日本語学習者としての特徴も見られるほか,当該地域の方言が反映していると考えられる箇所も見られます(例1)。 とくに発話者の特徴的な音声については,読みやすさを考えて音声かな表記で表しました。 文字化担当者で発話者の意図された表現が想定できるものについては[ ]でそれを示しています(例2)。 なお,発話者の日本語に英語の語句が混入している(と考えられる)部分は,できるだけ発話者の特徴的な音声を聞こえた通りに(かつ読みやすく)表記するために,今回の会話データでは音声カナ表記で示しています(例3)。

(例1)
I: やっぱり,亡くなったの人に大切な思いさすれば,やっぱり,やらないのほうがいいと思うで,だけどね{笑}。

(例2)
I: サポートはね〈うん〉,やっぱり学校のほうが〈ふんふんふん〉いて,と,先生と話してから〈ふーん〉,じゅーく[塾]に入れて〈あー〉,あと,お友だちも,ね,手伝って。

(例3)
I: あのー,なんだっけ,チクンライス[チキンライス]?。
T: チキンライス?。
I: ええ,はい。


2.学習者の談話構造を見る(会話データ全体を見渡す)

 会話データの内容を見ると,短期間のうちに日本とブラジルの間を頻繁に往来しているといった学習者の背景や,子どもが通う小学校の教師とのやりとり等,生活の状況を読み取ることができます。 そのような学習者の「語り」がどのように行われるのかについて,文字化の際には,特に沈黙の現れ方や非言語行動との関連を見ることができるように心がけました。 沈黙については,会話のどの部分で出てくるのかを示すことに重点を置いています。文節内における2拍から3秒程度の沈黙については^で表しています(例4)。また,3秒以上の長い沈黙については 、、、で示しています(例5)。
 非言語行動についてはできるだけ拾って表記するようにしました。{笑}{ブレス}{咳払い}{舌打ち}などで示しています(例6,例7)。

(例4)
I: 一方的に自分の都合だ,が悪いから,もう,バサッと切る^ようなことは,ちょっと,何,なんでしょう,えーと,うん〈うーん〉,じゃ,うーん,弱肉強食のような〈ええ,ええ〉感じがします。

(例5)
T: えー,ポルトガル語と日本語の授業と,どっちがおもしろいですか?。
I: 日本語のほうは,も,うーん,日本の文化はお,先生たち教えるから,えー,そ,それは楽しい〈ふん〉。
   それ,ポルトガル語は,うーん,、、、,本とか〈うん〉,書いた人,なに考えたとか〈ふーん〉,そういうこと。

(例6)
T: 何か買いましたか{笑}?。
I: いや,何も買って,買ってないです。
T: え,うん?。
I: うん,何も{笑}。

(例7)
I: 街,あちこち,全部,日本語教室が〈はい〉あったけども,【地名1】はないですね〈はい〉って言ったら,そうだ〈うんうんうん〉,わがった,わかりました〈うんうん〉,今度相談して作りましょう〈はい〉って〈はい〉,言って,{ブレス},2003年か,***1〈はい〉,2002年,***。
   このとき〈うん〉,8月に頼まれて〈はい〉10月に勉強始まったのよ。


ACTFL-OPIテストとは

 ACTFL-OPIは,全米外国語教育協会が開発した汎言語的に用いることができる会話能力テストです。 近年,日本においてもそのテスター数が増えつつあり,数々の日本語教育の現場において,その学習効果の評価に利用されてきています。 こうした中,様々な背景を持つ日本語を母語としない人々が多く存在する地域の日本語教室において,その活用の意義は大きいと思われます。 地域生活において,会話は重要なものであり,多様な学習者の会話能力を的確に把握することは,多様な学習者に対して柔軟に対応することを期待される地域の現場=学習支援プログラムの充実に向けても,欠かせない基盤となりえます。

 これまでの非母語話者の言語運用能力に焦点を当てた研究では,運用能力の正確な把握のために,彼らの言語生活や環境を考慮することが重要であることが指摘されています。 松尾(2000)は,インタビュー調査により,特定の地域における日本語の会話能力とその規定要因(世代差・生年・小学校入学後の両親と使用言語など)との関係性を調査しています。 その中で,会話能力を規定する説明変数の検出のためには,より広い調査が必要であると述べています。

 OPIテストに関係する先行研究もいくつかあります。鎌田(2005)は,OPIの概要を述べた後で,日本語学習者が日本語を媒介とした言語活動を行っている実際の接触場面を,研究することの必要性を提唱しています。 学習者の主体的な学習プロセスの実態,およびその実態をとりまく言語生活・言語環境の把握の必要性を論じています。

 また,OPIをより応用的に活用している研究も存在します。 堀井(1998)は,OPIテストを行った後で,被験者に判定結果を伝えるのみならず,できる限り学習の参考になるようなコメントをフィードバックした,という実践報告を行っています。テープやVTRを用いたテスターによるフィードバックの課題を探っています。 渡辺(2005)は,運用能力という概念を含めた,OPIテストそのものの妥当性とその過去20年にわたる議論を紹介しています。 それと同時に,OPIを使った先行研究を紹介しながら,第2言語習得から言語行動の解明にOPIが応用の可能性を持っているということを示唆しています。 助川・吹原(2008)は,在日インドネシア人就労者の日本語習得とその促進要因を探るために,OPIを活用して100人の茨城県大洗町に在住するインドネシア人就労者の口頭能力を測定,分析しています。 その結果として,大多数(6割以上)が初級の中レベルにとどまっていることを指摘するとともに,その要因について追究しています。 この研究は,縦断調査として行われており,今後の成果・報告が期待されます。


課題と今後の展望

 本ウェブサイトについて,当面の課題として,以下の3点が挙げられます。


1.さらなるデータの充実化

 縦断調査として,各学習者の3年目以降の会話データも追加・更新していく予定です。 また,学習者の言語生活,形成的評価の過程等の情報を中心に,よりデータを充実させていくことも課題となります。
 また,上記に関連して,文字化の枠組みの再考や関連情報の内容の吟味等,学習者会話データベース一般として,どこまで現実に即したデータ提供が可能かという課題もあります。 現在のところ実現はできていませんが,文字化データや関連情報を,学術研究向けと一般(実践者・教育者)向けとの2通りで作成・公開するなどの方法も考えられるでしょう。 用途に応じて複数の様式で作成することは,データベースの多様な活用の実現につながります。


2.個人情報等の問題

 現在,「日本語会話データベース 縦断調査編」ウェブサイトには,認証システムは設けていませんが,データの整備・公開の状況によっては,今後データベースの使用を会員制・許可制にすることも考えられます。 地域日本語教育の担い手は,談話において身の回りのことを語ることもしばしばです。 また,地域日本語教育で重要な位置を占める方言等の手掛かりとなる,音声データの扱いについても課題です。実践・研究の倫理の在り方とともに,今後議論していきたい課題です。


3.より有意義な活用例の提示

 ユーザーが日々の研究,実践,地域活動において,より建設的な効果を生み出せるようなデータを提供できることが,本データベースの一つの願いです。本研究所では,縦断調査編に加え,より横断的に大量のデータを公開する日本語学習者会話データベースも提供しています(「日本語学習者会話データベース」)。これまでの学習者会話コーパスには見られないような,データベースの意義や用途を考えていくためにも,ウェブサイト上に活用例を提示することは不可欠でしょう。
 情報量と利便性を兼ね備え,また量的分析と質的分析の両方を可能にするような,より包括的なデータ集積と公開は,福祉言語学の観点からみても大きな課題と展望になるでしょう。


今後の展望

 本調査を通して得られる情報が有意義なものとなるために,国立国語研究所の本中期計画(2005~2009年度)の間に,留学生・就学生をはじめ,地域で生活する外国人住民の日本語会話能力の状況について,できる限りその実態を探るべく,ACTFL-OPIを活用して,調査を試みていきます。
 この研究において,「日本語(で行う)コミュニケーション」を,仮に「ヒト,モノ,コトなどとの間に何らかの関係性を作るために,日本語(ことば・音声)そのものや,身体表現等を活用して,ある方向に働きかけをすること」と定義するならば,OPIという限られた会話場面ではあるにしても,日本語を用いた自然会話(に限りなく近い)場面でのコミュニケーションの実態を把握することができるものと考えます。