住みやすい国プロジェクトにようこそ

プロジェクト紹介

はじめに

村田裕美子(LMU München, ミュンヘン大学)



     本プロジェクトはヨーロッパの日本語教育に貢献することを目的に、ドイツで開始されたプロジェクトです。とりわけ、ドイツ語話者の日本語学習者の話し言葉と書き言葉のサンプルを集め、習得研究に活用することを目指してスタートしました。話し言葉はOPIを用いて、会話の音声を文字化する方法で作成し、書き言葉は「住みやすい国の条件と理由」というトピックで意見文を書いてもらう方法で作成しました。当初は、代表者の個人プロジェクトとして細々と行っていましたが、ヨーロッパ日本語教育シンポジウムなどの学会での発表をきっかけに、次第に研究協力者が増え、自発的に成長したプロジェクトです。
     2023年4月の時点で、話し言葉編では、ドイツ語話者の日本語学習者45名(初級15名、中級15名、上級15名)の文字化資料を公開しています。書き言葉編では、合計147名のデータを公開しています。ドイツ語話者(初級20名、中級20名、上級20名)、セルビア語話者(中級20名)、クロアチア語話者(中級20名)、スロベニア語話者(初級3名、中級13名、上級1名)、ボスニア語(初級4名、中級4名、上級1名、未受験者1名)の日本語学習者127名のデータ、日本の大学生20名のデータを公開しています。なお、話者の区分は収集地をベースにしています。今後、他のヨーロッパ地域の学習者データも収集・公開していく計画です。

謝辞

     本コーパスの発話データは、ドイツ・ミュンヘン大学(Ludwig-Maximilians-Universität München)、スイス・チューリヒ大学(Universität Zürich)、セルビア・ベオグラード大学(Универзитет у Београду)、クロアチア・プーラ大学(Sveučilište Jurja Dobrile u Puli)、スロベニア・リュブリャナ大学(Univerza v Ljubljani)、サラエボ大学(Univerzitet u Sarajevu)、日本・早稲田大学の学生および関係者によるものです。彼らの協力なしでは実現できません。また、言語能力の測定のため、筑波大学グローバルコミュニケーション教育センターで開発された「SPOT」のウェブ版を使用しています。関係者の皆様に感謝申し上げます。

研究代表者


    ■ 村田裕美子(LMU München, ミュンヘン大学)

研究協力者


    ■ 宮野谷 希(サラエボ大学)
    ■ 守時なぎさ(リュブリャーナ大学)
    ■ 中島晶子(パリ・シテ大学)
    ■ Kristina Hmeljak Sangawa(リュブリャーナ大学)
    ■ Irena Srdanovic(プーラ大学)
    ■ Divna Trickovic (ベオグラード大学)
    ■ 李在鎬(早稲田大学)(Web Master)

Q: 論文で引用したいと思います。どうすれば良いでしょうか。

    A: 村田2021(村田 裕美子(2021)「小規模コーパスの構築方法」李在鎬編『データ科学×日本語教育』ひつじ書房, pp.34-53)を確認したあと、参考文献に引用してください。

Q: 研究メンバーに加わりたいです。参加資格はありますか。

    A: ありません。本サイトの「問い合わせ」に書いてある村田のメールアドレスにご連絡ください。

Q: 「ドイツ語話者日本語学習者コーパス」との関係を教えてください。

    A: 「ドイツ語話者日本語学習者コーパス」は、「住みやすい国コーパス」の前身のような存在で、主にドイツ語話者のデータを収録したコーパスです。コーパスに関する詳細情報は、「ドイツ語話者日本語学習者コーパス」でご確認ください。

Q: 「話し言葉編」の音声は公開しないのですか。

    A: 音声データは個人情報が含まれているため、公開できません。

Q: 調査方法の詳細を知りたいのですが、どの論文を見るのが良いでしょうか。

    A: 本サイトの「研究紹介」>「研究成果」にある村田2021をご覧ください。

Q: 利用申し込みのためのウェブフォームが表示されませんが。

    A: 申込用のフォームはGoogleフォームを使っています。地域によってはGoogleフォームが利用できない場合があり、フォームが表示されないと思います。VPNサービスを利用するなどして、アクセスしてみてください。

Q: 母語はどのような基準で設定していますか。

    A: ヨーロッパの場合、地域的な特徴から複数言語環境で日本語を学習する人が多く、母語を一義的にきめることが難しい人が少なくありません。例えば、スロベニアで収集したデータの中には、クロアチア語やルーマニア語やトルコ語の言語環境で育った学習者などがいます。母語に関連づけた考察を行う場合は、必ずコーパス内に収録されている「readme.xlsx」ファイルの「学習者データ」タブの「教育言語」や「母語」のセルを確認してください。

「よくある質問集」にないことで、ご質問がある人は以下のアドレス(ミュンヘン大学・村田裕美子宛)にメールでご連絡ください。


コーパス紹介と利用方法

     このサイトでは、「住みやすい国コーパス」として、次の2種類のコーパスを公開しています。
     ・「住みやすい国コーパス話し言葉編」:45名分のOPI発話の文字化資料
     ・「住みやすい国コーパス書き言葉編」:147名分の意見文

     研究成果の共有を目的に、ウェブサイトにてデータを公開します。本コーパスがヨーロッパの日本語教育研究の発展および第二言語習得研究に貢献することを願っています。利用規約に従って、お使いください。なお、データ公開はテキストファイルのみです。検索システムなどは入っていませんので、ご了承ください。






ご利用にあたっては、以下の利用規約に同意していただく必要があります。

話し言葉編とは

    「住みやすい国コーパス話し言葉編」とは、OPIの基準に沿ってレベル判定をした日本語学習者のインタビューデータを文字化し、まとめたものです。OPI基準の話し言葉コーパスでは、「KYコーパス」が広く知られていますが、KYコーパスは、中国語、英語、韓国語話者のデータしか含まれていません。そのため、本研究グループでは、ドイツ語話者のための話し言葉コーパスを作成することにしました。
     本コーパスには、現在のところ、45名のデータが収録されています。45名の内訳は、初級学習者15名、中級学習者15名、上級学習者15名となっています。
     話し言葉編の協力者はドイツ、ミュンヘンに在住するドイツ語を母語とする日本語学習者です。「母語」の定義は複雑ですが、ここでは学校教育をドイツ語で受けた者をさします。コーパス名に「ドイツ語母語話者」と入れていないのは、今後「母語」を限定せず、ドイツ語圏で学ぶ日本語学習者のデータを加えていきたいと考えているからです。したがって、今後もデータを増やしたり、改訂したりする予定です。

話し言葉編の特徴

    1. OPI準拠であること:多くの話し言葉コーパスにおいて、OPIが利用されている現状を踏まえ、本コーパスもOPIに準拠してデータを収集しています。これにより、他の話し言葉コーパスとの比較が容易になると考えています。
    2. 客観テストを実施していること:主観テストであるOPIに加え、「SPOT」 を実施し、客観テストによる言語能力の測定を行っています。
    3. 学習者の背景を示していること:学習者の日本語学習歴や日本滞在歴などの学習背景情報をセットで公開しています。

ダウンロード方法

    1. フォームに必要事項を入力してください。
    2. 送信ボタンをクリックした直後に、ダウンロード用のリンクが表示されます。

書き言葉編とは

    「住みやすい国コーパス書き言葉編」とは、大学生および大学院生が「住みやすい国の条件とその理由」というテーマで書いた作文を収録したものです。高等教育を受けている大学生に適した社会的なテーマを扱いたいと考え、ドイツ語話者を中心に、さまざまな国の学生に協力してもらい、書き言葉コーパスとしてまとめることにしました。
     本コーパスには、現在のところ、147名のデータが収録されています。147名の内訳は、ドイツ語を母語、またはドイツ語で教育を受けた日本語学習者初60名(級20名、中級20名、上級20名)、セルビア語を母語、またはセルビア語で教育を受けた日本語学習者中級20名、クロアチア語を母語、またはクロアチア語で教育を受けた日本語学習者中級20名、スロベニア語を母語、またはスロベニア語で教育を受けた日本語学習者17名、ボスニア語を母語、またはボスニア語で教育を受けた日本語学習者10名、日本語を母語、または日本語で教育を受けた学生20名となっています。
     書き言葉編の協力者はドイツ、スイス、セルビア、クロアチア、スロベニア、ボスニア、日本に在住の大学生および大学院生です。話し言葉編と同様に、「母語」の定義は複雑ですが、話者の区分は収集地をベースにしています。詳細はコーパス内のreadmeファイルをご覧ください。
     

書き言葉編の特徴

    1. 様々なレベルの学習者が扱えるテーマ:課題「住みやすい国の条件とその理由」は、存在文や理由文を使えば、初級であっても文を産出させることができるようになっています。
    2. 大学生に適した社会的なテーマ:政治、経済、文化などさまざまな視点から記述することが可能で、多くの人に興味を持ってもらえるようなテーマになっています。
    3. 客観テストを実施していること:GLJコーパス話し言葉編と同様、「SPOT」 を実施し、客観テストによる言語能力の測定を行っています。
    4. 学習者の背景を示していること:学習者の日本語学習歴や日本滞在歴などの学習背景情報をセットで公開しています。

ダウンロード方法

    1. フォームに必要事項を入力してください。
    2. 送信ボタンをクリックした直後に、ダウンロード用のリンクが表示されます。

2022.11:住みやすい国コーパス Ver 1.0

    更新内容:ドイツ、セルビア、クロアチア、日本のデータを公開。

2023.1:住みやすい国コーパス Ver 1.1

    更新内容:テキストファイルの文字コードをUTF8形式に統一。

2023.1:住みやすい国コーパス Ver 1.2

    更新内容:スロベニアの学習者データを追加。

2023.4:住みやすい国コーパス Ver 1.3

    更新内容:ボスニアの学習者データを追加。











研究紹介