Japanese Speech Corpora of Major City Dialects

ＪＣＭＤ報告書（13）

　この研究は、全国各地で録音収集された方言音声をデータベースにし、地方によってどのようにアクセントやイントネーションが異なるか、また、同じ地方でも、年齢によって違いがあるのかなどを、たちどころに聞き比べることができるようにするものです。
　このようなデータベースを作るには、まず、同じ言い方を全国各地で録音する必要があります。各地でバラバラのものを録音したのでは比べることができないからです。また、データベースとして将来に残すという点では、できるかぎり良い音質、良い環境で録音をおこなう必要もあります。とりあえず適当に録音しておいて、データベースを作るときになってから考えよう、というような考えでは良いデータベースはできません。収集するまでにどのような目的のデータベースにするのか、それにはどのような内容を録音すればよいのか、といったことをはっきりと決めなければなりません。
　この研究で用いている資料は、このような条件をクリアした資料で、全国の各地域を代表する13都市で、しかも、一つの都市につき100名近くを録音したものです。この中から、将来に残すのに適した音声を選んでいき、結果的には10地点、各地点20名をデータベース化することになりました。この録音は平成元年から４年にかけて、「日本語音声」という別の重点領域研究で集められたものです。４年かけたにもかかわらず、「日本語音声」の期間中には、この録音資料はデータベース化できませんでした。そこで、その後、別にデータベース科研という、データベースを作るために文部省が特別に出している研究費をもらって、５年にわたり編集作業をおこなっているわけです。それが、今年で５年目の最後の年にあたり、現在、ラストスパートをかけているところです。
　具体的には、ＤＡＴという特殊なオーディオテープに録音された録音を、いったんパソコンの中に移しかえ、次にパソコンの画面に音声波形を出し、それを見ながら、単語ごとに切っては別々の音声ファイルとして保存していく、という単純作業です。しかし、作業に慣れた人が、まる一日パソコンに向かって作業をしても、正味30分の録音を編集し終えることができるか、できないかといった気の遠くなるような作業です。このような作業を５年間続けているわけです。
　まあ、このような地道な作業によって、なんとか200人分の音声データを、今年度中に編集し終える予定です。音声ファイルの数は、一人につき少なくとも500はありますから、500×200人でなんと10万個をこえてしまいます。これだけのものを保存しておくだけで、膨大な場所が必要かと思いきや、光磁気ディスクというフロッピーディスクの化け物のようなものを使えば、30枚程度で収まってしまいます。これをＣＤ－ＲＯＭに焼き付ければ、さらに減って一地点１枚、計10枚になってしまうのです。音声データは文字データに比べるとものすごい容量になるのですが、それでもこの程度ですから、恐ろしい世の中になったものです。
　次に、データベースにとって、もう一つ重要なことがあります。それは、上で述べた手順で作ったものは、データの塊にすぎず、データベースとは呼べません。何が欠けているのでしょうか。データベースは、それを使う人がデータを自由に操ることができなければいけません。最初に述べたように、年齢や、地域や、その他の条件を入力すれば、たちどころに音声が出てこなければならないわけです。そのためには、音声ファイルの他に、検索するためのラベルが必要になります。ラベルとは、例えば、その音声ファイルに何という音声が入っているのかいう文字による情報であり、また、その音声ファイルの声の持ち主がどのような人であるのかといった、やはり文字による情報であったりするわけです。
　このような点をはっきりさせたいときは、私はこの種のものを「音声データベース」ではなく、「音声情報データベース」と呼ぶようにしています。「音声情報データベース」とは、「音声」のデータベースと言うよりは、むしろ、より一般に普及しているテキストデータベースにプラスアルファするものとして、音声がくっついていると考えた方がよいものです。テキストデータベースで検索した結果に、おまけで音声が付いているというところでしょうか。したがって、音声を編集するのとは別立てで、まずはふつうのテキストデータベースを作らなければならないのです。この研究の場合、この作業は、音声データベースを編集するのに先だっておこない、すでに完成しています。
　これで、「音声情報データベース」と呼べるものになったでしょうか？　まだ、だめです。たしかに、データベースに必要なデータは出そろったのですが、これだけでは、利用者が自由自在に音声を取り出すことはできません。それをおこなうためには、これらのバラバラのデータを結びつけて、さらに検索をおこなうプログラムが必要です。最近の市販データベースソフトの中には、テキストをデータとして検索をおこない、それを音声ファイルとリンクさせて音声を再生するというような機能を持ったものも出始めていますが、まだまだ一般の利用者が使いこなせるような状況ではありませんし、市販のものを利用するとなると、利用者全員にそのソフトを購入してもらわなければならないという問題も出てきます。したがって、このデータベース用に特別に検索、再生するプログラムを作って、データに添付する必要があるのです。
　現段階では、マッキントッシュ用に開発されたハイパーカードを使って、簡潔かつ十分な検索プログラムを作り終えた段階です。これから、いろいろ試してみて改良を加える必要があります。また、今後有望なものとしては、急速に普及しつつあるＷＷＷブラウザを利用した検索プログラムを考えていくことです。うまくいけば、インターネット上で検索、再生をおこなえるものが、公開できるかも知れません。ただ、現状ではインターネットはスピードの点で音声データが扱いにくいのですが、これからは、さらに改良されていくことでしょう。このようなことを本研究ではおこなっています。興味のある方はメールでお問い合わせ下さい。