JCMD報告書(前書き)



・本研究の概要

これは、文部省科学研究費重点領域研究「人文科学とコンピュータ」(1995〜98年度<予定>)の公募班として1995,96,97年度の3年にわたって助成を受けた「方言音声データベースの作成と利用に関する研究」の最終報告書である。
 この研究は、次の一連の研究の最終段階に位置する。まず、重点領域研究「日本語音声における韻律的特徴の実態とその教育に関する総合的研究」(1989〜92年度、総括班のみ93年度まで、代表者 杉藤美代子)において、13主要都市(札幌,弘前,仙台,新潟,名古屋,東京,富山,大阪,高知,広島,福岡,鹿児島,那覇)で、一都市につき平均して、5世代男女計80名、640項目をディジタル録音した膨大な資料が収集された。このデータの一部について、「日本語音声」終了後、1993年度より5年計画で、新たに成果公開促進費(データベース科研)を受け、「日本主要都市方言音声データベース(Japanese Speech Corpora of Major City Dialects)」(1993〜97年度)としてCD、CD-ROM化のための編集作業をおこなった。このデータベース科研による研究中に、データベース研究の総仕上げとして、3年にわたり本研究をおこなった。 
 本研究では、研究の目的として次の三つを設定した。

 @ 「方言音声データベース」そのものをより整備されたものにすること。
 A 検索、分析のためのツールを開発すること。
 B 当該分野(言語学、音声学、国語学、日本語教育学等)における利用者を開拓し、
   利用のためのルール作りを行い、流通化を促進すること。

 この3点について研究を進め、その成果を、最終年度である1997年度の成果として、CD-ROM版データベース『JCMD大阪』にまとめ、「人文コン」総括班より刊行した。本報告書は、この一連の研究中に発表した、著書、論文、口頭発表、報告書等を一冊にまとめたものである。

・本研究を振り返って

 本研究は1997年度で3年目を迎え、当初の予定を無事完了した。以下では、この3年を振り返り、活動内容を報告する。
 この研究において、もっとも問題が多く、遅れていた作業として、作成した音声データをどのような形で利用者に提供するかという点があった。この点は重要で、データが単なるデータのままか、それともデータベースとして生まれ変わるかという本質に関わっている。特にコンピュータの普及が遅れている人文系の中でも、さらに遅れている国語国文学系の研究者に、最新の調査データを、単に遊びの材料ではなく、本格的な研究、あるいは教育の材料として活用してもらうことがいかに困難かということを、ここ7、8年思い知らされてきた。
 これは、研究者のコンピュータに対する意識の問題であるとともに、世の中のコンピュータ、特にパソコンの普及に大きく依存する問題であった。7、8年前に収集した大量の音声資料を、その後、地道に編集し続けながら、パソコン界の動向をにらみつつ、何度も何度も軌道修正をおこない、やっと現在に至った感がある。
 この間、巷のパソコン界は、MS-DOSからWindows3.1、さらにWindows95へと移り変わっていった。この移り変わりは、音声を扱う者にとって、文字通り大いなる福音であった。まず、音声を再生するのに特殊な音声ボードが不要になった。さらに、CD-ROMドライブが標準装備になり、音声のような大容量データの受け渡しができるようになった。この2点は革命的な出来事だった。5年前と違って、どのパソコンでも人の声が鳴るのである。これで、とりあえずデータがデータとして生きるようになったのである。
 正直な話、この音声データを収集した当時、工学系の研究者と協力しあって、CD-ROM音声データベースが3枚ほど作成されたが、ほとんどの文系研究者にとって、これはただの円盤に過ぎなかった。特殊な音声ボードとアンプとスピーカを買い足す(文系研究者にとっては高望みな)予算、ハードディスク容量の不足、SASIとSCSIの規格の狭間におけるトラブル、難解なインストール方法、これらのハードルを越えて、無事音声データベース(たとえば郷愁に満ちた田舎の老人の声)にたどりつけた研究者が果たして何人いたのだろう。
 このように、深い眠りについていたデータが蘇ったのが、Windows95が登場してからであるから、まだやっと2年そこそこである。ここにきて、やっとデータベース化に向けての作業ができる状況になった。それと軌を一にしてこの「人文コン」がスタートし、渡りに船と、この研究に参加させていただいたわけである。
 1995年度については、そのような事情で、それまでの「ワークステーション形式」で編集してきた音声データを、Windows標準形式であるwavファイルにすべて変換するという作業に追われ一年が過ぎてしまった。この変換に関しては、NTTアドバンステクノロジ社の石井直樹氏の作成したDat2wav.exeという変換コマンドを用いて、MS-DOS上で、バッチファイル処理をしながら変換していくわけだが、なにしろ万単位のファイル数であり、かなりの時間を要した。その間、音声の編集作業を進めるとともに、検索等の問題が起こらない、1分程度の比較的長めの朗読音声データのCD化作業を続けた。このCD化は、1993年度より5年計画のデータベース科研において既に始めていたものであり、1993〜95年度で5枚、計10地点、総計200名分の「JCMD天気予報T〜X」を刊行し終えた。さらに、それをモニター利用という形で無償配布し、データベースの流通化、利用のルール、研究者の意識の把握に関する調査研究をおこなった。
 1996年度は、ハイパーカードで比較的簡単に検索プログラムが作成できるMacintoshを使って、検索用ソフトの開発をおこなった。この作業によって、本データベースのイメージが固まった。1996年度にその成果として、『ハイパーカード版JCMD大阪』を試作した。
 1997年度は、MacintoshとWindows95の両OS上で共通のファイルが作成でき、操作性においても完全互換性を持ち、それに加え、音声データが簡単に扱えるクラリス社製「ファイルメーカーPro」を、本データベースのプラットフォームに決定した。そして、一年かけてこのソフトの性質と、音声データベースへの利用に向けての研究をおこない、最終
的に、1997年度「人文コン総括班」の成果刊行物として、『(ファイルメーカー版)JCMD大阪』のCD-ROM刊行にこぎ着けた。
 来年度以降は、このデータベースを配布し、モニターと使用状況について意見を交換しながら、よりよい形の音声データベースをめざしていく予定である。そして、編集に関してはすでに完了している、大阪以外の残りの都市について、できるだけ早い時期に音声データベース化をおこないたいと考えている。この重点領域研究に参加できたおかげで、人文分野にさまざまなデータベースがあり、分野ごとに異なったデータベースに対する考え方が存在することを知ることができた。また、データベース科研だけでは、まかないきれない研究を、大いに進めることができたことを感謝している。

・本科研費のまとめ

研究課題名:『方言音声データベースの作成と利用に関する研究』

研究種別:文部省科学研究費補助金重点領域研究(1)『人文科学とコンピュータ』公募班
課題番号:1995年度 07207117, 1996年度 08207114, 1997年度 09204107
研究代表者:田原広史 (大阪樟蔭女子大学・学芸学部・助教授)
研究分担者:江川 清 (国立国語研究所・情報資料研究部・部長)
杉藤美代子(大阪樟蔭女子大学・名誉教授)
板橋秀一 (筑波大学・電子・情報工学系・教授)
研究協力者(1996,97年度):中村一夫(大阪樟蔭女子大学・非常勤講師)


 次に、本研究に関連するデータベース科研の概要を示す。

Japanese Speech Corpora of Major City Dialects
データベースの名称:『日本主要都市方言音声データベース (JCMD)』

研究種別:文部省科学研究費補助金「研究成果公開促進費」(データベース)
申請番号:1993年度 47, 1994年度 54, 1995年度 30, 1996年度 63, 1997年度 64
作成組織:日本主要都市方言音声データベース作成委員会
作成組織代表者: 委員長 田原広史 (大阪樟蔭女子大学・学芸学部・助教授)
作成分担者: 副委員長 江川 清 (国立国語研究所・情報資料研究部・部長)
委員 杉藤美代子(大阪樟蔭女子大学・名誉教授)
委員 板橋秀一 (筑波大学・電子情報工学系・教授)
委員 西端幸雄 (大阪樟蔭女子大学・学芸学部・教授)

・参考文献

1993.6.6 田原広史「日本主要都市音声データベースの問題点」
	(2nd DB-West<第2回「西日本国語国文学データベース研究会>,大阪樟蔭女子大学,口頭発表)
1993.6.6 田原広史「データベースソフト『桐』を用いた索引づくり」
	(2nd DB-West,ポスターセッション,大阪樟蔭女子大学)
1995 .1	 田原広史「音声情報データベース」
	(DB-West編『パソコン国語国文学』,第3章,啓文社,pp96-119)
1995.9	 田原広史「方言音声データベースの作成と利用に関する研究」
	(『じんもんこん第1号』,pp.40-41)
1995.12	 田原広史他「方言データベースの作成と利用に関する研究」
	(『公開シンポジウム 人文科学とデータベース 「データ」を読む・観る・解く』,pp.99-104)
1996.2	 田原広史「「方言音声データベース」とは何ぞや?」
	(『じんもんこん第2号』,研究室だより,pp.15-17)
1996.3	 田原広史他「方言音声データベースの作成と利用に関する研究」
	(『人文コン1995年度研究成果報告書』,pp.187-192)
1996.6.2 田原広史「データベースの作成と利用に関する試み-方言音声データベースJCMDを例として-」
	(8th DB-West,大阪樟蔭女子大学,口頭発表)
1996.9.4-5 田原広史他「方言音声データベースの作成と利用に関する研究」
	(人文コン青森シンポジウム,ポスターセッション,青森公立大学)
1996.12.1 田原広史・中村一夫「ハイパーカードを用いた音声データベース検索」
	(9th DB-West,大阪樟蔭女子大学,口頭発表)
1996.12	 田原広史「主要都市調査」
	(『人文学と情報処理12特集音声データベース』,勉誠社,p.62)
1997.3	 田原広史「方言音声データベースの作成と利用に関する研究」
	(『じんもんこん第3号』,pp37-38)
1997.3	 田原広史他「方言音声データベースの作成と利用に関する研究」
	(『人文コン1996年度研究成果報告書(CD-ROM)』)
1997.3.27 田原広史・中村一夫「日本語方言音声データベースの作成と検索システムの開発」
	(言語処理学会第3回年次大会,京都大学,口頭発表)
1997.6.1 田原広史「データベースの作成、公開、活用の現在と未来」
	(10th DB-Westシンポジウム「これまでのデータベース、これからのデータベース」,大阪樟蔭女子大学,口頭発表)
1997.7	 田原広史「方言音声データベースの作成と利用に関する研究」
	(『じんもんこん第4号』,これが私の研究だ!,pp40-41)
1997.12.7 田原広史・中村一夫「ファイルメーカーProでデータベースを作る」
	(11th DB-West,大阪樟蔭女子大学,口頭発表)
1998.1	 田原広史・中村一夫「国語国文学分野におけるデータベースソフトの評価-『ファイル
	 メーカーPro』と『桐』の比較を中心に-」(『日本語研究センター報告5号』,pp107-120,大阪樟蔭女子大学)
1998.3	 田原広史他『JCMD大阪』
	(人文コン総括班刊行物(CD-ROM),1枚組)
1998.3	 田原広史他『CD-ROM版音声データベース JCMD大阪 添付資料』
	(重点領域研究「人文コン」公募班「方言音声データベースの作成と利用に関する研究」研究成果報告書,p64)
1998.3	 田原広史他「方言音声データベースの作成と利用に関する研究」
	(『人文コン1997年度研究成果報告書(CD-ROM)』,1枚組)