Windows上でのCSJ形式転記作業方法について
 

早稲田大学 人間科学部 菊池英明
 

(2006/10/23) 公開
(2006/11/11) lab2trnについての記述を追加
(2007/04/05) IMEかな漢字変換の利用を追加
(2009/08/18) MonoForCを使った簡易環境構築についての記述を追加

 

1. 本文書の目的

本文書では、Windowsパソコンを利用して、日本語話し言葉コーパス(CSJ)形式の転記ファイルを"meadow"で編集する 方法について説明する。

Windows上で日本語話し言葉コーパスの転記作業を再現したい場合には、Meadowをインストールして下さい。 さらに、dt-modeの設定を行って下さい。

Meadow上のデフォルトのかな漢字変換は使いにくく、また音声を再生しながらの編集ができなくなるので、IMEを使うように.emacsを設定するのが良いでしょう。dt-modeの設定とあわせてその設定を行った".emacs"はこちら(ダウンロード後、".emacs"にファイル名を変更して下さい)。

 

インストールする場所はデフォルトのC:\meadowで構いません。以下の説明ではそこにmeadowがインストールされていて、dt-modeの設定が済んでいるものとして進めます。

なお、CSJのディスクvol.1におさめられている転記ブラウジングツールMonoForC((c)籠宮氏)を使えば、簡単に転記作業環境を構築できる。具体的には、まず、wavファイルに対して発話区間情報を記したtrnファイルの原型を作る。その際、以下のように、空のテキストを記しておくことが必要。

0001 00041.641-00041.908 L:
  &

こうして用意したtrnファイルの原型と、wavファイルを同じディレクトリに置いておけば、MonoForCでtrnファイルを開いて、発話区間単位で音声を簡単に再生することができる。MonoForCで発話区間ごとに音声を再生しながら、別途メモ帳などでtrnに文字を書き込んでいけばよい。

2. データのインポート

(1) データ

CSJスタイルの転記作業を行うには、転記ファイルと音声ファイルのペアが必要である。

 

その際、音声ファイルは、転記ファイルと同じディレクトリにあり、転記ファイルの拡張子".trn"を取り除いた部分に"-L.wav"と加えた名前としなければならない。

 

データは、meadowから開きやすくするために、C:\meadow\dataに置くとよい。

 

なお、CSJスタイルの転記ファイル(*.trn)において、転記基本単位に関する情報を手動で記述するのは非効率的である。そこで、WaveSurferなどで転記基本単位の始端と終端にラベルを付与し、そのラベルファイルから自動的にCSJスタイルの転記ファイルの形式に変換することを推奨する。WaveSurferのラベルファイル形式からCSJスタイルの転記ファイル形式に自動変換するスクリプトはこちら

(2) データのインポート

データはCD-ROM、DVD-ROM、電子メール、ホームページからのダウンロードなど、状況に応じて異なる方法で提供され得る。

いずれの場合にも、(1)で述べたように、転記ファイルと音声ファイルを、同じC:\meadow\dataにコピーすればよい。

以下に、ホームページからダウンロードする様子を図示する。

 

3. データのオープン

(1) meadowの起動

スタートボタン右のアイコン群から、meadowのアイコンをクリックして起動。

以下の図で赤丸に囲まれたアイコンがmeadowのアイコンである。

 

 

meadowを起動すると以下のような初期画面があらわれる。

(2) 転記ファイルのオープン

ショートカットキー "C-x C-f"(Ctrlキーを押しながら"x"、Ctrlキーを押しながら"f")を行うと、meadow画面下部が以下のようになる。

 

"bin/"をバックスペースキーによって消して、転記ファイルの所在と名前を打ち込んでEnterキーを押す。

 

すると、指定された転記ファイルがmeadowの中にオープンする。その際、画面下にファイル名と、その横に"(Discours Translation)"の文字があることを確認する。

 

 

4. 転記

音声を聴取しながら文字を入力していく。

 

転記基本単位ID(例:"0001 00000.196-00007.476 L:")の行にカーソルを置いて、ショートカット"C-c p"(Ctrlボタンを押しながら"c"、Ctrlボタンを離して"p")を実行すると、その時間に対応した音声が再生される。

 

設定されているショートカットは以下のもの。

;;; 音声再生

;;; C-c p カーソル行を再生
;;; C-c a カーソル行の時間の別チャンネルを再生
;;; C-c b カーソル行の時間を両チャンネル再生
;;; C-c r リージョン再生
 

;;; キーバインド
;;; C-c C-s マークからポイントまでの文字列を検索
;;; C-c s 検索文字列を対話的に入力して検索
;;;
;;; 関数
;;; dt-dic-search-region マークからポイントまでの文字列を検索
;;; dt-dic-search-interactive 検索文字列を対話的に入力して検索

文字は以下のように入力していく。

なお、meadowでのテキスト編集になれない場合は、転記ファイルの複製を作り、meadowでは音声を再生するだけにして、テキストの入力は別のツールを使って行ってもよい。例えばTeraPadでテキスト編集をする様子を以下に示す。なお、転記ファイルの複製を作った場合、同じ名前のファイルを別の場所に保存し、それを別のツールで編集するのが良い。

5. 謝辞

dt-mode関係について、小磯さん、籠宮さんに感謝。

 

籠宮さんのホームページはこちら

 

本文書作成に際して矢木奏さんに御協力いただきました。感謝します。


 

Copyright ©2006 KIKUCHI Hideaki All rights reserved.