Windows上でのCSJ形式転記作業方法について
早稲田大学 人間科学部
菊池英明
(2006/10/23) | 公開 |
(2006/11/11) | lab2trnについての記述を追加 |
(2007/04/05) | IMEかな漢字変換の利用を追加 |
(2009/08/18) | MonoForCを使った簡易環境構築についての記述を追加 |
1. 本文書の目的 |
本文書では、Windowsパソコンを利用して、日本語話し言葉コーパス(CSJ)形式の転記ファイルを"meadow"で編集する 方法について説明する。
Windows上で日本語話し言葉コーパスの転記作業を再現したい場合には、Meadowをインストールして下さい。 さらに、dt-modeの設定を行って下さい。
Meadow上のデフォルトのかな漢字変換は使いにくく、また音声を再生しながらの編集ができなくなるので、IMEを使うように.emacsを設定するのが良いでしょう。dt-modeの設定とあわせてその設定を行った".emacs"はこちら(ダウンロード後、".emacs"にファイル名を変更して下さい)。
インストールする場所はデフォルトのC:\meadowで構いません。以下の説明ではそこにmeadowがインストールされていて、dt-modeの設定が済んでいるものとして進めます。
なお、CSJのディスクvol.1におさめられている転記ブラウジングツールMonoForC((c)籠宮氏)を使えば、簡単に転記作業環境を構築できる。具体的には、まず、wavファイルに対して発話区間情報を記したtrnファイルの原型を作る。その際、以下のように、空のテキストを記しておくことが必要。
0001 00041.641-00041.908 L:
&こうして用意したtrnファイルの原型と、wavファイルを同じディレクトリに置いておけば、MonoForCでtrnファイルを開いて、発話区間単位で音声を簡単に再生することができる。MonoForCで発話区間ごとに音声を再生しながら、別途メモ帳などでtrnに文字を書き込んでいけばよい。
2. データのインポート |
(1) データ
CSJスタイルの転記作業を行うには、転記ファイルと音声ファイルのペアが必要である。
その際、音声ファイルは、転記ファイルと同じディレクトリにあり、転記ファイルの拡張子".trn"を取り除いた部分に"-L.wav"と加えた名前としなければならない。
データは、meadowから開きやすくするために、C:\meadow\dataに置くとよい。
なお、CSJスタイルの転記ファイル(*.trn)において、転記基本単位に関する情報を手動で記述するのは非効率的である。そこで、WaveSurferなどで転記基本単位の始端と終端にラベルを付与し、そのラベルファイルから自動的にCSJスタイルの転記ファイルの形式に変換することを推奨する。WaveSurferのラベルファイル形式からCSJスタイルの転記ファイル形式に自動変換するスクリプトはこちら。
(2) データのインポート
データはCD-ROM、DVD-ROM、電子メール、ホームページからのダウンロードなど、状況に応じて異なる方法で提供され得る。
いずれの場合にも、(1)で述べたように、転記ファイルと音声ファイルを、同じC:\meadow\dataにコピーすればよい。
以下に、ホームページからダウンロードする様子を図示する。
3. データのオープン |
(1) meadowの起動
スタートボタン右のアイコン群から、meadowのアイコンをクリックして起動。
以下の図で赤丸に囲まれたアイコンがmeadowのアイコンである。
meadowを起動すると以下のような初期画面があらわれる。
(2) 転記ファイルのオープン
ショートカットキー "C-x C-f"(Ctrlキーを押しながら"x"、Ctrlキーを押しながら"f")を行うと、meadow画面下部が以下のようになる。
"bin/"をバックスペースキーによって消して、転記ファイルの所在と名前を打ち込んでEnterキーを押す。
すると、指定された転記ファイルがmeadowの中にオープンする。その際、画面下にファイル名と、その横に"(Discours Translation)"の文字があることを確認する。
4. 転記 |
音声を聴取しながら文字を入力していく。
転記基本単位ID(例:"0001 00000.196-00007.476 L:")の行にカーソルを置いて、ショートカット"C-c p"(Ctrlボタンを押しながら"c"、Ctrlボタンを離して"p")を実行すると、その時間に対応した音声が再生される。
設定されているショートカットは以下のもの。
;;; 音声再生
;;; C-c p カーソル行を再生
;;; C-c a カーソル行の時間の別チャンネルを再生
;;; C-c b カーソル行の時間を両チャンネル再生
;;; C-c r リージョン再生
;;; キーバインド
;;; C-c C-s マークからポイントまでの文字列を検索
;;; C-c s 検索文字列を対話的に入力して検索
;;;
;;; 関数
;;; dt-dic-search-region マークからポイントまでの文字列を検索
;;; dt-dic-search-interactive 検索文字列を対話的に入力して検索文字は以下のように入力していく。
なお、meadowでのテキスト編集になれない場合は、転記ファイルの複製を作り、meadowでは音声を再生するだけにして、テキストの入力は別のツールを使って行ってもよい。例えばTeraPadでテキスト編集をする様子を以下に示す。なお、転記ファイルの複製を作った場合、同じ名前のファイルを別の場所に保存し、それを別のツールで編集するのが良い。
5. 謝辞 |
dt-mode関係について、小磯さん、籠宮さんに感謝。
籠宮さんのホームページはこちら。
本文書作成に際して矢木奏さんに御協力いただきました。感謝します。
Copyright ©2006 KIKUCHI Hideaki All rights reserved.