K-lab.
 自己紹介 研究紹介 担当科目  研究室 その他 
      
 

 2005年度展開中の主な研究テーマ  2005年度オープンキャンパスでの研究紹介パネル

 
音声対話
 人間対機械の音声による対話の実現人間同士のコミュニケーションにおいて、音声は非常に便利であり、かつ表現力の高いメディアです。人間が機械を操作する際にもこのメディアを生かせるように、声による言葉のやりとりをコンピュータで実現させようとする研究です。
  リズム感のある対話声で出された命令を理解して返事を返すだけでなく、親しい友達同士のようなリズムのいい対話を実現しようとする研究です。対話の参加者の心理的な状態変化を推測したうえで、相手の声の調子に合わせて自分の声の調子を変えるというアプローチです。
 多次元心的状態モデルコミュニケーションの参加者の心理的な状態は刻々と変化しています。対話の上手な人はそのような相手の状態をしっかり認識して、適切な行動をとることができます。そうした行動ができるように、相手の多様な状態をモデルとしてコンピュータの内部に表現しようとする研究です。
 対話システムのアーキテクチャーコンピュータが声で人間と対話をするためには、人間の声を聞き取って理解する、相手の要求を達成してあげる、声で返事をする、などの多くの細かい仕事が必要です。こうした細かい仕事を組み合わせていろいろな対話を実現するために、専用のアーキテクチャーを用意しようとする研究です。
音声言語
  話し言葉音声言語コーパスの構築 人間が普段使っている話し言葉の機械処理を実現するため、また話し言葉の構造を解明するために、大量の話し言葉音声を収集し、扱いやすいように様々な情報を付与します。付与する情報は、多くのタグを含む書き起こし情報の他、形態論情報、分節音情報、韻律情報などです。この研究は、科学技術振興調整費による開放的融合研究推進制度「話し言葉工学の構築」プロジェクトの一環で国立国語研究所を中心に行っているものです。
音素自動ラベリングの精度向上 音声のデータベースを作る際、音素の単位でラベリングをした情報は、音声工学のみならず、音声学・言語学などにとって有用です。最近の音声認識技術を使えば、これを自動的に効率よく行うことができます。この研究は特に話し言葉音声についてその自動ラベリング精度を向上しようとする研究です。
韻律ラベリングシステムの提案 音声の韻律は言語的な情報だけでなく様々な情報を伝達する重要な手段です。韻律を対象として様々な分析を行うために、言語学的な理論に基づいて韻律に解釈を与え、その結果に応じてラベルを付与する方法を提案しています。国立国語研究所を中心に作成している話し言葉音声言語コーパスには大量の韻律ラベル情報が含まれます。
音声言語コーパスの統合的管理 音声言語コーパスには、音声の文字化情報、形態論情報、分節音情報、韻律情報など、多種多様の情報が存在します。これらを相互に関係付けることによって、メンテナンスの効率を上げるとともに、多様な検索を可能にします。XMLを使って統合的管理を行います。
話し言葉音声言語の特徴分析 そもそも話し言葉と書き言葉に音声的・言語的にどのような違いがあるのかは非常に興味深いところであり、科学的興味から分析を行います。一方、話し言葉は書き言葉あるいは朗読音声に比べて整っていないため、工学的な解析処理が難しくなります。少しでも解析精度を上げるためによりよいモデルを構築しようと試みています。
ヒューマンインタフェース
  音声対話による視覚障害者支援 視覚障害者にとって、Webに代表される現在の文字・画像中心のコンピュータ環境は望ましいものではありません。音声合成技術を使って文字を声で読み上げたり、視覚情報を3次元の音響情報で表現したりする支援技術が実際に利用されて効果を上げています。本研究は、こうした技術の適用範囲をさらに広げるために、あたかも横に人がついて対話的に支援してくれるようなインタフェースの実現を目指しています。
  音声対話インタフェースの評価指標 音声対話インタフェースをどのように作れば快適になるのかということは案外明確ではありません。それにはまずどのような評価指標があるかを明らかにする必要があります。どんな対話が喜ばれるのか、それは対話の参加者と第三者では異なるのか、などをいろいろな対話を評価することで明確にしようとしています。
  ペットロボットによる感情理解と表出 ペットロボットに感情を理解させ、また相手の感情に合わせた表出をさせようとする研究です。飼い慣らしたペットに飼い主の感情が伝わることがあるように、ペットロボットにもそのようなことができればより「癒し」の存在になるのではないでしょうか。SONYのAIBOをプラットフォームにします。
  eラーニングのユーザインタフェース 人間科学部ではインターネットを介したe-learningの課程「eスクール」を開設しています。大学教育のe-learningでは、遠隔にいる大勢の学生・教員が議論をする場が必要ですが、単純な電子掲示板では実世界の議論にとてもかないません。学生・教員が議論する場にふさわしい、ユーザインタフェースを設ける必要があります。eスクールは遠隔地の人や社会人だけのものではなく、教育の新しい形です。ここでの研究成果が実システムに反映されていきます。
  音声言語メディアヒューマンインタフェース 音声言語をメディアとするヒューマンインタフェースへの期待が高まっています。今後、そのようなヒューマンインタフェースを開発・研究する際、まず音声言語メディアの特性をおさえておく必要があります。そのうえで、音声言語メディアの特性を充分に活かした次世代のヒューマンインタフェースを模索します。音声インタフェース評価マニュアルを作成しました(2009/03)。
 
  

研究設備(内部のみ)

学会等番号(内部のみ)

 

 
WASEDA UNIVERSITYHOME