2009年度秋学期オープン教育センター設置
(水曜1限:14号館6階603教室(14-603)8号館4階409教室(8-409))
原田 康也
内容一覧
本 web page 使用に関する注意事項
-
Copyright © 1998-2009 Yasunari HARADA. All rights reserved.
First drafted December 9th, 1998. Last modified November 25th, 2009.
-
本 web page は早稲田大学オープン教育センター設置『言語学(統語論・応用)』の授業を円滑に進行させるために用意したものです。原則として、受講生以外の利用は想定していません。
この授業を受講する上での注意事項
- 原則として定刻 9:00 に授業を開始します。授業開始時間前に教室に入ってコンピュータを起動していることが期待されています
- 授業中の課題や宿題などは返却しません。
- この授業では、各自が演習課題に取り組むことと、グループでの共同作業を重視しています。グループの他の受講生と共同作業をすることに各自が責任を負っていると考えてください。
- 練習問題は、わからなくてもいいから、とりあえず自分で考えること。
- グループの中で全員が納得するまで十分に話し合うこと。
- グループのメンバーの連絡先(メールやケータイなど)を教えあって、いつでも連絡できるようにすること。
- 欠席するとき・遅刻しそうなときは事前に連絡を取り合うこと。
- 『課題』についての注意事項
- 『課題』には『正解』はありません。
- 『課題』の設定には『あいまい』なところがたくさんあります。その『あいまい』な部分について各自で考え、グループで議論することも『課題』の重要な一部です。
- 『課題』で使われている用語や表現の意味について緻密に考えることは、『言語』と『情報』について主体的に学ぶことにつながります。
- 学生グループの口頭発表に際して:発表途中も随時質問しましょう。例えば、
- 『ある資料によると』という発表はさえぎって、
『どういう資料ですか?具体的に出典を示してください』と質問しましょう。
- 『インターネットに書いてありました』という発表はさえぎって、
『どこに書いてあったかURLを教えてください。どういう立場の人が書いたのか教えてください』と質問しましょう。
- 『私たちはこう考えました』という発表はさえぎって、
『どうしてそう考えたのですか』と質問しましょう。
- 具体例がない発表はさえぎって、
『具体例を挙げてください』と注文を付けましょう。
- 結論が明確でない発表には
『最終的にどういう結論なのか、もう一度まとめてください』と注文を付けましょう。
- 発表が終わったらさらに質疑応答を行いましょう。
- 引用部分の明確化と出典の明示:
口頭での発表・レジュメ・レポートなどにおいて、引用部分を明確にし、出典を明示してください。
- 機器ならびに配線の保護のため、コンピュータ教室内は飲食ならびに傘の持ち込み禁止です。特に缶の飲み物を持ち込まないでください。いま持っている人は廊下で飲んで容器をごみ箱に捨ててから教室に戻ってください。傘は傘立てに入れてください。
- そのほかの情報資源の活用方法を確認してください。
授業の予定・経過・課題・宿題など
- 9月30日
- 授業の概要:
- 受講生の自己紹介
- 氏名
- 学籍番号・所属学部(専攻/専修/学科)・学年
- 言語学/統語論などについての予備知識・学習歴・これまで読んだ本など
- この授業を受講した理由・動機をできるだけ具体的に
- 担当教員の自己紹介
- 宿題:
- 自己紹介を A4 用紙で 2 ページ程度にまとめて、ファイルとプリントアウト 6 部を用意すること
- 氏名・学籍番号・所属学部(専攻/専修/学科)・学年
- 言語学/統語論などについての予備知識・学習歴・これまで読んだ本など
- この授業を受講した理由・動機をできるだけ具体的に
10月7日
- 教室変更:8号館4階409教室(8-409)
- 授業の概要:統語論
人工言語の統語論
- 練習問題
- 次の5種類の記号をそれぞれ一回ずつ使い自由に並べなおしたとき、何通りの可能性があるか?全部列挙しなさい。
a b c * +
- そのうち算数の計算式として意味があるのはどれか?ただし * は×のかわりに使うものとします。
- 数学
- infix notation
- prefix notation (Polish notation)
- postfix notation (anti-Polish notation)
- プログラミング言語
- 構造化文書
自然言語の統語論
- 『有限状態文法』と『有限状態文法のモデル』
- 有限状態文法:有限個の『状態』・『状態』と『状態』を結ぶ『矢印』・『矢印』に付けた『ラベル』からなる
- 有限状態文法のモデルとは:すごろくのようなもの
- 有限状態文法の解釈規則(使い方)の例:
- コマを『はじめ』のマスに置く。
空の箱を用意する。
- 矢印にそってコマを動かす。
このとき、箱の中に矢印に付けたラベルのコピーを左つめで置く。
- コマが『おわり』のマスに入ったら終わり(にしてよい)。
このとき、箱の中にあるラベル(のコピー)のならびを文と呼ぶ。
- 練習問題1:次のような文を生成する有限状態文法を書いてみよう。
- 今日は晴れでしょう。
- 明日は雨でしょう。
- 明後日は曇りでしょう。
- 練習問題2:次のような文を生成するように上の有限状態文法を修正してみよう。
- 今日は曇りのち晴れでしょう。
- 明日は曇りときどき雨でしょう。
- 明後日は雨のち晴れときどき曇りでしょう。
- 理系男子の書斎には、どうしても小説が少ない。っていうか無い。
http://neo.g.hatena.ne.jp/debedebe/20081218/1229533744
本日の課題:授業の内容ならびに以下のページの内容についての感想を A4 1ページ程度にまとめ、プリントアウト6部とファイルを持参すること。
Windows 95
日本語とオブジェクト指向(Life is beautiful)
http://satoshi.blogs.com/life/2004/09/post.html
10月14日
- 授業の概要:統語論
- 自然言語の統語論
- 句構造文法のモデル:句構造規則の集まりとしての句構造文法とその(メタ)解釈規則の組み合わせによって定まる。文(sentence)とは何か、どのような単語の並びが文として認められるかを再帰的に定める。
- 句構造文法の基本的述語:
- 句構造文法:phrase structure grammar
- 句構造規則:phrase structure rule
- 文:sentence
- 統語範疇:syntactic categories
- 語彙項目(単語):word / lexical item
- 句構造規則の基本的形式:
- 記号 -> 記号のならび
- 記号 -> 記号
- 記号 -> 記号 記号
- 記号 -> 記号 記号 記号
- この形式を 「入力」 -> 「出力」 と見ることもできる。
- 句構造文法の例1:
- S -> NP VP
- NP -> PropN
- VP -> IV
- VP -> TV NP
- PropN -> John
- PropN -> Mary
- IV -> walks
- IV -> snores
- TV -> kissed
- TV -> kicked
- 英語の句構造文法で広く使われる記号とその記号を使う人の意図
- S: sentence ないし start
- NP: noun phrase 名詞(を中心とした)句
- VP: verb phrase 動詞(を中心とした)句
- PropN: proper noun 固有名詞 -> John
- IV: intransitive verb (目的語を伴わない)自動詞
- TV: transitive verb(目的語を伴う)他動詞
- 句構造文法の解釈規則1
- 文脈自由書き換え規則としての解釈
- 空の箱を用意する。
- 箱の中に S という記号をひとつ入れる。
- 箱の中の記号を句構造規則に従って置き換える。(句構造規則の左辺にある記号が箱の中にあれば、それを右辺の記号の並びで置き換える。)
- これ以上置き換えられなくなった記号の並びが文 sentence である。
- 練習問題1:上記の句構造文法で文と認められる単語の並びをできるだけたくさん書いてみよう。
- 句構造文法の例2:
- S -> NP VP
- NP -> PropN
- NP -> Det N
- N -> Adj N
- N -> Noun
- VP -> IV
- VP -> TV NP
- PropN -> John
- PropN -> Mary
- IV -> walks
- IV -> snores
- TV -> kissed
- TV -> kicked
- Adj -> young
- Adj -> healthy
- Det -> this
- Det -> that
- Noun -> teacher
- Noun -> student
- 句構造文法の解釈規則2:部分構造構成規則としての解釈
- 空の箱を用意する。
- 箱の中に S という記号をひとつ入れる。
- 箱の中の活性化している記号に、句構造規則に従って部分構造を付加する。(句構造規則の左辺にある記号が箱の中にあれば、それを「母親」とし、右辺の記号の並びを「娘たち」とする部分構造で置き換える。)
- これ以上部分構造を付加できなくなったときはこの中にある構造(または活性化している記号(単語)のならび)が sentence である。
- 練習問題2:上記の句構造文法のモデルで文と認められる構造できるだけたくさん書いてみよう。
本日の課題:
- グループごとの課題:以下の課題からふたつ選んで考えてみよう。
- 世界にはいくつ『言語』があるのだろう?それぞれの『言語』は何人ぐらいが使っているのだろうか?
- インターネット上にはいくつの『言語』が流通しているのだろう?それぞれの『言語』は何人ぐらいが使っているのだろうか?
- 早稲田大学で外国語として学ぶことができる言語は全部あわせていくつありますか?
- 日本の大学で外国語として学ぶことができる言語は全部あわせていくつありますか?
- 日本国内で外国語・第二言語として日本語を学習している人は何人ぐらいいるのだろう?
- 日本国外で外国語・第二言語として日本語を学習している人は何人ぐらいいるのだろう?
- 絶滅危惧言語について説明しなさい。
- 共通課題
- どうやって調べたらいいのだろう?実際に調べ始める前の予想を述べなさい。
- 結果的に、どうやって調べたのか、具体的に説明しなさい。
- 自分たちが調べた『情報』が正しいかどうか、判断に自信がありますか?
調べた『情報』が正しいかどうか、どうやって判断するのですか?
その根拠は何ですか?
- 進め方・まとめ方
- はじめに、各自で考えて、意見をまとめること。
- それから、インターネットで検索したり、授業の後で図書館で資料を調べなさい。
- グループごとに意見をまとめて、次週の発表の準備をすること。
- それぞれについて、できるだけ詳しく理由を整理すること。
この授業のねらい
- 『統語論』を中心として『言語学』について主体的に学びます。
- グループでの実習を通じて『情報検索』の基本を学びます。
- 発表の仕方とレポートの書き方の基本を身に着けます。
- インターネットの活用を通じて、『情報リテラシー』を身に着けます。
- グループ活動を通して、仲間を作ります。
10月21日
10月28日
- 授業の概要:
- 各グループの発表
- グループ A
- グループ B
- グループ C
- グループ D
言語天文台
ファイル名は「左から右に読む」とは限らない?!
http://www.atmarkit.co.jp/fsecurity/rensai/tipstoday08/tips01.html
アイコン偽装に負けない秘策は「プレースバー」だ!
http://www.atmarkit.co.jp/fsecurity/rensai/tipstoday06/tips01.html
本日の課題:
- グループで以下から1つ選んで、簡単に調べてまとめなさい。
- いろいろな電子辞書・オンライン辞書の比較
- さまざまな外国語学習(支援)サイトの比較
- YouTube などを使った外国語学習(支援)の比較
- 早稲田大学などで使われている英語学習支援システムの比較
- Versant English Test
- EnglishCentral
- WordEngine
- SpeakESL!
- ATR CALL
- AmiVoice CALL
- ReadPlease!
- 進め方・まとめ方
- グループで進め方を相談しなさい。
- 実際に自分たちで使ってみましょう。
- ひとつだけでなく、複数のサイトを比較してみましょう。
- 言語学・統語論がどのように活用されているか考えてみましょう。
- グループごとに調べた結果を整理して、次回の発表の準備をすること。
- どうやって調べたのか、具体的に説明しなさい。
11月4日
- 招聘講師による講演
- 講師:坪田康(京都大学学術情報メディアセンター・助教)
- 題目:
- アブストラクト:以下の話題について、統語論の応用の観点からお話しします。
- 自己紹介
- 英語プレゼンテーション
- 字幕付き自己紹介動画(英語)の作成について
- 留学生の母語紹介(ギリシャ語・ウイグル語)
- 京都大学の中国語CALLの取り組みについて
- 自己紹介動画(中国語)の作成について
- 本日の課題:
- 講演の感想を A4 用紙 2 ページ程度にまとめ、次回の授業にプリントアウト6部とファイルを持参すること。
11月11日
- 授業の概要:
- 各グループの発表
- グループ A
- グループ B
- グループ C
- グループ D
prolog 入門
- SWI-prolog
- 起動と終了
- データの記述とファイルの読み込み
11月18日
- 授業の概要:
- prolog による知識表現
- prolog による句構造文法の表現
- prologによる語彙情報の実装
- prologによる句構造規則の実装
本日の課題:
- グループで以下からひとつ選んで、インターネット上でどのようなサービスが提供されているか、どのような仕組みで動いているか調べなさい。
- 共通課題
- どうやって調べたらいいのだろう?実際に調べ始める前の予想を述べなさい。
- インターネットだけでなく、図書館で資料を調べなさい。
- インターネット上にどのようなサイトがあるか、ひとつだけでなく、できる限りたくさん見つけなさい。
- それぞれのサイトの特徴、どのサイトが使いやすいかを整理しなさい。
- サイトうちひとつか二つを選んで、どのような処理をしているか、できるだけ詳しく紹介しなさい。
- 進め方・まとめ方
- はじめに、各自で考えて、意見をまとめること。
- それから、インターネットで検索したり、授業の後で図書館で資料を調べなさい。
- グループごとに意見をまとめて、次週の発表の準備をすること。
- 結果的に、どうやって調べたのか、具体的に説明しなさい。
11月25日
- 授業の概要:
- 各グループの発表
- google の検索システムの仕組み
- 機械翻訳システムの仕組み
- 言語資源(コーパス)とは何か?
本日の課題:以下のテーマからひとつ選び、グループで発表の準備を進めなさい。
- 日本語処理システム(Juman と KNP)
- 日本語処理システム(茶器と茶筅)
- 日本語話し言葉コーパス
- 日本語書き言葉コーパス
- 日本語学習者コーパス
12月2日
- 授業の概要
- 構造化文書・タグ付与・マークアップ・アノテーション
- 構造化文書
- SGML・HTML・XML
- web page 作成実習
12月9日
- 授業の概要
- 外国語学習と言語資源
- コーパスに基づく語彙頻度分析
- 語彙パターンに基づく文型頻度分析
- 大学生英語学習者による発話データの収集とアノテーション
- 英語リスニング・スピーキング自動試験
- 非母語話者用音声認識エンジン
- 状態遷移文法に基づく言語モデルの表現
- 項目応答理論
12月16日
- 招聘講師による講演
- 講師:吉本啓(東北大学高等教育開発推進センター・大学院国際文化研究科・教授)
- 題目:言語理論と脳科学に基づく言語処理のモデル化
- アブストラクト: 私たちはふだん何気なく言葉をしゃべっているが、どのようなメカニズムによってそれが可能になるのか、よく分っていない。特に、以下の点について言語学でさかんに研究されてきたが、未解決のまま残されている。
- 発声は人により、場合によって大きく異なるのに、音韻認識をつねにほぼ正確に行っている。
- 1つの言語の語彙 (単語の集まり) は膨大なのに対し、発音された語の理解(脳での辞書引き) をほとんど瞬間的に、しかも正確に行っている。
- 1つの文の統語構造は無限のパタンがあるにもかかわらず、人は文の理解をきわめて短い時間 (長くても1秒以内) で行っている。
- 文を理解する過程において、人は後続のまだ発話されていない語がどのようなものであるかについて予想し、文の理解に役立てている。
- 人は文が最後まで言い尽くされるまで待たなくとも、途中までに言われた分を理解できる。このことが、文の要である動詞が日本語のように文の最後にあらわれる言語についてどうして可能かということについてはよく分っていない。
近年、脳科学や情報科学の急激な発達により、これらの問題を解明するための基盤が整ってきた。本講演では脳機能画像法を用いたデータや数理論理学的な統語理論について照会し、以上のうち (3)〜(5) の問題に関する講演者のこれまでの取り組みについて説明する。結論として、言語の文法とは1次元というきわめて貧しい構造しかもたない音声言語が時としてきわめて複雑な意味を以上の諸点を満たしながら伝達するための手段なのではないかという予想について述べる。
1月6日
- 招聘講師による講演
- 講師:横川博一(神戸大学大学院国際文化学研究科・准教授)
- 題目:言語処理と言語学習
- アブストラクト: 外国語の習得は母語に比べると格段に難しい。近年,外国語習得のメカニズムをリアルタイムでの言語情報処理の観点から捉えようとする動きが盛んになりつつある。今回は,わたしたちがリーディングやスピーキングの力を身につけようとしている外国語学習のプロセスで経験しているさまざまな困難点を出発点に,人間の脳内で繰り広げられている言語情報処理のメカニズムを,(たとえばHPSGのような)言語理論を援用しながら,考えみたい。
1月13日
- 授業の概要:各グループの発表
- 日本語処理システム(Juman と KNP)
- 日本語処理システム(茶器と茶筅)
- 日本語話し言葉コーパス
- 日本語書き言葉コーパス
- 日本語学習者コーパス
1月20日
- 個人発表:今学期のまとめと相互評価
- 発表用ファイルを提出します。
- 一人3分ずつ発表します。
- 発表について相互に評価します。
- レポート第一次原稿提出:今学期のまとめ
- レポートを提出します。
- 相互にコメントします。
- コメントに基づいて修正します。
1月27日
講義要項原稿
- 副題
文法理論の第一歩:文の処理を考える
- 講義概要
この授業の科目名は『言語学(統語論・応用)』となっていますが、『(応用)』というのは春学期の『(入門)』と区別するためにオープン教育センターの要請によって付けたもので、春学期の『言語学(統語論・入門)』に引き続いて統語論の基礎を学ぶ授業です。秋学期のこの授業では、統語論的な文の見方がどのような研究に展開されるか、その『応用可能性』について学ぶことにします。
「言語学」にはさまざまな研究分野がありますが「統語論」というのは、英語や日本語などある一つの言語を考えたとき、どのような要素(単語や句など)が結び合わさってより大きな単位となって行くか、どのような要素の並び方がその言語において正しいものとして認められるかを考察して行くもっとも基礎的な研究分野です。
例えば、英語では John ate an apple.のように<主語>+<他動詞>+<目的語>というような語順が一般的ですが、日本語では「太郎がりんごを食べた。」のように<主語>+<目的語>+<動詞>という語順になります。日本語の文章を英語に翻訳したり、英語の文章を日本語に翻訳しようとすると、このような語順の違いを無視することができません。また、上の英語の文を何らかの要素にわけて考えようとしたとき、どちらかというと an apple の方が eat an よりもまとまっているような気がしますが、こうした文の内部構造というか組み立て方を考えるのも統語論の重要な課題です。
統語論というのは文法理論のもっとも基本となる分野ですが、これを展開していく分野としてはさまざまなものが考えられます。コンピュータを使って言語を処理する機械翻訳や音声翻訳通信などの分野では統語論(文法理論)が基盤となっています。外国語や第二言語の学習と習得を統語論(文法理論)に基づいてモデル化する研究もはじまっています。音声認識を使って外国語の口頭運用能力を測定する自動試験の開発運用にあたっても、大規模言語資源から抽出した語彙情報や回答の文法理論的なモデル化が前提となっています。
この授業では春学期の『言語学(統語論・入門)』に引き続いて統語論(文法理論)の基礎を学びながら、人間やコンピュータがどのように文を処理するか、関連するさまざまな研究分野の考え方や成果について紹介することとします。春学期の『言語学(統語論・入門)』を受講していることが望ましいですが、受講していない人も理解できるような授業を心がけます。言語学・論理学・心理学・情報処理についての予備知識は前提としませんので、ことばについて科学的に考えることに興味がある人は、所属学部・専攻などに関わらず、だれでも受講してください。
- シラバス
概略以下のような流れを予定していますが、進行に応じて調整を行います。詳細についてはこのweb page に記載します。
- 第1回:言語学・言語科学の研究諸分野
- 第2回:文法理論:有限状態文法のモデル
- 第3回:文法理論:句構造文法のモデル
- 第4回:文法処理:prolog による句構造文法の表現
- 第5回:文法処理:prolog による句構造文法の拡張
- 第6回:統語論と言語処理:web と検索エンジン
- 第7回:統語論と言語処理:言語理解と機械翻訳
- 第8回:統語論と言語処理:音声対話システムと外国語口頭運用能力自動試験
- 第9回:招聘講師による講演:言語獲得と言語進化
- 第10回:文法理論と自然言語処理システム:語彙機能文法と XLE
- 第11回:文法理論と自然言語処理システム:主辞駆動句構造文法と LKB
- 第12回:招聘講師による講演:脳科学からみた文法処理
- 第13回:日本語形態素解析
- 第14回:招聘講師による講演:語彙情報とメンタルレキシコン
- 第15回:まとめ
招聘講師としては以下のような人たちを予定しています。
- 東条敏先生(北陸先端科学技術大学院大学・教授)
- 横川博一先生(神戸大学大学院・准教授)
- 吉本啓先生(東北大学大学院・教授)
- 教科書
特に指定しません。必要に応じてプリントを配布したり、web 上に情報を整理して掲載します。
- 参考文献
参考文献などについては授業中に必要に応じて紹介します。言語学関連の入門書、特に統語論の参考書は概して読みやすくありません。丁寧に書かれた参考書を一人で読んで理解しようとすることは重要ですが、それほど簡単なことではありません。統語論・文法理論についての入門書を予備知識がないまま一人で読み進めようとすると混乱することが多いので、まず授業に出席して基本的な考え方についての説明を聞いて理解するとともに課題を自分で考えて見ましょう。仲間がいる人は、数人で議論しながら基本的な教科書を読んでいくと理解が深まりますが、言語学を一緒に勉強する仲間のいない多くの人にとって、この授業に出席する方がずっと簡単に、基本的な統語論上の概念を正確に理解する早道となるでしょう。以下に若干の参考書を紹介しますが、受講前に手にとって難しいからといってがっかりしないでください。授業を受けてから開くと、それなりにわかるようになっていると思います。この授業の内容とは必ずしも対応しませんが、一般に入手可能な本としては以下が参考になるでしょう。
- 現代言語学入門:1 言語学の方法, 郡司隆男・坂本勉, 岩波書店, ISBN4-00-006691-9 C3380, 1999年5月27日.
- 日本語教師・分野別マスターシリーズ:よくわかる言語学, 定延利之, アルク, ISBN4-7574-0129-9 C0081, 1999年11月10日.
- 言語の脳科学:脳はどのようにことばを生み出すか, 酒井邦嘉, 中公新書 1647, 中央公論新社, ISBN4-12-101647-5 C1245, 2002年7月25日.
このほか、担当者が随時紹介します。なお、言語学関連の図書は高額であることも多いので、個人で購入するほか、大学や公立の図書館などで借り出して利用するとよいでしょう。
- 評価方法
以下の配分を目安として評価します。
- 出席・授業への参加度 60%
- レポートや課題の提出状況・努力 20%
- 発想の面白さ・着眼点の確実さ 20%
- 関連URL
- 備考
言語学に関する予備知識は一切前提としません。春学期の『言語学(統語論・入門)』を受講していることが望ましいですが、受講していない人も理解できるような授業を心がけます。統語論(文法理論)の基礎を学びつつ、ゲスト講師の講演も含めて言語研究の最先端の話題に触れますが、言語学・情報処理などについての予備知識はまったく前提としません。知的好奇心のある学生であれば、誰でも受講できます。