CSJ-XSL サンプル

CSJ-XMLユーザ向け

CSJのXML文書から必要な情報を抽出して必要な形式で出力するXSL(T)を掲載します。

動作の保証は(したいところですが)できません。ご利用の際にはよく内容をお確かめ下さい。

 

名称 役割 具体的な処理内容 実行例 備考
adj_acc 形容詞のアクセント位置を分析する SUW要素に注目し、SUWPOS属性の値が「形容詞」であるもののXJToBILabelWord要素のPerceivedAccPosition属性の値を出力する。
高い,連用形,タカカッ,2,
若い,連体形,ワカイ,2,
大きい,連体形,オーキー,3,
CSJの利用ガイドで例示。
extract_SUW 短単位情報を抽出する SUW要素に注目し、PlainOrthographicTranscription, OrthographicTranscription, SUWLemma, SUWPOS属性の値をカンマ区切りで出力する。
小型,小型,小型,名詞
犬,犬,犬,接尾辞
ブーム,ブーム,ブーム,名詞
CSJXMLBrowserで作成後修正。

extract_Mora

モーラ情報を抽出する IPU要素に注目し、IPUStartTime、IPUEndTime属性の値を出力したうえで、下位のMora要素のMoraEntity属性の値を出力する。 0017,00044.222,00045.047,イワレテイマス,
0018,00045.398,00047.453,マタカイガイノエーケンキューデワ,
0019,00047.680,00049.310,シゴサイジヨージワ,
 
extract_filler フィラーとその前後の短単位を抽出する SUW要素に注目し、TagFillerMidst, TagFillerStart、TagFillerEnd属性のどれか一つが1であれば、PhoneticTranscription、SUWLemma、SUWDictionaryForm、TagFillerMidst, TagFillerStart、TagFillerEnd属性の値を出力したうえで、前後のSUW要素のSUWLemma属性を出力する。 (F エー),えー,エー,,1,1,て,知見
(F エ),えー,エー,,1,1,ます,長調
(F エ),えー,エー,,1,1,,成人
 
extract_F0_near_pnlp PNLPラベルの直前の"A"および"pH"の位置でのF0値を出力する "PNLP"の直前の"A"の位置でのF0を出力、"PNLP"の直前の"pH"の位置でのF0を出力する。 355.329,202.847,
186.003,163.804,
369.859,321.504,
 
extract_verb+following 動詞を抽出し、当該品詞と後続品詞の情報を出力する SUWPOS属性の値が「動詞」であるSUW要素に注目し、そのPhoneticTranscription属性やSUWLemma属性などを出力するとともに、後続のSUW要素の情報も出力する   スタンフォード大学車田様からご依頼
 

 


 

 

 

 

2007 1030 -->">2007 1030 -->-->-->"> 2007 1030 ">2007 1030 ">2007 1030 #EndDate -->