中国語コーパス言語資源

·   大規模言語資源データベースSHACHI(世界の言語資源リストと検索)

·         Penn Chinese Treebank Linguistic Data Consortium, University of Pennsylvani(中文句結構樹資料庫)

 

·       The UCLA Chinese Corpus


·         University of Leeds A collection of Chinese corpora (中国語単語検索サイト)


·     Child Language Data Exchange System(CHILDES)  子供口語コーパス East Asian Corporaに広東語や北京語データ有り

 

     捜文解字

台湾中央研究院語言学研究所の漢語口語語彙コーパスにある。「漢語大字典」の常用漢字3000字を例文とともに公開。品詞分類や頻度が明記されており語学的価値   が高い。