· Penn Chinese Treebank Linguistic Data Consortium, University of Pennsylvani(中文句結構樹資料庫)
· University of Leeds A collection of Chinese corpora (中国語単語検索サイト)
· Child Language Data Exchange System(CHILDES) 子供口語コーパス East Asian Corporaに広東語や北京語データ有り
捜文解字
台湾中央研究院語言学研究所の漢語口語語彙コーパスにある。「漢語大字典」の常用漢字3000字を例文とともに公開。品詞分類や頻度が明記されており語学的価値 が高い。