這個語料庫由師大華研所建構,專門蒐集華語學習者的中介語語料。目前以生語料庫的形式進行建置,語料資源來自2008年起參加國家華語測驗(TOP)的基礎級及進階級考生的口語錄音檔,以英日韓三種母語者為對象,目前計收錄492人次,約34萬字。 這個語料庫使用方式相當簡單,於首頁輸入單字或短語後,即可搜尋該單字或短語的使用情形。語料皆達段落長度,每筆皆附有文章編號以及學習者母語、性別等背景資料,目標詞語以粗體標示,方便使用者閱讀。除了文字檔,每筆語料後亦附錄音檔供參考。使用者可一次搜尋英日韓三種母語,亦可限定範圍或選擇排序方式。 此外,華語為第二語口語語料庫目前以收錄進階級語料為主,未來將加入高階級語料,可更廣泛地供研究使用。
This corpus specializes in Chinese learners' interlanguage. This database has collected resources from 2008 onwards from beginning-level test takers of the Test of Proficiency (TOP). The resources include audio files from 494 native speakers of English, Japanese, and Korean. Corpus results are up to paragraph length, and each accompanied by an Article ID, native language, gender, and other background information. In addition to a text file, each corpus also attached recordings for later reference. Users can search up English, Japanese, and Korean as well as limit the search range and sorting order.