二、八十五年詞頻資料庫

(一)本資料庫為八十五年語詞調查統計所得之資料庫。
(二)本資料庫分單音節詞與多音節詞共有之完整資料庫,及只含多音節詞之資料庫。
(三)完整之資料庫檔名為:85tzall.dbf,有46721筆資料。
  只含多音節詞之資料庫檔名為:85tzall-.dbf,有43854筆資料。
(四)本資料庫欄位名稱與內容:
 NO:序號
 PHRASE:詞目
 DPIWN:出現頻次
 TDPIWN:累積頻次
 PERSENT:出現百分比
 TPERSENT:累積百分比

完整之資料庫
例如:
完整之資料庫
NO  PHRASE  DPIWN  TDPIWN  PERSENT     TPERSENT

1   的    39282  39282   6.36345670   6.36345670
2   在    8522   47804   1.38051469   7.74397139
3   一    7684   55488   1.24476354   8.98873492
4   有    6820   62308   1.10480054   10.09353546
5   是    6692   69000   1.08406528   11.17760074

只含多音節詞之資料庫
例如:
只含多音節詞之資料庫
NO  PHRASE  DPIWN  TDPIWN  PERSENT     TPERSENT

1   可以   1605   1605    0.52745043   0.52745043
2   我們   1140   2745    0.37463769   0.90208811
3   他們   1016   3761    0.33388762   1.23597573
4   台灣   990    4751    0.32534325   1.56131899
5   自己   967    5718    0.31778477   1.87910376

(五)完整之詞頻資料庫請由此下載。只含多音節詞之詞頻資料庫請由此下載


[回首頁]