二、八十六年詞頻資料庫


一、本資料庫為八十六年語詞調查統計所得之資料庫。

二、本資料庫分單音節詞與多音節詞共有之完整資料庫,及只含多音節詞之資料庫。

三、完整之資料庫檔名為:86tzall.dbf,有47909筆資料。只含多音節詞之資料庫檔名為:86tzall-.dbf,有45108筆資料。

四、本資料庫欄位名稱與內容:

  每單筆資料包括以下欄位:

  欄位名
   NO 序號
   PHRASE 詞目
    DPIWN 頻次
    TDPIWN 累積頻次
    PERSENT 百分比
    TPERSENT 累積百分比

◎完整之資料庫
如:
二、八十六年詞頻資料庫
NO  PHRASE  DPIWN  TDPIWN  PERSENT     TPERSENT
1    的    35730   35730  5.80908546  5.80908546
2    在      8108   43838  1.31822180  7.12730725
3    有      6235   50073  1.01370411  8.14101136
4    是      5783   55856  0.94021666  9.08122802
5    了      4581   60437  0.74479206  9.82602009

只含多音節詞之資料庫
例如:
二、八十六年詞頻資料庫
NO  PHRASE  DPIWN  TDPIWN  PERSENT   TPERSENT
1   可以    1227    1227  0.38933100  0.38933100
2   我們    1169    2396  0.37092741  0.76025841
3   台灣    1053    3449  0.33412025  1.09437866
4   沒有    1032    4481  0.32745688  1.42183554
5   他們      967    5448  0.30683217  1.72866771

完整之詞頻資料庫請由此下載

只含多音節詞之詞頻資料庫請由此下載
 
 

[回前頁]