一、八十八年網頁用語資料庫

(一)本資料庫蒐集網際網路上各網站所使用的語詞資料。

(二)本資料庫資料來源:

1.參考OPENFIND搜尋引擎中的熱門查詢排行榜。

2.各類型主題網站共一百二十四個。

(三)本資料庫包含時間:民國88年9月至民國88年10月。

(四)本資料庫包含字頻資料庫、詞頻資料庫二部分。

◎字頻資料庫:

每單筆資料包括以下欄位:

每單筆資料包括以下欄位
 

欄位名

   
 

NO

序號

 

PHRASE

詞目

 

DPIWN

頻次

 

PERSENT

百分比

 

TPERSENT

累計百分比

例如:

八十八年網頁用語資料庫
NO PHRASE DPIWN PERSENT TPERSENT
1 5505 2.17040755 2.17040755
2 2358 0.92966776 3.10007530
3 1726 0.68049472 3.78057002
4 1725 0.68010046 4.46067048
5 1693 0.66748410 5.12815458

◎詞頻資料庫

每單筆資料包括以下欄位:

每單筆資料包括以下欄位
 

欄位名

   
 

NO

序號

 

PHRASE

詞目

 

DPIWN

頻次

 

PERSENT

百分比

 

TPERSENT

累計百分比

例如:

詞頻資料庫
NO PHRASE DPIWN PERSENT TPERSENT
173 如何 97 0.07001891 34.85642514
174 名稱 96 0.06929707 34.92572221
175 國際 96 0.06929707 34.99501927
176 說明 96 0.06929707 35.06431634
177 銀行 96 0.06929707 35.13361341

(五)因資料量龐大,故採以資料庫( .dbf )型態儲存,請由此下載資料庫。

[回前頁]