常用語詞調查統計報告序



  教育部開始規劃年度語詞調查統計工作是在民國八十三年,進行此
項工作的目的主要有三點:
一是藉語言資料的調查來提供分階教育的教材編輯標準參考。
二是藉語言資料的調查來提供語文工具書編輯標準參考。
三是藉語言資料的調查來記錄社會環境變遷的實況。
前面兩點是屬於教育、語文研究的需求,後一點則是全面觀察社會進展
狀況的需求。無論那一點,就目前國家發展來說,都是極其迫切重要
的。教育部國語推行委員會是主管全國語文政策的單位,自然責無旁貸的擔起責任,來進行這項工作。

工作進行的基本模式如下:
一、逐年進行統計,自民國八十四年起,每年提出報告。
二、樣本以當年各大暢銷排行榜上的書籍雜誌為主,並將擴及口語資
  料。
三、語詞依各類領域收集,類別觀念據當年社會現象而分,儘量求其寬
  容。
四、分詞原則依專家學者討論之意見,並逐年檢討修正。
五、不同年度的資料原則上都進行比對。
六、成果分資料庫、統計圖表呈現。除出版書面報告外,並提供所有發展的基礎資料庫供各界參考使用。

語文的問題在國內向來較被忽視,但是語文建設的任何一項成果事實上都是整體社會最重要的資產,也是國家推動各項建設的基礎。以注音符號為例,發展至今,無異是資訊建設的最大利器。因為它幾乎是全民共有的電腦輸入能力。因此對於國內環境所發展的任何語料,理當都不能捨棄。這些語料的整理已非單純語言問題,更是觀察整體社會各領域發展最直接的訊息。

在每一年的調查成果中,會附上當年的字頻表與詞頻表。並提供各種文字屬性的分析結果。字詞頻的利用是觀察語言結構的最佳方法。從出現字數與所累積的頻次分布,可以觀察樣本中文字分布情形,部首、筆畫、音號、構詞能力等屬性出現情形。這些結果無異是編輯教材、工具書的重要參考依據。逐年比較所獲得的舊詞與新詞,也是建立語言層的重要線索。

當然,語言使用都具有一個基本現象,那就進入語言約定俗成的部分不太會改變,周邊的不穩定部分卻可能在尚未穩定之前就已消失。因此即時掌握語言新陳代謝的過程是整理語料的最大挑戰。但是這種現象無法就短暫時間觀察獲得,明確的結果是需要經過長時間的比較與分析的。因此,這項工作希望能長期持續下去,所累積的資料庫具有的利用價值相信也將越來越大。

國語會可利用的資源十分有限,在少許的經費與人力的配合下,開始進行這項系列工作,所期盼的正是將國內語言與社會環境給記錄下來,當然更期盼各界能廣予使用這些成果,並不吝賜教。

 

中華民國八十七年六月 李 鍌敬識

 
 

[回目次]