口語問卷資料庫使用說明

總編輯 曾榮汾

  民國八十七年教育部在進行「八十六年常用語 詞」調查時,嘗試對口語資料加以收錄,其中有一項工作是針對全國四級學校學生作抽樣調查。在不同的主題導引下,藉以了解四級學校學生使用語詞的情形。當初 規劃此項工作時,本就希望透過問卷所得到的答案,除作為語詞資料外,更盼能協助區別四級學生用語的特色。所以當完成整個口語資料整理後,編輯小組特別把問 卷部分獨列出來,發行成單獨的一份報告,附上所有的資料庫,提供給各界參考。

  這份報告中,不但列出了原有問卷設計觀念與內容,也將分類收錄情 形與四級詞頻表交叉比對的結果一併呈列。在資料庫欄位中,無論總詞頻表或各級學校的詞頻表,都將四級學校詞頻表的頻序與頻次附列上去。為了保持一貫的客觀 立場,小組在統計方面只作了初步的觀察,如四級詞頻表共有與未共有的了解、頻序交互比較等,這些都是為了說明四級學校學生使用語詞的參差情形而已,其餘的 各種問題則留待使用者進一步的探討。

  在報告書末所列的「語詞資料彙編」,其中無論中英略語或英文、數 字詞,都是忠實反映了目前口語中一般的現象。今日日常生活語言中夾雜外語,或利用「數字詞」來表達的方式已是流行趨勢,某些語詞所表現的強勢功能,連對應 的純中文詞都無法抗衡。這種現象普遍存留於口語、網路環境書寫語言中,非常值得注意。

  為了即時收錄語言資料,編輯小組每天記錄報紙、廣播電視節目、網 際網路網頁的用語,並抽選暢銷書、雜誌為樣本,作分詞統計,總成果則匯聚成「年度常用語詞報告書」、「新詞語料彙編」,作階段性發表。主要目的就是要透過 語言來記錄社會演變的狀況。長年累計所得,就像語言進展的縱剖面,起伏曲線說明演變的事實。但是若要對於同一時段語言橫斷面的了解,則單憑縱剖面的訊息是 不足的。語言的橫斷面包括對使用者年齡層、學歷層、職業層、方言層、生活環境層等不同層次的了解。取得這些層次的訊息,當然也是進行語料整理時不容忽視 的。因此,這一次對四級學校學生用語的調查,目的雖不在語言層的區別,但調查結果應於此方面研究所有助益。

  比照往例,這些的資料庫只要經申請後,皆可下載利用。期盼這些資料對語文教育的推展有所助益,而這也正是教育部進行系列工作的用心所在。編輯小組在有限條件下,將陸續提供一些整理成果,歡迎各界使用指教,謝謝!

 

[回前頁]