臺灣國際科展

英文篇章難易度自動分級之研究

科展類別
臺灣國際科展作品
屆次
2017年
科別
電腦科學與資訊工程
得獎情形
三等獎
學校名稱
臺北市立第一女子高級中學
指導老師
黃芳蘭;陳信希
作者
許湘鈴;任恬儀
關鍵字
語法分析,程度分級,語言學習

摘要或動機

以製作適合高中生的英文篇章難易度自動分級為初衷,本研究採高中英文課文為語料,針對「如何分級」,意即從文章萃取哪些特徵、利用何工具或語料協助萃取特徵、以何工具分級等因素,進行研究與實驗,並建立一套新方法。首先進行前處理,再嘗試以單字、句型的數量或比例、句長、音節長、整合以上分析等各式特徵,支持向量機(Support Vector Machines)、隨機森林分類器(Random Forest Classifier)、決策樹分類器(Decision Tree Classifier)、卷積神經網路句分類器(Convolutional Neural Networks for Sentence Classification)等工具,進行將篇章分為高中一、二、三年級等三個難易度等級的測試,建立自動分級模型。最後製作成可供大眾使用的自動分級網頁。各項測試之中,最佳分類效能為整合各項特徵時得到的分類正確率65.04%,經模擬得知,此效能較過去研究,已有所提升。


「為配合國家發展委員會「推動ODF-CNS15251為政府為文件標準格式實施計畫」,以及 提供使用者有文書軟體選擇的權利,本館檔案下載部分文件將公布ODF開放文件格式, 免費開源軟體可至LibreOffice 下載安裝使用,或依貴慣用的軟體開啟文件。」

檔案名稱 檔案大小 格式
英文篇章難易度自動分級之研究 2 MB Adobe Reader(Pdf)檔案