全國中小學科展

英文篇章難易度自動分級之研究

科展類別

臺灣國際科展作品

屆次

2017年

科別

電腦科學與資訊工程

得獎情形

三等獎

學校名稱

臺北市立第一女子高級中學

指導老師

黃芳蘭;陳信希

作者

許湘鈴;任恬儀

關鍵字

語法分析,程度分級,語言學習

摘要或動機

以製作適合高中生的英文篇章難易度自動分級為初衷,本研究採高中英文課文為語料,針對「如何分級」,意即從文章萃取哪些特徵、利用何工具或語料協助萃取特徵、以何工具分級等因素,進行研究與實驗,並建立一套新方法。首先進行前處理,再嘗試以單字、句型的數量或比例、句長、音節長、整合以上分析等各式特徵,支持向量機(Support Vector Machines)、隨機森林分類器(Random Forest Classifier)、決策樹分類器(Decision Tree Classifier)、卷積神經網路句分類器(Convolutional Neural Networks for Sentence Classification)等工具,進行將篇章分為高中一、二、三年級等三個難易度等級的測試,建立自動分級模型。最後製作成可供大眾使用的自動分級網頁。各項測試之中,最佳分類效能為整合各項特徵時得到的分類正確率65.04%,經模擬得知,此效能較過去研究,已有所提升。

英文篇章難易度自動分級之研究

Adobe Reader(Pdf)檔案