臺灣國際科展

英文句子依閱讀程度進行簡化之研究

科展類別
臺灣國際科展作品
屆次
2019年
科別
電腦科學與資訊工程
得獎情形
四等獎
學校名稱
臺北市立第一女子高級中學
指導老師
黃芳蘭;陳信希
作者
戴雅婕
關鍵字
語言學習,句子改寫,深度學習

摘要或動機

英文句子簡化是一項單語言句子轉換的任務,其中一句複雜的句子會轉換為一句或多句的簡單句子。相較於過去研究學者著重於研究如何優化句子簡化的結果,如何將一句英文句子依閱讀程度簡化為不同簡單程度的簡化句是一項自然語言處理方面嶄新的研究領域。本研究首先訂定英文分級標準,整合歐洲(CEFR)與台灣(LTTC)母語非英語國家機構對英文的分級標準,將英文分為三種難易程度,並依此將Wekipedia及Newsela的簡化前-簡化後平行語料重新刪整為三種目標程度等級的平行語料庫。另一方面,運用已發展成熟的Seq2seq簡化模型,創造一個多解碼器模型,分別依據目標程度不同的訓練資料集訓練三種解碼器。在BLEU、SARI指標以及Coverage計算下,本研究結果相較於相關研究可展現出優異成果。


「為配合國家發展委員會「推動ODF-CNS15251為政府為文件標準格式實施計畫」,以及 提供使用者有文書軟體選擇的權利,本館檔案下載部分文件將公布ODF開放文件格式, 免費開源軟體可至LibreOffice 下載安裝使用,或依貴慣用的軟體開啟文件。」

檔案名稱 檔案大小 格式
英文句子依閱讀程度進行簡化之研究 2 MB Adobe Reader(Pdf)檔案