全國中小學科展

英文句子依閱讀程度進行簡化之研究

科展類別

臺灣國際科展作品

屆次

2019年

科別

電腦科學與資訊工程

得獎情形

四等獎

學校名稱

臺北市立第一女子高級中學

指導老師

黃芳蘭;陳信希

作者

戴雅婕

關鍵字

語言學習,句子改寫,深度學習

摘要或動機

英文句子簡化是一項單語言句子轉換的任務,其中一句複雜的句子會轉換為一句或多句的簡單句子。相較於過去研究學者著重於研究如何優化句子簡化的結果,如何將一句英文句子依閱讀程度簡化為不同簡單程度的簡化句是一項自然語言處理方面嶄新的研究領域。本研究首先訂定英文分級標準,整合歐洲(CEFR)與台灣(LTTC)母語非英語國家機構對英文的分級標準,將英文分為三種難易程度,並依此將Wekipedia及Newsela的簡化前-簡化後平行語料重新刪整為三種目標程度等級的平行語料庫。另一方面,運用已發展成熟的Seq2seq簡化模型,創造一個多解碼器模型,分別依據目標程度不同的訓練資料集訓練三種解碼器。在BLEU、SARI指標以及Coverage計算下,本研究結果相較於相關研究可展現出優異成果。

英文句子依閱讀程度進行簡化之研究

Adobe Reader(Pdf)檔案