實現圖像敘述自動生成之中文化
目前市面上已經有不少產品應用到自然語言處理 (natural language processing, NLP) 的技術,例如聲音或是圖像標註,但是關於圖像標註的研究大部分是針對英文,因此我們想要進行中文的圖像標註研究。在本研究中,我們嘗試建構神經網路,並使用Microsoft COCO: Common Objects in Context 數據集訓練模型,並試著調整模型以達到較好的圖像標註效果。使用深度學習神經網路作為翻譯流程的工具,並嘗試配合各種不同的網路架構。為了能達到從序列到序列 (seq2seq) 的效果,我們的網路使用了編碼器 - 解碼器 (encoder-decoder) 的結構,編碼器的部分使用CNN,解碼器的部分使用RNN,這樣能有效地傳達序列並有較多種神經網路組合方式。