臺灣網路科教館

魔鬼藏在細節中－實時影像隱藏浮水印

本研究旨在透過DCT-SVD演算法，即時對動態影像，嵌入人眼幾乎不可見的浮水印。經過測試，該演算法具有一定的抗攻擊性，可以保障影像受到他人壓縮、裁剪等操作後，能還原嵌入的浮水印資料。嵌入的浮水印有多種用途。舉例來說，版權方可以在動態影像中，嵌入可辨識被授權者資訊的資料。當被授權者私自將影像給予未授權者，版權方可以透過還原浮水印的方式，追蹤違反授權的被授權者，並採取必要的法律行動，以保障版權方的權益。或者反過來思考，對於監視器畫面之類需要做為證物的影像，當偵測到浮水印遭到破壞時，就代表該影像經過人為修改，可能不具有法律效力。

換句話說

BERT近年來在各式NLP任務中可說是無處不見、無所不在，其中使用fine-tuning的訓練方式更是可以幫助研究者省下大量的時間及運算成本，且結果都有不錯的表現。本研究探討在結合不同條件的文本訓練下，基於對BERT模型做fine-tuning且讓其進行文本分類，觀察其對於預測及分類中文句子通順程度的成效，並且根據訓練出來的模型設計修正方式嘗試使其對預測中不通順之文本進行自我修正，並分析其成效與結果。

影片情境化字幕實現探討

本研究旨在改善聽障人士無法完整接收影音類型資訊的狀況，探討各種影片處理技術，尋找、嘗試並比較各種方法，整合出最適合的系統自動替影片嵌入情境化字幕——用視覺的方式呈現影片聽覺訊息，讓聽障人士便於理解各種類型的影片內容與資訊。為此，我們呈現的情境化字幕有主要幾個特點： 1、將聲音對話轉為字幕標記在說話者旁，透過畫面中語句位置就可以了解跟語者的對應關係。 2、畫面中字幕會以漸漸上飄消失的泡泡字幕來呈現，使觀影者有充足時間閱讀字幕理解內容。 3、將環境音效如電話聲、雷聲與貓叫聲等各種能傳達資訊的聽覺訊息標示在畫面中。藉由這些處理使畫面呈現更豐富的影片資訊，最終達到改善聽障人士資訊接收權益不平等的目標。

GAN圖像生成模型之畫質與效能強化

近年來，名為生成對抗網路的非監督式學習方法蓬勃發展，透過使產生假資料的生成器與辨別資料真偽的辨別器互相學習，只要提供資料集便可學習其特徵而生成出能以假亂真的資料。本研究提出一套針對現有生成圖像的生成對抗網路模型的改良方法，透過進行實驗探討不同變因對生成品質與效率的影響，調整原有的優化器設置、卷積層參數、模型架構等，並以客觀指標評估實驗結果，證實經過本研究提出的方法改良有更好的效果。另外改進的方式應用在各種資料集訓練的模型及更高解析度的模型，數據表明也有不錯的成果。而本研究希望能提供更明確的模型改進方向給研究人員，並減少嘗試改良模型所花費的時間與能源成本，以此減少訓練龐大的模型所造成的環境影響。

線上教學 -- 深度學習專注力分析

自2020年受到新冠肺炎疫情的影響，許多原有的生活、工作與學習型態都受到了影響。為了控制疫情，減少面對面接觸是其中一種方法，學習模式亦從實體轉變成線上。因學習都是面對鏡頭進行，老師很難掌握學生實際的學習狀況，也不易確認學習的品質。沒有專注就沒有辨識、學習記憶。鄭朝明（2006）提到專注力與學習有密切關係，線上學習容易受到許多外在環境的誘惑導致專注力下降。本作品提出利用人工智慧中的深度學習，透過學生學習時的鏡頭畫面進行臉部特徵擷取，作為深度學習之分類器的輸入進行辨識，並將辨識出的狀態分析後得到結果。教師可利用分析出的結果進行教學模式的調整，以提升學生學習的狀態與品質。

利用機器學習分析音樂情緒與機器人實作應用

為消除播放清單中特定使用者所討厭的音樂類型，本研究結合音樂分析和自動播放器功能，利用深度學習技術分析音樂，將擁有類似情緒的音樂分為同一類。讓使用者自由選擇類別，提高播放清單的類別相似性和使用體驗。實作上使用Discord Bot呈現，其最大優勢是可提供多人多伺服器同時使用，且操作方便。儘管MobileNet的預測結果有待提高，但對使用者而言已不成問題，期望未來能夠進一步改進以提供更好的體驗。

連鎖遠端研發助手

本研究旨在利用遠端工作和物聯網技術開發名為「連鎖遠端研發助手」的研發裝置。通過以連鎖烘焙為範例進行測試，探討其可行性和時效性。該研發裝置具有以下優點： 1. 多人多地共同研發：減少人員奔波和交通住宿費用，有效結合人力相互支援，快速達成目標。 2. 共享與同步資訊：快速修正研發缺失，及時彌補缺失，完善成品。透過物聯網技術，快速分享配方至各連鎖商店，協助製作出品質一致的優良商品。 3. 提升研發效率：通過APP操作遠端伺服機器，擴大遠端工作範圍，快速獲得產品數據。有助於研發人員更容易取得成果，快速推動該產業發展。本研究結果顯示「連鎖遠端研發助手」具有可行性和時效性，未來有望成為研發平台，協助產業發展。

以大腸直腸癌預測為例進行缺失值處理方式的探討與實驗

機器學習和精準醫療是目前醫學界的熱門話題。機器學習在醫療領域的應用越來越普及，可幫助臨床更快速及精準診斷疾病，並提供個人化治療方案。例如，通過訓練大量醫學影像數據，建立深度學習模型，可用於腫瘤的自動辨識與分類。通過醫療資料大數據分析，可以為臨床提供及時的疾病預測和預防建議。然而，如何讓臨床資料結合機器學習建立模型預測，是很重要的議題。本研究使用臺北醫學大學數據處蒐集衛生福利部雙和醫院的大腸直腸癌與大腸炎病患三年的臨床資料，結合機器學習進行模型的建立與預測。經處理數據的缺失值、特徵的排序與選取及向前特徵選取法來訓練與驗證模型，找出分辨大腸直腸癌和大腸炎的最佳檢驗項目組合及效能，以預測大腸直腸癌。

隱藏在聲音中的魔鬼-探討adversarial voice attack對智能語音辨識模型影響之研究

本研究的目的在於探討Adversarial Voice Attack在對保護智慧財產權、抵抗自動翻譯的能力和預防智能設備危險，並以此進行大規模的應用。我們本次使用了常被用來做為翻譯系統的silero作為研究基礎和試驗對象，使得我們可以評估我們的對抗性樣本是否可以作為對抗自動翻譯的手段和它對模型的效果。利用FGSM(Fast Gradient Sign Method)方法生成對抗性noise來干擾模型對語音的辨識效果。我們的目標為透過解析模型label來製作能夠對模型進行有效攻擊的對抗性樣本，並以進化策略(Evolution Strategies)嘗試進行黑箱攻擊。根據研究結果顯示在已知模型梯度的情況下可以做出噪聲極小的對抗性樣本。而我們在使用進化策略其中的協方差矩陣自適應進化策略(Covariance Matrix Adaptation Evolution Strategy)進行黑箱攻擊也可以使得製作出來的對抗性樣本的噪聲難以被人體感知。

自監督學習在臺灣手語辨識上之應用研究

在臺灣手語辨識，先前研究所使用的監督式學習需要大量標記樣本而限制可辨識詞彙量。為此，本研究借鑒自然語言處理領域中BERT的遮罩想法，將未標記手語影片隨機遮蓋部分幀數，並讓模型學習預測被遮蓋的幀數以學習臺灣手語的特徵，並透過遷移學習來訓練辨識模型，此作法可克服現有臺灣手語資料缺少的問題。經過實驗，本研究訓練之詞彙辨識模型達成了242個單字量，92%的準確率。此外，先前研究皆未在手語句子翻譯上有成果。因此本研究基於以上模型，設計手語翻譯的系統，整個系統在100個句子的翻譯表現達到83%的準確率，證明自監督學習的方式在手語辨識、翻譯上是有效的。並展現出樣本需求少與辨識詞彙量可輕易擴大的潛力。

電腦與資訊學科