全國中小學科展

依全國中小學科展屆次查詢

依相關評語查詢

電腦與資訊學科

自監督學習在臺灣手語辨識上之應用研究

在臺灣手語辨識,先前研究所使用的監督式學習需要大量標記樣本而限制可辨識詞彙量。為此,本研究借鑒自然語言處理領域中BERT的遮罩想法,將未標記手語影片隨機遮蓋部分幀數,並讓模型學習預測被遮蓋的幀數以學習臺灣手語的特徵,並透過遷移學習來訓練辨識模型,此作法可克服現有臺灣手語資料缺少的問題。經過實驗,本研究訓練之詞彙辨識模型達成了242個單字量,92%的準確率。 此外,先前研究皆未在手語句子翻譯上有成果。因此本研究基於以上模型,設計手語翻譯的系統,整個系統在100個句子的翻譯表現達到83%的準確率,證明自監督學習的方式在手語辨識、翻譯上是有效的。並展現出樣本需求少與辨識詞彙量可輕易擴大的潛力。

西洋棋反作弊系統實作

本研究主要是為了提升在線上西洋棋網站中對弈的公平性,希望可以用自動化的模型幫我們抓出作弊者。 首先我們需要將棋局PGN檔先預處理成訓練要用的模式,接下來將分成兩組實驗進行:一是用每步著法及時間放入深度學習網路製作模型,二是以子力停留位置製作的熱圖配合卷積神經網路製作。 研究結果顯示,使用深度學習的模型判斷結果比用卷積神經網路的模型還準確一些,而使用卷積神經網路的模型中,我們發現加入子力權重的模型會比沒有加入的準確一些,但是還是比不上深度學習的模型。

馬賽克強化—抵抗人臉馬賽克還原模型

近年來,AI技術逐漸成熟,現今已有能夠還原馬賽克之 AI模型問世,因此進行馬賽克處理之圖片並不絕對能保證隱私的安全。為此本研究提出一套針對人臉馬賽克還原模型PULSE的馬賽克強化方法,透過設計實驗探討不同變因對 PULSE還原圖像之影響,並以客觀指標評估實驗結果。實驗結果證實經過此方法處理過之圖片能獲得比 PULSE原始預測更低的相似度,最後歸納出一套馬賽克方法,此方法能使16×16和32×32解析度馬賽克獲得相對較低之相似度。本研究之成果能應用於新聞媒體及訪談節目中,對需要保護之人臉進行強化之馬賽克,用以增加對人臉隱私之保證。

基於影像識別與感測裝置之坐姿偵測輔助系統

本研究旨在開發一套系統,判斷使用者是否久坐與使用電腦的姿勢是否正確,並即時提供回饋。此坐姿輔助系統僅需使用電腦內建視訊鏡頭以MediaPipe BlazePose影像辨識模型抓取上半身節點資訊,並透過雙腳穿戴micro:bit感測裝置取得腳部三維加速度值。研究者蒐集各年齡層不同姿勢下的數據,討論其差異並計算F-score值以訂立閥值,判斷使用電腦的姿勢。同時,研究者運用PyQt套件建立使用者介面,使得系統能夠進行個人化設定,並即時地提供回饋。相較現有研究,本研究所提出之系統更輕量化、方便使用且成本更低。

探討資料量對本地端語言模型的影響與實作

隨著人工智慧和自然語言處理技術的發展,客戶端小型語言模型在各種應用中扮演著日益重要的角色,例如智能手機、物聯網設備和邊緣計算裝置等。這些小型 語言模型需要在有限的計算資源和存儲空間下實現高效的自然語言處理能力。在這種情況下,訓練資料量的大小對於客戶端小型語言模型的性能至關重要。 過去的研究已經表明,大規模的訓練資料對於建立高性能的語言模型至關重要, 但對於客戶端小型語言模型而言,資源的限制使得無法直接應用這些方法。因此,我們需要探討訓練資料量對於客戶端小型語言模型的影響,以找到最佳的平衡點。本研究的結果將有助於指導客戶端小型語言模型的設計和訓練,從而更好地滿足現實世界中的應用需求,同時充分利用有限的計算資源和存儲空間。

開發新型演算法於探究異常值在迴歸分析中的影響與應用-分析照「騙」

本研究主要分成兩大主軸,第一先深入探討迴歸分析中異常值對模型的影響,發現一般的模型在面對數據中的異常值會降低其穩健性,因此藉此特性,我們結合了K-近鄰演算法(K-NN)、模糊理論與深度學習等,自創了新穎的演算法進而找出數據中的異常值;第二為應用此演算法來分析與處理圖像中「不正常區塊或雜訊的輪廓」,達到抑制其對整體美觀的影響,再進一步分析深度偽造(Deepfake)所合成的圖像。研究結果顯示,相較於現有的類神經網路中激活函數ReLU之計算,我們的演算法較容易處理異常值的影響且分析圖像的應用之表現更佳,未來的研究方向可能包括進一步評估其他演算法的效能與將其優化以提高其效能和實用性。

關於我與ChatGPT成為一家人的那件事

本研究透過ChatGPT提示工程的研究將生成式AI的應用融入日常生活中。在實作上透過Google Cloud Functions 建置並連結多個雲端服務,實現一個AIoT執行環境。研究架構的底層為智慧居家模型,其中涵蓋霍爾感測器與低功率雷射的入侵偵測、IR測距感測器的門禁偵測、溫溼度的偵測與加熱片的溫溼度調整,並利用調光玻璃達成光線遮斷與隱私權保護等智慧居家生活需求。在系統整合上,透過Line 聊天機器人進行指令的發送與訊息接收。為了更人性化的解析所有的指令信息,我們透過Google Cloud Functions介接到OpenAI下達提示(Prompt)指令,產生真正的動作指令後傳送給MQTT Server,最終由MQTT發送動作指令的信息給底層的智慧居家模型;此外,所有底層感測器的環境偵測訊息皆可以透過ESP32 MCU進行蒐集應用。

智慧醫療-基於階層式機器學習的心律疾病檢測系統

本文提出了一種階層式兼投票式的心律疾病智慧醫療檢測模型,以MIT-BIH心律資料庫為基礎,建立了兩種判別模型。模型一針對正常心跳N及較常發生的V、L、D、R、A(見表3)五種心律疾病進行單一疾病分類;模型二針對疾病較多的N、SVEB、VEB、F、Q(見表4)五類進行分類。採用階層式模型使各層獨立訓練、二分法使資料量均勻;在階層式模型上增加投票式模型,使各層以多種機器學習共同判斷,並按各機器學習訓練之準確程度調整比重。研究結果顯示,模型一最終準確率達99.01%,五種分類類別中有四種召回率達97%以上;模型二整體準確率98.74%,N、VEB、SVEB、F、Q五類召回率分別達99.5%、97.1%、83.6%、77.8%、85.7%。兩模型對於心律疾病判別準確率均較近年論文有所突破。

醫學影像重建之神經外科腦瘤移除模擬手術實現

培訓一位醫生的時間非常的久,除了在醫學院花上7~8年的時間學習之外,畢業取得住院醫師的身份後,還需要在醫院中選擇特定專業科目受訓,依照科別不同,受訓的時間從3~7年不等,其中神經外科醫生就需要花上7~8年的時間受訓,受訓後再通過專業醫師執照考試,才能正式成為醫師。 醫生的訓練過程費時耗力,在醫療訓練資源有限的情況下,採用虛擬實境(Virtual Reality,VR)科技,可以把手術訓練帶到虛擬世界中,不僅可以提供手術前開刀策略判斷,更可以提高醫療成功率。 本研究主要針對腦部腫瘤手術,藉由運用3D Slicer重建腦部腫瘤3D模型,並轉入到Unity製作手術模擬過程,再轉入到VR,讓醫師可以透過VR虛擬實境,進行手術練習與模擬。

語音模型逆向攻擊實現與分析

本研究中,我們對模型逆向攻擊在語音辨識系統中的影響及風險進行深入分析。隨著Siri、Google Home等智能助理設備在日常生活中的廣泛使用,其語者辨識系統的安全隱患引起了我們的注意。本研究目的在於深入理解模型逆向攻擊的運作機制,並探討其對語音辨識系統的攻擊效果。我們透過實施多樣化的攻擊策略,對不同的模型架構和數據處理方法進行了評估,並對人聲與非人聲的數據集進行了攻擊效果的比較。此外,我們亦實現了基於差分隱私的防禦算法,在多數模型架構下達到接近50%的防禦效果,顯著提高攻擊代價。研究整體揭示了語音辨識系統在面對模型逆向攻擊時的脆弱性,並藉由實驗分析推論出可能的防禦策略,期待能通過策略來增強模型的安全性。