全國中小學科展

依全國中小學科展屆次查詢

依相關評語查詢

電腦與資訊學科

「羽」你同行–基於多模態深度學習與大語言模型的手機端羽毛球姿態矯正系統

隨著台灣在奧運羽球雙打再奪金牌後,更多台灣人想嘗試這項運動。為提升新手學習效率,本研究旨在開發一套幫助新手透過手機進行姿勢矯正的軟體。首先,本研究選擇BlazePose模型當作人體姿態辨識模型,並訓練MLP、KNN及YOLO等姿勢分類器。其中,KNN分類器在影片姿勢分類表現最佳,準確率達94.80%。此外,本研究設計Ball In Ball Out流程可偵測羽球並自動剪輯單一打擊片段,準確率為95.89%。經上述多模態資料分析後,再檢查常見錯誤姿勢及比對專家姿勢差異,最終LLM給予使用者姿勢錯誤矯正建議。羽球專家對姿勢矯正建議的平均認同百分比達82.40%,羽球新手達81.16%。

基於多項人工智慧之多模態失語症溝通系統探究

本研究開發了一個基於多項人工智慧技術的多模態失語症溝通系統,旨在提供失語症患者能提升表達自我和參與社交的能力的工具。系統以iOS App作為主體,接收環境影像、語音、唇語、手勢及情緒等多模態資訊後,透過大型語言模型產生完整敘述,再以語音合成播放。研究創新開發AphasiaSim-LLM生成高度擬真的模擬失語症語料,並以量化評估取代主觀評分,證實Gemini 2.5 Flash於語句還原表現最佳;此外亦建構了輕量級手勢辨識模型,並以ORB演算法優化關鍵幀提取;透過異步處理、FFmpeg影片取幀及輕量Flux文生圖模型等優化策略,最終完成能有效輔助失語症患者進行流暢溝通之系統。

基於YOLO物件偵測之長者居家行為識別暨照護輔助系統

隨著高齡化社會來臨,長者夜間跌倒事故頻傳,居家安全成為急需解決的問題。本研究提出一套以深度學習與影像處理技術為核心的智慧監測系統,重點為夜間跌倒事件的即時辨識與預警。系統運用OpenCV進行影像增強,改善夜間低光環境下的影像品質,再以深度學習模型Ultralytics YOLO11進行精準的跌倒偵測,達成即時通報與警示。此外,整合臥床偵測、夜間燈條引導與浴室進出監控,提供全方位居家安全防護。所有檢測數據即時記錄至Web Server(HTML、JavaScript、CSS、Flask、MySQL架構),供遠端監控與數據分析。經實驗證明,本系統能準確辨識夜間跌倒事件,有效減少長者夜間意外事故發生,對高齡社會居家安全具重要貢獻。

全「面」分析 : 基於面部表情的情緒模型

本研究著重於透過面部表情的判斷進而推斷情緒狀態的深度學習神經網路模型。首先,將人類的情緒狀態分為七個類別,並透過MediaPipe框架取得影像中的臉部特徵位置,利用其座標框定臉部範圍並作為深度學習模型的輸入。第二,透過部不同特徵訓練模型,進一步優化模型識別情緒的準確度,並嘗試不同的特徵,例如:趨勢曲線函數的係數或是各種向量。最後我們設計了一個插件,利用此模型在Google Meet中進行即時的影像辨識並分析,作為線上課程的授課成效評估。 目前本模型在透過五層卷積層配合池化層及全連階層,並提取瞳孔眉毛向量、瞳孔鼻尖向量以及口部中心為基準點的向量作為特徵,能夠有84%的準確度,F1值落在約85,其中快樂情緒的辨識精準度高達98%。

單手操作無障礙—鍵盤與滑鼠的整合設計研究

本研究旨在解決肢體障礙或單手使用者在操作電腦時所面臨的不便,設計一款融合鍵盤與滑鼠功能的單手操作裝置。透過自製PCB電路板、客製化鍵帽與鍵軸配置、3D列印人體工學外殼,以及整合滑鼠感測器與QMK韌體技術,實現單手即可同時完成鍵入與游標控制的操作方式。我們的實驗結果顯示,單手使用時相較於傳統鍵鼠組合,本裝置能大幅減少手腕移動的距離與次數,有效提升使用效率並降低疲勞感。產品設計不僅針對身障者,也適用於特定單手使用情境,具備良好的通用性與實用價值。未來將持續優化硬體與軟體,期望推廣至更廣泛的使用族群,實踐科技輔具的社會意義。

貓奴們別擔心-AI Discord幫你

本研究開發智慧寵物健康監控系統,融合熱顯影感測、AI學習、物聯網與邊緣運算,解決傳統健康監測無法即時數據化與預警的問題。初期以問卷與5W2H問題分析建構四大功能:體溫監測與AI發燒預測、糞便辨識與分類、飲食與飲水記錄、異常即時通報。 系統採用MLX90640熱顯影模組與ESP32-S3監測體溫,糞便辨識以Edge Impulse訓練模型,搭配ESP32-S3CAM實現即時運算。飲食行為由 HX711 與超音波感測器記錄,並同步推播至 Discord平台。分類模型參考獸醫建議導入布里斯托分類法,提升精準度。系統具備低成本、高精度與高度擴展性,展現智慧照護應用潛力。

AI’S A IS FOR APPLE 基於人工智慧影像辨識之水果品質辨識及分類

本研究開發了一種基於影像辨識的水果品質分類系統,採用最適合同時處理局部及全局資訊的 Swin-Transformer 模型,透過分析水果外觀來判斷其品質,並多次實驗以調整參數、訓練多個模型以辨識不同水果種類與品質。 使用者上傳水果影像後,系統即能識別水果種類和品質,並提供新鮮度建議與食用方式。此系統相較於傳統的檢測方法,具備非破壞式檢測優勢,且降低成本,適用於農業生產與消費市場。 模型測試結果顯示,水果類型分類器準確率為99.0%,蘋果品質分類器為85.04%,橘子品質分類器為97.67%,顯示該系統在分類與品質評估上具有較高的準確性,對水果檢測及提升食品管理有重要意義。

AI與心理學的言語柔化實驗

現今網路充斥著具壓力的負面言論,影響使用者的心理健康。本研究旨在參考 C-ME 量表並整理為四大類標籤,人工分類從論壇蒐集的言論來訓練模型。研究採 LSTM、雙向 LSTM、CNN + LSTM 及 Transformer四種深度學習模型,基於自建資料集進行訓練,實現對全新言論的精準分類,並比較四種模型在精確率、召回率及 F1-score 等指標上的表現。結果顯示,LSTM處理數據不均衡的資料集時表現最佳,F1-score達89.2%。實測發現,CNN+LSTM 在預測效果上略勝 LSTM。此外,結合生成式 AI GPT-4o-mini,能有效改善不當言論,為留言者提供更委婉的表達建議。

防跌守護,步步安心

隊員的外婆在台灣獨居,曾因跌倒而未能及時求救,引發家人擔憂,高齡化與獨居老人數量增加,導致安全照護挑戰,需改善意外求助系統。本研究目的是使用OpenCV和YOLO技術辨識人體動作,檢測跌倒情況及其影響發送郵件通知家人。本研究使用Pexels和Google收集圖片進行訓練,Roboflow工具加快標註過程。過程中整合偵測、影像擷取及郵件發送功能,設計時間間隔機制避免重複發送郵件。訓練結果顯示模型在辨識「躺下」動作上準確率高,對其他動作表現尚可,而系統運行時CPU負擔輕,確保穩定性與擴展性。本系統對人物重複辨識和跌倒檢測準確性有改進空間,考慮增加資料量及調整標註類別。未來計畫開發專用APP以提升訊息傳送功能,增強用戶體驗。

以特徵點主導之圖像輪廓分段貝茲曲線擬合與節點簡化系統

本研究提出一套基於貝茲曲線的手寫圖形向量化系統,透過自動節點擷取與分段擬合機制,在降低點位數的同時維持高度幾何保真,本研究整合了自創的線段向量與曲率特徵處理演算法(SVCFP)能自動分割手繪筆劃並擷取關鍵節點,搭配最小平方法(LSM)進行高效貝茲曲線擬合,整體流程建置於網頁互動介面,可即時繪圖並獲得向量化結果。研究結果顯示,相較於傳統工具,本研究在控制點數上平均減少約84.6%,最高可達90.8%壓縮比,同時僅犧牲較少精準度情況下(BMND分數平均變動約 28~36分),仍能保持流暢準確的輪廓重建 ,亦適用於大量或即時處理情境,如數位手寫輸入、字型設計與圖形分析等,為圖形向量化提供一種高效率、低冗餘、視覺保真且實用價值高的解決方法。