全國中小學科展

電腦科學與資訊工程

基於特徵解耦的視覺轉換器之指靜脈辨識模型

發展安全且可靠的身份辨識技術是當今的重要議題,而指靜脈因其高安全性及難以偽造特性成為我們的主題。本研究提出一種基於Transformer模型架構的指靜脈辨識模型稱為GLA-FD,旨在解決現有技術對指靜脈影像特徵表示與提取的局限性。透過開發特徵解耦與重建模組(FDRM),模型能夠有效區分指靜脈的背景資訊與紋理特徵,並將其重新組合以提升辨識準確度。此外,本研究開發的全域-局部注意力模組(GLAM)能同時捕捉影像的全域與局部特徵,進一步強化模型對指靜脈特徵的理解。GLA-FD在FV-USM、PLUSVein-FV3、MMCBNU-6000、UTFVP、NUPT-FPV 資料集中的正確辨識率(CIR)達到100%、98.47%、99.75%、96.11%、99.82%,展現卓越的穩定性與泛化能力。此外,本模型在處理不同年齡層、國籍與影像模糊度的資料下,仍能保持高辨識準確度,顯示其在需要高安全性辨識的應用場景中具備廣泛的實用性。

AI-Based Customer Sentiments Dashboard

In this fast-paced digital economy, customers' judgment is based on their experience with a company’s products and services. Customer reviews become a vital source of information for companies because this information can be used to enhance their products, understand customer wants and needs, improve brand reputation, and provide a competitor’s advantage. A company can understand customer needs and wants by going through reviews. Customers are encouraged to leave not only their opinion but also their ideas for the development of the product or service. By understanding these reviews, a company can actively respond and engage with a reviewer or problem. Failure of companies who don't answer customer queries may negatively impact customer loyalty. Customers will feel neglected by these companies and will choose competing companies to handle their needs. Additionally, customers may speak negatively about a company that does not respond to reviews. The AI-based customer sentiment dashboard can help gain a company's competitive advantage by identifying weaknesses in themselves and others. Companies will be enabled to understand where they succeed and where improvement is needed compared to their competitors, leveraging businesses to address strengths and weaknesses before competitors do. Through AI-based customer sentiment dashboards, a company can analyze its competitor’s reviews and use that information as leverage to make improvements to its products and services. Customers are increasingly leaving reviews on popular apps like Google Play, Stamped.io, Yapto, and Judge.me, Loox, Qualaroo, and Yelp. The reviews are rich in customer sentiments offering valuable insights into user satisfaction and pointing out the areas for improvement that are crucial to every company no matter how big or small. Despite their value, manually processing these reviews is a challenging task due to the large volume of unstructured data. Manual processing is also vulnerable to bias and human error, leading to inaccurate information. Traditional methods such as surveys have been proven to be ineffective if the main focus is targeted feedback and have low responses compared to reviews. The advances in artificial intelligence like Natural Language Processing (NLP) help us interpret and analyze human language and generate outputs like predicting what type of sentiments are in reviews. This project proposes developing an AI-based sentiment analysis model to evaluate customer feedback on two widely used taxi applications. Natural Language Processing libraries, such as the Valence Aware Dictionary and Sentiment Reasoner (. The model aims to categorize customer reviews into positive, negative, and neutral sentiments.

基於高效可更新神經網絡的西洋棋人工智慧應用於嵌入式對弈棋盤

本研究以西洋棋為切入點,採用磁簧開關陣列來偵測棋子位置,並在設計中加入二極體以防止Ghosting效應,進而開發出一款以Arduino Uno開發板為基礎的智慧對弈棋盤。棋盤底部配備RGB LED燈,以便為使用者提供落子提示,並根據不同的落子類型呈現不同的燈光效果。 我們成功地透過簡潔的設計與高效的運算性能,實現了一個能夠識別棋手落子的智慧對弈棋盤,並能根據國際西洋棋規則提供正確的移動提示,讓完全沒有基礎的初學者也能在遊戲中學習並掌握西洋棋的所有規則。此外,我們還引入了基於Minimax演算法的輕量化AI和基於高效可更新神經網絡(NNUE)AI,並探討兩者之間的性能差異,從而使該智慧棋盤在節省運算資源的同時,可以在不連接電腦的前提下,具備一定的棋力,以支持棋手的技能提升與訓練。

以深度學習進行籃球慣用動作分析

本研究聚焦於籃球員的慣用動作分析,透過深度學習技術開發了一套籃球動作分析系統,旨在準確分析籃球員在籃球運動中的個人動作特徵來進行動作辨識。我們透過自行蒐集籃球動作的影片,並使用MMAction2這個資源庫來進行動作辨識模型的訓練,將訓練好的動作辨識模型用開發慣用動作分析系統。系統流程首先使用滑動視窗(Sliding Window)的機制將即時拍攝的影像變成有序列的連續影像片段,再即時傳送至進攻動作辨識的深度學習模型中,來辨識出連續影像片段中的動作序列屬於何種特定動作,藉此將多個連續影像片段中的動作序列各自轉換為單一動作單元並依次輸出。最終,系統基於前述單一動作資料進行綜合分析,以統計使用者的籃球慣用動作。此分析系統能為籃球愛好者提供清晰的動作偏好資料,具有提升訓練成效的潛力,同時為籃球技術分析與訓練提供了一個精確的數據分析工具。

沙盒類遊戲式學習平台系統伺服器架設節能效率研究:以Minecraft為例

本研究以 Minecraft 為例,探討沙盒類遊戲式學習平台系統伺服器架設的節能效率,旨在透過動態調整伺服器數量降低總CPU使用率,提升伺服器的管理效能和能源使用效率。隨著線上遊戲的普及,伺服器的營運管理變得越來越複雜,如何在滿足玩家需求並同時降低能源消耗成為一個重要議題。本研究將分析伺服器資源使用狀況,特別是在玩家活動量高低波動的情境下,透過管理策略的調整,探討其對節能效率的影響。 研究透過實證數據的收集與回歸分析,建立一套可應用於 Minecraft 伺服器的節能動態調整系統,並探討動態調整的具體效率。研究結果發現隨著玩家人數增加,越接近系統負載上限,節能效果會越來越不明顯,以本次研究的伺服器來講玩家人數到達35人以後就無法再減少伺服器數量。

Project M.I.R.A.S

1.1 Short project summary My project involves the conceptualization and development of an innovative approach to modular self-assembling robotic systems. Through its ability to form any complex configuration, the system is highly adaptable to various scenarios and environments. Before delving deeper into the details of my project, I will provide an overview of my background and motivations. 1.2 Background Ever since I first watched the movie "Big Hero 6", I felt amazed by the applications of the so called “microbots”. From that point on, it made me always wonder what would be possible in the real world. When I did the research, I stumbled upon this field of modular robotics. Initially, I was unsure whether to embark on a project focused on electronics and robotics due to my background in programming. On the other side, this year gave me a chance to see the incredible performances of various projects at different science expos. Besides, I took part in the program of CANSAT LU and learned a lot during it, such as microchips, the control of miniature robotics, and the sensors of it. Finally, at school, I took the option Electronics where we dig into similar topics. With this accumulated knowledge and experience I felt confident enough to start this project.

基於LLM的互動式口述影像系統

本研究旨在透過LLM 將影片內容轉為口述影像,探討及比較不同影片處理方式、LLM 對於圖片及影片的敘述,串接成一套自動化的口述影像系統。口述影像原本是為視障者製作的,現在本研究調整系統,讓有需求的一般大眾也能有效、容易及快速的了解影片內容。 本研究中的口述影像系統具有以下特點: (一)利用LLM 擅於處理視覺訊息及自然語言的優勢,將影片分為多張圖片,由LLM分別生成敘述後再整合為影片的整體敘述。 (二)運用LLM 會留存對話紀錄的特性,使用者可在系統中針對疑問與LLM進行問答。 (三)串接不同的 LLM,尋找製作口述影像的最佳組合。 藉由LLM 將影片轉換為口述影像,實現互動式的口述影像服務。除了可以滿足視障者的觀影需求,更重要的是當一般民眾沒有時間觀看影片時,也能透過口述影像系統了解影片內容。

漫畫生成與預測

本研究探討了利用生成式人工智慧技術為漫畫創作帶來新可能性。在當今競爭激烈的漫畫產業中,創作者們需要不斷創新以吸引觀眾,而創作引人入勝的漫畫需要豐富的想像力和劇情結構。本研究希望能協助創作者製作草稿,並探索與AI當朋友的新型創作模式。在生成方面,提出了將漫畫劇情提取、劇情預測以及圖片生成三個步驟的生成流程,並使用了多種模型和技術,如 YOLO模型用於漫畫人臉檢測、文字生成模型用於劇情預測、LoRA技術用於模型微調等,為解決人物生成不連續的問題,我們也提出一種基於特徵提取與融合的解決辦法。本研究提供了一個全面的方案,旨在利用人工智慧技術幫助漫畫創作者創作出簡單的草稿。

基於LLM的互動式口述影像系統

本研究旨在透過LLM 將影片內容轉為口述影像,探討及比較不同影片處理方式、LLM 對於圖片及影片的敘述,串接成一套自動化的口述影像系統。口述影像原本是為視障者製作的,現在本研究調整系統,讓有需求的一般大眾也能有效、容易及快速的了解影片內容。 本研究中的口述影像系統具有以下特點: (一)利用LLM 擅於處理視覺訊息及自然語言的優勢,將影片分為多張圖片,由LLM分別生成敘述後再整合為影片的整體敘述。 (二)運用LLM 會留存對話紀錄的特性,使用者可在系統中針對疑問與LLM進行問答。 (三)串接不同的 LLM,尋找製作口述影像的最佳組合。 藉由LLM 將影片轉換為口述影像,實現互動式的口述影像服務。除了可以滿足視障者的觀影需求,更重要的是當一般民眾沒有時間觀看影片時,也能透過口述影像系統了解影片內容。

沙盒類遊戲式學習平台系統伺服器架設節能效率研究:以Minecraft為例

本研究以 Minecraft 為例,探討沙盒類遊戲式學習平台系統伺服器架設的節能效率,旨在透過動態調整伺服器數量降低總CPU使用率,提升伺服器的管理效能和能源使用效率。隨著線上遊戲的普及,伺服器的營運管理變得越來越複雜,如何在滿足玩家需求並同時降低能源消耗成為一個重要議題。本研究將分析伺服器資源使用狀況,特別是在玩家活動量高低波動的情境下,透過管理策略的調整,探討其對節能效率的影響。 研究透過實證數據的收集與回歸分析,建立一套可應用於 Minecraft 伺服器的節能動態調整系統,並探討動態調整的具體效率。研究結果發現隨著玩家人數增加,越接近系統負載上限,節能效果會越來越不明顯,以本次研究的伺服器來講玩家人數到達35人以後就無法再減少伺服器數量。