全國中小學科展

電腦科學與資訊工程

基於高效可更新神經網絡的西洋棋人工智慧應用於嵌入式對弈棋盤

本研究以西洋棋為切入點,採用磁簧開關陣列來偵測棋子位置,並在設計中加入二極體以防止Ghosting效應,進而開發出一款以Arduino Uno開發板為基礎的智慧對弈棋盤。棋盤底部配備RGB LED燈,以便為使用者提供落子提示,並根據不同的落子類型呈現不同的燈光效果。 我們成功地透過簡潔的設計與高效的運算性能,實現了一個能夠識別棋手落子的智慧對弈棋盤,並能根據國際西洋棋規則提供正確的移動提示,讓完全沒有基礎的初學者也能在遊戲中學習並掌握西洋棋的所有規則。此外,我們還引入了基於Minimax演算法的輕量化AI和基於高效可更新神經網絡(NNUE)AI,並探討兩者之間的性能差異,從而使該智慧棋盤在節省運算資源的同時,可以在不連接電腦的前提下,具備一定的棋力,以支持棋手的技能提升與訓練。

建構標準舞蹈姿勢評分系統

在現今社會,個人越來越依賴自主學習以提升技能和知識,而舞蹈學習尤其受到關注。然而,在沒有專業指導的情況下,學員往往難以掌握舞蹈動作的細節,也難以清楚地評估自己的表現與標準示範之間的差距。 為了應對這一挑戰,本研究利用人體姿態識別演算法OpenPose,捕捉舞蹈者的關節點。通過這項技術,針對舞蹈的標準動作、力度、流暢度等方面,成功地開發出一款自動評分系統。 通過人體姿態識別技術,我們能夠深入分析舞蹈動作的細節,讓學員與標準舞蹈動作進行比較,以確認學習上的差異。我們希望通過這項研究,學員能在沒有專業指導的情況下,利用網路平台創建更有效且有趣的自主學習環境。

Artificial Intelligence Sensing Technology for Blinds Path Findings

Over 30 million souls live in a world of darkness, a number greater than the populations of both Norway and Sweden combined. Every individual deserves the chance to embark on a journey across our magnificent blue planet. Yet, regrettably, little has been done to assist them. With this project, we’re lighting the way for the blind to explore our beautiful world independently, breaking free from dependence and embracing boundless horizons. In order to put our theory of the project into practice & explore the use of artificial intelligence & computer science, we started by collecting the required materials for our project such as micro-controllers, sensors, a pair of glasses, a laptop, and a miniature camera. Then we moved onto creating the project itself in which the digital software programmed onto the hardware plays the key-role, as the sensors and the camera will record the details and information from the surroundings and send it to the laptop for further processing. The camera would be the backbone of our project, as it will stream real-time footage to the laptop which will be analyzed by an open-source object detection model ‘YOLOv8’ for identifying objects. After finishing the base model of our project, we tested it in-front of objects such as toy cars, bikes, people, etc, and the results of the object-detection would be shown on the laptop. To observe this data, we created a device which has different modules and integrations for different functions. For example, we will use our camera and then stream it onto a laptop so the reading and the data can be processed on the laptop by AI using YOLOv8. As mentioned in the start, many people do not possess the ability to see, to assist them we have thought of this device which uses all readings and its analytical skills to analyze data and help them navigate, travel or simply, live a better life.

基於LLM的互動式口述影像系統

本研究旨在透過LLM 將影片內容轉為口述影像,探討及比較不同影片處理方式、LLM 對於圖片及影片的敘述,串接成一套自動化的口述影像系統。口述影像原本是為視障者製作的,現在本研究調整系統,讓有需求的一般大眾也能有效、容易及快速的了解影片內容。 本研究中的口述影像系統具有以下特點: (一)利用LLM 擅於處理視覺訊息及自然語言的優勢,將影片分為多張圖片,由LLM分別生成敘述後再整合為影片的整體敘述。 (二)運用LLM 會留存對話紀錄的特性,使用者可在系統中針對疑問與LLM進行問答。 (三)串接不同的 LLM,尋找製作口述影像的最佳組合。 藉由LLM 將影片轉換為口述影像,實現互動式的口述影像服務。除了可以滿足視障者的觀影需求,更重要的是當一般民眾沒有時間觀看影片時,也能透過口述影像系統了解影片內容。

情感分析生成器—自動生成文字感染情緒

隨著網路技術不斷的進步,意見和情感分析逐漸成為人們日常生活中的一部分。儘管如此,目前人們缺乏一個方便且快速的情緒分析模型,供廣大大眾使用。 本研究旨在提供人們一個緩解憂鬱情緒的管道——當人們輸入一個需要被安慰的情境時,我們的系統將輸出安慰語句,以緩解該使用者之憂鬱情緒,達到安慰效果。為此,本研究訓練了BERT model以及 LLaMA model。BERT model能判斷使用者輸入的語句是否為需安慰語句。而LLaMA model則作為安慰語句之生成模型,以達到安慰之效果。

Wibrazz

Wibrazz is a wearable communication tool that allows the teacher, the therapist, the parent to communicate information to the child remotely using the device. Haptic (vibrationbased) feedback is becoming increasingly important in everyday life. A vibrating device that transmits information through clothing can help people with disabilities who have no or limited sensory use to live an integrated life in society without barriers.

以深度學習進行籃球慣用動作分析

本研究聚焦於籃球員的慣用動作分析,透過深度學習技術開發了一套籃球動作分析系統,旨在準確分析籃球員在籃球運動中的個人動作特徵來進行動作辨識。我們透過自行蒐集籃球動作的影片,並使用MMAction2這個資源庫來進行動作辨識模型的訓練,將訓練好的動作辨識模型用開發慣用動作分析系統。系統流程首先使用滑動視窗(Sliding Window)的機制將即時拍攝的影像變成有序列的連續影像片段,再即時傳送至進攻動作辨識的深度學習模型中,來辨識出連續影像片段中的動作序列屬於何種特定動作,藉此將多個連續影像片段中的動作序列各自轉換為單一動作單元並依次輸出。最終,系統基於前述單一動作資料進行綜合分析,以統計使用者的籃球慣用動作。此分析系統能為籃球愛好者提供清晰的動作偏好資料,具有提升訓練成效的潛力,同時為籃球技術分析與訓練提供了一個精確的數據分析工具。

基於LLM的互動式口述影像系統

本研究旨在透過LLM 將影片內容轉為口述影像,探討及比較不同影片處理方式、LLM 對於圖片及影片的敘述,串接成一套自動化的口述影像系統。口述影像原本是為視障者製作的,現在本研究調整系統,讓有需求的一般大眾也能有效、容易及快速的了解影片內容。 本研究中的口述影像系統具有以下特點: (一)利用LLM 擅於處理視覺訊息及自然語言的優勢,將影片分為多張圖片,由LLM分別生成敘述後再整合為影片的整體敘述。 (二)運用LLM 會留存對話紀錄的特性,使用者可在系統中針對疑問與LLM進行問答。 (三)串接不同的 LLM,尋找製作口述影像的最佳組合。 藉由LLM 將影片轉換為口述影像,實現互動式的口述影像服務。除了可以滿足視障者的觀影需求,更重要的是當一般民眾沒有時間觀看影片時,也能透過口述影像系統了解影片內容。

Wibrazz

"Blindness keeps you from things, deafness keeps you from people" (Helen Keller) Wibrazz is a communication tool that can be placed inside sportswear. Two versions have been developed. The simpler one allows hearing-impaired footballers to compete in the league with other athletes. The referee is given an additional device to give a signal when he blows his whistle. The hearing-impaired footballer then senses the signal from the device he is wearing and knows that he must pay attention to the referee. The complex version speeds up communication between the coach and the players during training sessions. It allows the coach to send simple messages to his players using his smart device. The athlete senses the signal from the device and acts on what has been previously discussed (e.g. a long signal means, "Everyone come to me!") With over 70 million deaf people worldwide, and 2-4 out of 1000 people in the United States who are functionally deaf, this can affect an individual's mental and physical well-being, and it is therefore a pressing issue to provide these athletes with the means to develop their talents in a traditional team environment. In addition to the organisations within countries, the ICSD is present on the international stage. Their importance is demonstrated by the fact that the 2023 Deaf Football World Cup featured teams from countries such as the United States, Germany, England and Japan.

漫畫生成與預測

本研究探討了利用生成式人工智慧技術為漫畫創作帶來新可能性。在當今競爭激烈的漫畫產業中,創作者們需要不斷創新以吸引觀眾,而創作引人入勝的漫畫需要豐富的想像力和劇情結構。本研究希望能協助創作者製作草稿,並探索與AI當朋友的新型創作模式。在生成方面,提出了將漫畫劇情提取、劇情預測以及圖片生成三個步驟的生成流程,並使用了多種模型和技術,如 YOLO模型用於漫畫人臉檢測、文字生成模型用於劇情預測、LoRA技術用於模型微調等,為解決人物生成不連續的問題,我們也提出一種基於特徵提取與融合的解決辦法。本研究提供了一個全面的方案,旨在利用人工智慧技術幫助漫畫創作者創作出簡單的草稿。