全國中小學科展

電腦科學與資訊工程

Instruction-Tuning 在法律對話模型上的影響之探討

本研究探討 Instruction-Tuning 對法律領域語言模型的影響,我們使用 ChatGLM-2 6B 作為基礎模型,先以台灣法律文本進行 Continual Pre-training,再以和律師的 Q&A 數據集,分別採用 Supervised Fine-Tuning(SFT)、Reward Model 及 Proximal Policy Optimization(PPO)等 Instruction-Tuning 方法進行微調。結果顯示,僅經過 Pre-training 及 SFT 的模型,其產生的回覆較符合法律專業風格;但考量模型對法律知識的掌握,則以 Pre-training、SFT 及 PPO 整套 Instruction-Tuning 的結合效果最佳。本研究證明, 針對單一領域的語言模型, 不同的 Instruction-Tuning 方式會對其回覆風格及知識掌握造成不同影響。我們的研究為未來單一領域語言模型訓練提供了參考。

使用大型語言模型生成音樂中的故事

本研究旨在探索大型語言模型如何應用於音樂生成故事。研究動機源自音樂作為文化中不可或缺的一部分,但若要以文字精準表達出音樂中的故事情緒尚屬困難,藉由本研究提出的方法可以使故事顧及到音樂的情緒起伏。隨著 AI 的發展,我 們開始看到它們在各領域的應用。這項研究的目的是製作出一個系統能以音樂作為輸入,輸出音樂內的故事,為達成目的,我們結合多個模型。研究使用 PyTorch等工具,並探討文句和音樂的共同表示方法,實現情感匹配。研究結果顯示,音樂和文句情感辨識模型表現不錯,也研發出一個完整的生成流程。目前已有直接生成音樂的模型,也有把音樂統整介紹的模型,卻沒有依據音樂中的情緒生成故事的模型。我們研究就是在解決這個問題,結合到 LLaMA2預訓練模型生成出具情緒浮動的故事,要注意的是 LLaMA2的輸出限制最多只能有 4096個token。我們將此產生過程稱為 MTSPL (Music To Story Procedure with LLaMA)。

A Real-time Home Health Monitoring System with Motion Waveform Using Millimeter-wave FMCW Radar

本研究提出了一種基於毫米波FMCW雷達的即時居家健康監測系統,與RGB攝影機感測器方案相比,該系統更具成本效益並保護用戶隱私。對於居家健康監測系統來說,除了走、站、坐、臥四種常見的身體動作外,及時發現緊急情況也至關重要。因此,我們支持跌倒偵測以及兩種手勢的識別,一種用於頭痛,另一種用於緊急事件。然而,由於雷達點雲的稀疏和不規律特性,我們提出一種新的身體動作波形表示方式和一套處理程序用來平滑動作波形,利用雷達點雲的三度空間座標和速度在時間序列上的變化波形來表示動作特徵並作為神經網路的輸入,再搭配一輕量級的1D-CNN+LSTM神經網路來實現即時動作辨識。根據實驗結果,此方法可以達到30FPS的輸出效率和94%的辨識準確率。

惡意程式無所遁形—以自然語言處理模型實現惡意程式之識別

本研究旨在運用自然語言處理技術,建立辨識惡意程式的模型。首先在資料集方面,分為 PE資料集與 ELF資料集,均包含良性及惡意執行檔,且蒐集惡意程式時採用多種不同之惡意程式家族。接著對資料集進行反組譯及前處理。使用反組譯後的組合語言檔作為文本,訓練模型以區分良性和惡意程式。研究比較詞袋模型、序列模型、BERT 以及不同 n-gram對模型的影響。 研究結果顯示。詞袋模型以使用multi-hot編碼表現最佳,PE資料集之F1-score為96.87%;序列模型則是有位置編碼的 Transformerencoder 表現最優。在不同 n-gram 的比較,multi-hot詞袋模型與 TF-IDF 詞袋模型,分別在 2-gram 及 5-gram 有最高的 F1-score。

基於對抗性機器學習技術的數位影像浮水印機制之研究

在高度數位化的社會,存在大量的數位影像資料,在不影響視覺品質之前提下如何標記持有者或資料來源是一重要課題,而不可視浮水印機制是可行的解決之道,本研究運用對抗性機器學習技術的概念及深度學習技術研發設計數位影像之浮水印機制,研製偵測器與註冊器。本研究設計研製之偵測器與註冊器可以處理任意大小的影像,經實驗分析具高度的保真性,並具可以承受 JPEG 中度品質(qlt=50)的失真壓縮攻擊,解壓縮還原之已嵌浮水印影像偵測器仍舊可以有效判定具浮水印。本機制可以結合網站、伺服器或影像設備為其提供的數位影像嵌入浮水印,在不影響視覺感官的前提下標記來源或持有者。

利用Chain-of-thought Prompt優化ChatGPT邏輯推理方面的能力

ChatGPT 問世後,許多問題皆已能由其回答。然而在邏輯方面的問題,ChatGPT 免費版有著明顯的不足,時常出現似是而非的答案。為了解決此問題,本研究利用連線 ChatGPT API,使用四種 Chain-of-thought prompt 的方式,將問題分解成若干個子問題,利用子問題們提供原問題較多的資訊以降低在解題過程出現的錯誤。最後分析四種方法的優劣,四種方法各有優缺,並無一方法於所有題目皆正確率最高。

大開眼界-機器人影像與對位系統評估

影像對位(Image Registration)為重要影像處理工具,目前已經廣泛運用各個領域,從影像醫學偵測與診斷、工業製造、品管檢測、臉部辨識都是電腦對位的應用。本次研究將探討機器人影像對位,分別透過不同影像感測器來擷取外部影像資訊,透過對位系統進行目標 物瞄準。在準確性分析研究發現不論是單一定點或是連續三點分析 結果顯示感應器的Cpk 未達1.33。此外,分析過程中發現Vision sensor 的 Cpk 值高於 GPS,顯示 Vision sensor 在影像對位準確性表現性上優於 GPS。在時效性分析方面,感應器的種類與底盤齒輪組對於影像對位時間無顯著差異,在連續三點實驗發現時效性與偵測的地點達 顯著差異。研究結果顯示在未來自駕車的設計可以將影像對位與辨 識功能結合,透過感測器觀察外界影像資訊,結合機器學習與演算法, 提高辨識率及時提供行車資訊,提高道路安全與成員安全。

以LoRa物聯網通訊技術及去中心化網狀網路構建緊急救難發報系統

網際網路高速發展時代,為解決身處於無蜂窩訊號涵蓋範圍下,可提供通訊服務及緊急呼叫的手持無線電及衛星服務昂貴不普及,因此本研究採用遠距離、低成本、ISM免執照頻段的LoRa物聯網無線電技術,透過其啁啾調頻技術(Chirp Spread Spectrum)、高鏈路預算等優勢,以「人人皆為基地台,亦為客戶端」理念,設計P2P去中心化網狀網路(Mesh Net work)節點傳輸協定和低廉可負擔的通訊裝置,應用於SOS緊急救難呼叫、短文通訊、定位回報等。在固有網路系統不可用時也得以獨立組網,無須高昂的修建維護成本。也可透過搜救無人機、高空氣球等,快速部署Gateway於高山極地、無訊號區、第三世界國家等情境場所,促進人類福祉達成聯合國SDGs永續理念,未來將技術結合低軌道衛星,較其他衛星技術更經濟、環保,並覆蓋全球範圍達成無死角通訊。

AI時光機-利用照片轉換技術重溫在地歷史

目前網路上流傳許多使用人工智慧修復照片的網站或應用軟體。然而,由於這些訓練資料多數來自國外,導致修復中式建築照片的效果欠佳。此外,許多老舊照片因氧化、潮濕而泛黃,使得修復程序比起修復純黑白相片更加困難。因此,本研究旨在建🖂一個專門修復中式建築物的機器學習模型,主要分為以下三個部分:首先,使用機器學習模型對老舊照片進行修復,包括著色、去模糊化和降噪;其次,分析使用不同比例之有色調照片(模擬泛黃照片)訓練模型的效果;最後,研究不同的修復順序(著色、去模糊化、降噪)和模型執行次數對照片修復效果的影響,發現「著色、去噪、去模糊化」的順序修復效果最佳。此外,許多老舊照片因為受損等原因,只剩下極少的特徵,因此本研究採用機器學習模型,以延伸重建原始照片。透過這種方法,我們能夠重新建構當時建築物周圍可能的場景和情境。

幾何圖形的創意設計與應用

對稱與密鋪圖形是數學美學的表現,廣泛應用於藝術與工程設計中,本研究利用 Python 語言及其套件,依據平面設計的法則,撰寫十七種平面對稱圖形的程式碼,程式碼可透過Replit 平台的雲端共享功能促進跨領域專業人士之間的合作與改良。此外,針對一般群眾本研究透過定義函數和變數開發出「幾何設計」專案讓使用者能夠透過座標設計,輕鬆原創出具有對稱性和密鋪性的幾何圖案。本研究在幾何教學、平面設計和 3D 建模等方面都展現了其應用和優勢。我們也收集了使用者測試的反饋和數據,並提供了將平面圖形轉換成 3D 模型的過程和示例。