全國中小學科展

電腦科學與資訊工程

運用GAN實現字體風格轉換

本研究以實作字體風格轉換的生成對抗網路模型為動機,將Conditional GAN當作模型的基礎,探討pix2pix模型及其他研究的一些方法對模型會產生甚麼影響,以得出能最優化預測成效的深度學習模型。 首先進行的是前處理的步驟,將字體的truetype檔案轉換成模型輸入的jpeg檔,再以生成器(Generator)和判別器(Discriminator)建立Condional GAN的基礎模型,然後探討加入U-Net、Category Embedding等方法,以及訓練資料集大小對模型造成的影響,最後實作整合的pix2pix模型和CycleGAN模型進行比較。 經過實驗後發現,U-Net和Category Embedding都對模型的預測成果有所幫助。另外,對相似的字體而言,pix2pix的效果較好,而對兩種風格差異較大的字體則需用Category Embedding的方式,融入更多字體進行訓練以達到更好的成效。

2048遊戲的勝率與時間差學習法程式特徵之分析

本研究共耗時了九個月,以資訊教室48台電腦為主要設備,共計執行了近2500萬次的遊戲,達成本研究的最終成果。以下將探討並分析一篇以時間差學習法為基礎寫成的 2048 人工智慧程式,在解讀程式碼當中適合取來應用的部位後,加以探討是本研究的核心與主旨。 首先分析出各種方格數組成的相異特徵種類,統計方格數對應的特徵數量後,得出了「二倍定理」,對於往後執行高階方格數時有極高參考價值。隨後為了因應本研究對於四到六方格數特徵的探討並避免窮舉,自創了一種新方法:「已得特徵放置方格法」,對於嚴謹的特徵分析有一大進展。之後將前實驗的130種特徵皆作數十萬次的遊戲勝率分析,排出了各種特徵之間的優劣,接著以特徵之間的組合與原版特徵比較,驗證了此系列研究方法的成功。 「機動性質」是本研究現階段最有可看性也最具應用性的新創研究方法。在本研究後半即藉由計算特徵版面上的位置對次數分析,也為先前實驗現象做了合理解釋。未來將展現的就是機動性質回推法,藉此我正在設計利用更龐大數據,找出一個理想的「機動模型」,這種從被動獲得到主動回推的新思維演進方法,希望可以實踐並對於特徵工程做一大革新。 除了以上,也期望整篇研究以及新創研究方法可以被往後的資訊科技、人工智慧、大數據、特徵工程……等領域應用。

看見拔河中的力

本設計利用了應變規(Strain Gauge)的原理去製作一台可以量測拔河時繩子兩端的施加力量值,本設計採用的原理是當應變規受力時其電阻值會因為不同的力量而產生不同的應變的變化。進一步地,本設計的準確性也進行了校正。透過拔河繩拉力所產生的應變造成電阻變化,來轉換成力量數值,而利用自已設計製造的夾具,放置在拔河繩上並固定在繩子的兩側,分析其應力應變和受力狀況來測出力量值。 本設計只用簡單的應變規、電子顯示器和電子零件,低成本、簡單構造的設計來達成本研究之目的,來解決拔河過程中比賽的兩隊平衡力之顯示,使拔河更增加樂趣,增加拔河的的趣味性、數值化。

英文句子依閱讀程度進行簡化之研究

英文句子簡化是一項單語言句子轉換的任務,其中一句複雜的句子會轉換為一句或多句的簡單句子。相較於過去研究學者著重於研究如何優化句子簡化的結果,如何將一句英文句子依閱讀程度簡化為不同簡單程度的簡化句是一項自然語言處理方面嶄新的研究領域。本研究首先訂定英文分級標準,整合歐洲(CEFR)與台灣(LTTC)母語非英語國家機構對英文的分級標準,將英文分為三種難易程度,並依此將Wekipedia及Newsela的簡化前-簡化後平行語料重新刪整為三種目標程度等級的平行語料庫。另一方面,運用已發展成熟的Seq2seq簡化模型,創造一個多解碼器模型,分別依據目標程度不同的訓練資料集訓練三種解碼器。在BLEU、SARI指標以及Coverage計算下,本研究結果相較於相關研究可展現出優異成果。

DetectTimely

This research project focuses on developing a web-based multi-platform solution for augmenting prognostic strategies to diagnose breast cancer (BC), from a variety of different tests, including histology, mammography, cytopathology, and fine-needle aspiration cytology, all in an automated fashion. The respective application utilizes tensor-based data representations and deep learning architectural algorithms, to produce optimized models for the prediction of novel instances against each of these medical tests. This system has been designed in a way that all of its computation can be integrated seamlessly into a clinical setting, without posing any disruption to a clinician’s productivity or workflow, but rather an enhancement of their capabilities. This software can make the diagnostic process automated, standardized, faster, and even more accurate than current benchmarks achieved by both pathologists, and radiologists, which makes it invaluable from a clinical standpoint to make well-informed diagnostic decisions with nominal resources.

A deep learning-based home safety perception system for household service robot

In 2016, the population of people over the age of 65 in Macau was 11.2%. This means that Macau has already become an aging society. As such, more younger generations are needed to look after the elderly. According to statistics, falls are the primary cause of injury or death for the elderly over 65 years old. About 30% of the elderly over 65 years old fall every year. Along with the increase in the elderly population, it is urgent to find a fast and effective way to ensure the safety of the elderly. As there is a lot more danger besides falling in an elderly life, we aim to build a robot collocated with its danger detection system to ensure the safety of the elderly at home. The reason we decided to use robots is that we want to have larger flexibility and mobility, for example, we can give elderly rescue materials when they need help. Moreover, more home robots will be used in the future, they can just apply our system to theirs and ensure the safety of elderlies. In this research, we mainly used cameras with the Openpose model to detect dangers such as falling, potential human action danger, and environmental danger. Innovative ways are used to detect fall action, collocated with our home robot, it is a foreseeing project that could ensure the safety of the elderly in a home environment.

Body Movement Generation for Expressive Violin Performance Applying Neural Networks

基於音樂輸入的動作骨架生成是一個正在興起的研究主題,然而在弦樂樂器的演奏骨架生成上,由於動作與音樂資訊間並非是一對一的對應關係,且在時間序列上非常注重前後關係,此問題仍非常具有挑戰性。在研究中,我們設計新的架構,將小提琴演奏者的演奏各部分拆解並分別生成。針對前人研究及此研究的研究結果,我們分別進行了客觀測試及主觀問卷的評估,兩方面皆顯示我們的研究結果較前研究進步。就我們所知,此篇研究是第一個嘗試在小提琴演奏動作上加入音樂情緒的研究。

以深度學習及動脈壓力波頻譜諧波分析實驗為基礎開發脈搏訊號分析系統

本研究提出一套創新的人體健康分析方式,透過全新的分析演算法架構深度解析脈搏訊號中的特徵,並結合深度神經網路進行預測,最後開發成監測人體健康的嵌入式系統。本研究基於血液共振理論,將光體積變化描計圖法擷取到的脈搏訊號進行訊號處理,從中擷取出共振峰值以及其變化量,檢測血液循環一週的微小變化,改善了當前分析方法著重在計算平均值,無法呈現即時狀態的缺失。本研究提出的系統和演算法所延伸的預警系統具有77.3%的預測精準度,同時可以擴展至多種趨勢相關的臨床症狀。此外,本系統十分適合應用於低功耗、低成本的硬體,對於未來各種行動裝置、穿戴科技與居家照護的生理數據分析需求,可提供實質的貢獻。

利用VAE-pix2pix生成擬真的山脈模型

本研究利用NASA的SRTM 1 Arc-Second資料集來收集全球各地的地形高度圖(heightmap),也利用MapTiler網站收集相對應的衛星空照圖,用這些收集的圖像,訓練我們建構的VAE-pix2pix模型。VAE-pix2pix為Variational Autoencoder (VAE)及pix2pix (為一個Conditional Generative Adversarial Network)結合的模型,能將人工繪製的高度圖加上真實山脈應有的細節(包含尖銳的山脊、山壁上的紋路、連續的河流網路等……),並生成出相對應的擬真衛星空照圖。相較於原pix2pix模型,VAE-pix2pix所生成的高度圖及衛星空照圖會更接近於真實世界的地形高度圖及衛星空照圖,同時VAE-pix2pix模型也能透過改變latent code的數值來生成出不同風格的高度圖及空照圖,如地貌的顏色或雪線的高度等,這些都增加模型生成圖像的多樣性。為了使我們建構的模型能更廣泛的被應用,我們在Unity上開發了Unity客戶端,其生成的mesh可以讓使用者直接應用於遊戲的場景,簡化了遊戲中生成擬真山脈模型的任務。

利用近端策略優化演算法結合內在好奇心模組進行2D雙足模型行走模擬

強化學習為當前AI領域的熱門話題,其特點是在環境的獎勵與懲罰下,進行學習。強化學習雖然較為困難,但其成功的項目都非常有名,其中最著名的例子有: AlphoGo、AlphaZero等等。 深度強化學習(DRL)是深度學習與強化學習的結合體,本專題透過DRL實現近端優化策略演算法,來使BipedalWalker環境中的二足模型學會行走,並調適超參數與神經網路來讓模型訓練擁有更好的結果。 經過實驗後發現,適當的降低獎勵折扣衰減率能有效的提升學習速度以及學習上限,同時可以避免分數落差過大導致的Dead relu問題。最終的結果能讓平均分數達到302分,成功達成了BipedalWalker環境要求(平均分數>=300分)。 為了使智能體擁有更好的探索能力,本專題加入了ICM(Intrinsic Curiosity Module),成功提升了最終的平均分數至316分,將不摔倒的機率提升至99%,最高分數則到了320分,使得雙足模型能以更快的速度向前移動並保持穩定。