臺灣網路科教館

科展作品檢索

以分散式邊緣運算網路架構實現智慧機器人代理系統之研究

本研究企圖建構一個運用邊緣運算技術(Edge Computing)之人工智能機器人代理人(AI Agent)，並將之運用於實體人型格鬥用機器人的研究開發中。在此以人型格鬥機器人做為場景需求使用設定目標，運用彈性化模組，加上分散式、嵌入式即時網路技術來降低系統設計的複雜度，整合通訊協議與深度學習YOLO影像演算法，進一步運用ZMP運動控制理論，以及多維感測器融合技術(sensor fusion)，融合陀螺儀(GYRO)、加速儀(accelerometer)、CMOS Sensors、FSR(Force sensing resistor)作為人形機器人智慧平衡基礎，再藉由圖形識別做為預測辨識以及智慧姿態ZMP控制技術作為攻防策略判斷。整體系統藉由AI 晶片與嵌入式系統網路作為整合。透過網路即時傳輸環境資訊與指令，使機器人可以知道高層的指令目的資訊。值得一提的是本系統網路設計建構依照仿生哺乳類動物的分層式架構。神經系統將反射以及即時控制交由智慧代理人軟體作為即時演算與控制來達到高性能與彈性發展的需要，未來可用在高等擴充性的人形機器人使用，包括格鬥機器人，人形機器人工地建材搬運、具自平衡醫療外骨骼機器人......等，使人與機器人能並肩工作，提升人與機器人整合互動。

> 更多

科展作品檢索

利用虛擬篩選LpxC抑制劑的方式找出對抗多重抗藥性綠膿桿菌的新療法

多重抗藥性（MDR）細菌已經在全世界的範圍內成為了一個重大威脅，而像是多重抗藥性的綠膿桿菌就是其中一種對大多數療法有抵抗力的病原體。在目前的治療方案無效之前，有必要開發出一種新型機制的抗生素能夠作為對抗的手段。我們通過電腦虛擬篩選的方式，並用一個脂多糖脂質A (LipidA)生合成路徑的關鍵蛋白，LpxC，作為篩選的對象。在我們的第一次預測中，ZINC000001587011 (brequinar) 具有較低的結合能和較高的生物利用度。但由於其較高的cLogP值，使我們對其進行了官能團修飾，以期能有所改善。最後，我們在所有衍生物中找到了N11，有最大的潛力能做為抗綠膿桿菌的藥物前驅物。

> 更多

科展作品檢索

換句話說

BERT近年來在各式NLP任務中可說是無處不見、無所不在，其中使用fine-tuning的訓練方式更是可以幫助研究者省下大量的時間及運算成本，且結果都有不錯的表現。本研究探討在結合不同條件的文本訓練下，基於對BERT模型做fine-tuning且讓其進行文本分類，觀察其對於預測及分類中文句子通順程度的成效，並且根據訓練出來的模型設計修正方式嘗試使其對預測中不通順之文本進行自我修正，並分析其成效與結果。

> 更多

科展作品檢索

由立體思維解循環式最大流量問題＿以教師介聘為例

本研究旨在應用立體思維解決循環式的最大流量問題，於教師介聘中，可提出擁有品質保證之方法，並求得介聘成功人數之區間。教師介聘應為一限制的網路流（每個節點至少一入一出），試著求出最大循環流量。教師介聘為學校間之教師調換作業，透過志願選填與其他參與者進行交換。以110年的介聘規則而言，介聘順序為單調→五角調→四角調→三角調→互調，相同者以積分高為優先。現有制度受限於作業期程、業務人員能力，約略簡化問題原型，但即使如此，介聘處理的結果仍不提供數據分析，導致無從分析其品質及過程，因此介聘的結果、數量和方法皆仍有很大的研究空間。此研究除了可使媒合數量最大化外，進而由原模型衍伸出多種策略，可以透過調整參數並於結果與時間中取得平衡。單志願介聘中，透過使用不同模型使準確率（介聘成功人數/最多成功人數）介於88～100%，運算時間與準確率成正相關。多志願介聘以自訂規則作為範例，套用單志願介聘模型呈現效果。

> 更多

科展作品檢索

利用深度學習將黑白影片色彩化

1920年代和1930年代，攝影設備剛剛起步，攝影設備只能拍攝黑白圖像的照片或影片，但仍有許多經典電影被記錄下來。如今，隨著科技的進步，攝影設備也在不斷迭代，彩色成像技術和高品質成像技術不斷被更好的技術所取代。因此，如何將黑白圖像轉換為彩色圖像成為一個重要的研究課題。本研究的目的是將黑白影片轉換成彩色影片。我們的方法可以分為兩部分：彩色化模型設計和影片連續性優化。在顏色轉換模型設計部分，我們使用了生成對抗網絡（GANs）技術，基於U-Net設計了5個模型，並使用COCO數據集訓練顏色生成模型。在電影連續性優化部分，我們首先使用景觀數據集中微調的前五個模型中最好的模型。在這個過程中，我們發現模型生成的影片存在顏色不連續的問題。因此，我們設計了三套方案來解決，比如使用H.264重新編碼生成電影，使用平均像素的色調值提高電影的色調穩定性，使用ORB預測個別幀。結果表明，影片的色彩轉換效果表現優異。

> 更多

科展作品檢索

利用半監督式學習進行自動星系分類

本研究使用半監督式機器學習搭配卷積神經網路來訓練核心模型，並將星系的圖片加入模型裡，讓電腦自動判斷出該星系的種類為何。我使用自行設計的CNN架構以及VGG-16當作我的卷積神經網路架構。資料集來源為EFIGI和Galaxy Zoo 2。我分為兩種任務，第一種任務是讓模型能分辨橢圓 (E)、螺旋 (S)、不規則 (I) 這三種類別的星系，訓練資料共有2,468張照片，最後的正確率能達到94%。第二個任務是將8種的星系照片(E、S0、Sa、Sb、Sc、SBa、SBb、SBc)進行分類，並使用自動編碼器作為預訓練，使用1,923張EFIGI的圖片以及1,258張Galaxy Zoo 2的照片當作訓練資料。由於各星系照片有許多外觀太過相似，測試準確度最高達到54.12%，基於我的研究，星系自動化辨識於天文學上應該有相當大的運用空間。

> 更多

科展作品檢索

以大腸直腸癌預測為例進行缺失值處理方式的探討與實驗

機器學習和精準醫療是目前醫學界的熱門話題。機器學習在醫療領域的應用越來越普及，可幫助臨床更快速及精準診斷疾病，並提供個人化治療方案。例如，通過訓練大量醫學影像數據，建立深度學習模型，可用於腫瘤的自動辨識與分類。通過醫療資料大數據分析，可以為臨床提供及時的疾病預測和預防建議。然而，如何讓臨床資料結合機器學習建立模型預測，是很重要的議題。本研究使用臺北醫學大學數據處蒐集衛生福利部雙和醫院的大腸直腸癌與大腸炎病患三年的臨床資料，結合機器學習進行模型的建立與預測。經處理數據的缺失值、特徵的排序與選取及向前特徵選取法來訓練與驗證模型，找出分辨大腸直腸癌和大腸炎的最佳檢驗項目組合及效能，以預測大腸直腸癌。

> 更多

科展作品檢索

Adversarial Attacks Against Detecting Bot Generated Text

With the introduction of the transformer architecture by Vaswani et al. (2017), contemporary Text Generation Models (TGMs) have shown incredible capabilities in generating neural text that, for humans, is nearly indistinguishable from human text (Radford et al., 2019; Zellers et al., 2019; Keskar et al., 2019). Although TGMs have many potential positive uses in writing, entertainment and software development (Solaiman et al., 2019), there is also a significant threat of these models being misused by malicious actors to generate fake news (Uchendu et al., 2020; Zellers et al., 2019), fake product reviews (Adelani et al., 2020), or extremist content (McGuffie & Newhouse, 2020). TGMs like GPT-2 generate text based on a given prompt, which limits the degree of control over the topic and sentiment of the neural text (Radford et al., 2019). However, other TGMs like GROVER and CTRL allow for greater control of the content and style of generated text, which increases its potential for misuse by malicious actors (Zellers et al., 2019; Keskar et al., 2019). Additionally, many state-of-the-art pre-trained TGMs are available freely online and can be deployed by low-skilled individuals with minimal resources (Solaiman et al., 2019). There is therefore an immediate and substantial need to develop methods that can detect misuse of TGMs on vulnerable platforms like social media or e-commerce websites. Several methods have been explored in detecting neural text. Gehrmann et al. (2019) developed the GLTR tool which highlights distributional differences in GPT-2 generated text and human text, and assists humans in identifying a piece of neural text. The other approach is to formulate the problem as a classification task to distinguish between neural text and human text and train a classifier model (henceforth a ‘detector’). Simple linear classifiers on TF-IDF vectors or topology of attention maps have also achieved moderate performance (Solaiman et al., 2019; Kushnareva et al., 2021). Zellers et al. (2019) propose a detector of GROVER generated text based on a linear classifier on top of the GROVER model and argue that the best TGMs are also the best detectors. However, later results by Uchendu et al. (2020) and Solaiman et al. (2019) show that this claim does not hold true for all TGMs. Consistent through most research thus far is that fine-tuning the BERT or RoBERTa language model for the detection task achieves state-of-the-art performance (Radford et al., 2019; Uchendu et al., 2020; Adelani et al., 2020; Fagni et al., 2021). I will therefore be focussing on attacks against a fine-tuned RoBERTa model. Although extensive research has been conducted on detecting generated text, there is a significant lack of research in adversarial attacks against such detectors (Jawahar et al., 2020). However, the present research that does exist preliminarily suggests that neural text detectors are not robust, meaning that the output can change drastically even for small changes in the text input and thus that these detectors are vulnerable to adversarial attacks (Wolff, 2020). In this paper, I extend on Wolff’s (2020) work on adversarial attacks on neural text detectors by proposing a series of attacks designed to counter detectors as well as an algorithm to optimally select for these attacks without compromising on the fluency of generated text. I do this with reference to a fine-tuned RoBERTa detector and on two datasets: (1) the GPT-2 WebText dataset (Radford et al., 2019) and (2) the Tweepfake dataset (Fagni et al., 2021). Additionally, I experiment with possible defences against these attacks, including (1) using count-based features, (2) stylometric features and (3) adversarial training.

> 更多

科展作品檢索

GAN圖像生成模型之畫質與效能強化

近年來，名為生成對抗網路的非監督式學習方法蓬勃發展，透過使產生假資料的生成器與辨別資料真偽的辨別器互相學習，只要提供資料集便可學習其特徵而生成出能以假亂真的資料。本研究提出一套針對現有生成圖像的生成對抗網路模型的改良方法，透過進行實驗探討不同變因對生成品質與效率的影響，調整原有的優化器設置、卷積層參數、模型架構等，並以客觀指標評估實驗結果，證實經過本研究提出的方法改良有更好的效果。另外改進的方式應用在各種資料集訓練的模型及更高解析度的模型，數據表明也有不錯的成果。而本研究希望能提供更明確的模型改進方向給研究人員，並減少嘗試改良模型所花費的時間與能源成本，以此減少訓練龐大的模型所造成的環境影響。

> 更多

科展作品檢索

照明設備故障自動修護系統

地球自轉一周，需要24小時，因此地球一面處於白天，另一面則是夜晚，從外太空看地球越先進的國家的夜晚，燈火通明點亮整個城市。當愛迪生發明第一個燈泡時，讓世界夜晝變白晝，照明設備的演進，也照亮人類的文明，各式照明設備有相對的使用壽命，當路燈或照明設備故障時，需要專業維修人員或水電師傅進行更換，有時也讓照明設備久久未能即時修護。本作品設計概念，用於路燈或照明設備，路燈發生故障不亮時，系統偵測故障時並進行自動修護，將不亮的燈泡變成會亮的燈泡，達到即時修護的目的。作品以單晶片微電腦為主控制，LED驅動電路、霍爾電流感測器、使用Zigbee建構區域網路、步進馬達控制，結合IOT物聯網概念，設計具有故障自動修護及回報功能系統。

> 更多

科展作品檢索

運用機器學習和軟體模擬優化泵浦旋葉

本研究主要整合實驗測量、田口實驗與人工智慧機器學習等方法，發展優化泵浦旋葉技術。首先以3D列印開發多種相異外型族群與不同葉片數目共計82種設計，以實驗探討旋葉構造形狀與泵浦之流量、揚程及效率，進而找出效率較佳的旋葉並作為基底，過程中應用電腦輔助分析軟體進行旋葉內部流場與應力場分析驗證，搭配透明運轉泵浦觀察不同轉速下旋葉內部流體流動狀態，田口法研究結果發現由信躁比與均值分析結果顯示入口斜率為最重要的影響參數、其次分別為旋葉數與出口斜率，影響最小則是上蓋厚度，且優化設計旋葉T3C-10-2-4-4最佳。機器學習方面，經由多元線性回歸訓練模型預測出未知的旋葉效率(Y值)，訓練完成後得到平均絕對誤差Mean Absolute Error (MAE)皆小於1.5。

> 更多

科展作品檢索

線上教學 -- 深度學習專注力分析

自2020年受到新冠肺炎疫情的影響，許多原有的生活、工作與學習型態都受到了影響。為了控制疫情，減少面對面接觸是其中一種方法，學習模式亦從實體轉變成線上。因學習都是面對鏡頭進行，老師很難掌握學生實際的學習狀況，也不易確認學習的品質。沒有專注就沒有辨識、學習記憶。鄭朝明（2006）提到專注力與學習有密切關係，線上學習容易受到許多外在環境的誘惑導致專注力下降。本作品提出利用人工智慧中的深度學習，透過學生學習時的鏡頭畫面進行臉部特徵擷取，作為深度學習之分類器的輸入進行辨識，並將辨識出的狀態分析後得到結果。教師可利用分析出的結果進行教學模式的調整，以提升學生學習的狀態與品質。

> 更多