國科會發展台灣可信任AI對話引擎盼守住繁中語料

（中央社記者張璦台北14日電）政府單位、金融業等資料具機敏性，不能萬事問ChatGPT，國科會主委吳政忠今天表示，發展「可信任人工智慧對話引擎」（TAIDE）是「打地基」，未來提供公私部門加值應用、向上「蓋樓房」，也是守住台灣擁有的豐富、珍貴繁體中文語料。

隨英文、簡體中文版聊天機器人相繼問世，相關爭議叢生。國科會拍板，公私協力發展融合台灣元素、以正體中文為主的「可信任人工智慧對話引擎」（Trustworthy AI Dialog Engine，TAIDE），計畫經費約新台幣2億元至3億元。

國科會今天召開記者會，公布第一階段完成了「7B」中模型（參數量為70億），此模型是在LLaMA（Meta推出的語言模型）原型基礎上，由國內學界專家進一步發展及訓練調校。

在計畫起步階段、時間與資料有限下，實測自動摘要、翻譯文本、寫信及寫文章等4方面，TAIDE「7B模型」均有不錯表現，尤其對於繁體中文的處理能量及回答，更為穩定準確。

行政院政委兼國科會主委吳政忠坦言，台灣投入TAIDE預算經費「小小小」，這筆錢拿去買房確實可以買到「大房」，但拿去跟在開發引擎的歐美科技大廠相比，一定是少的；台灣不是要做泛用型，而是從基礎引擎做起「打地基」，未來「上面要蓋什麼樣的樓房」，將攜手公部門、業者做各種應用，達成綜效（synergy）。

吳政忠指出，後續各單位可依照需求選擇適用的模型大小，並衡量所需算力及成本，自行運用加值，加速台灣各領域掌握自主性的能力。

台灣之所以必須自己來，是因為「有些東西不能隨便問別人」。吳政忠舉例，台灣公家單位、金融業、科技大廠等資料具機敏性，當然不能問ChatGPT，畢竟AI不斷在學習，資料數據一輸入，無形中就被收走了；再者，台灣擁有豐富繁體中文語料，是「寶貝」，這部分也要守住。

國科會科技政策諮詢專家室資通訊群組召集人李育傑指出，TAIDE計畫考慮兼容、包容性，未來不管是台語、客語都會概括。

針對繁體中文語料的使用，國科會官員及TAIDE團隊表示，目前洽談合作中，後續將取得更大範圍的資料。

國科會打造TAIDE，聚集國內相關領域最頂尖的教授團隊，負責指導核心模型及對話學習技術開發；國科會轄下法人機構，例如國研院國網中心負責建置新一代超級電腦，以提升算力資源，並提供應用服務平台；科政中心則負責徵集處理訓練資料。

此外，數位發展部負責驗測環境架構的發展，並針對計畫所產出的模型進行評測，以提供可信任的證據基礎。（編輯：張良知）1120614

國科會發展台灣可信任AI對話引擎 盼守住繁中語料