五月_台灣AIGC研析|從ChatGPT看台灣生成式AI(AIGC)軟體與服務產業發展(上)
在前面幾篇的文章,我們探討了ChatGPT(Generative Pre-trained Transformer)所引發的AI應用趨勢以及可能的商業模式討論等。接著,我們討論在ChatGPT引爆全球話題後,台灣在生成式AI(AIGC)軟體與服務產業的發展情況。
自2022年十一月由OPEN AI推出後至今,引來無數討論,諸如後續商機發展、工作取代、道德與資安問題等,其面向可謂相當全面且廣泛。以商機而言,ChatGPT的運作核心仍然是不脫AI模型訓練與推論能力的展現,也因此對於相關的硬體乃至於半導體商機已有相當多的討論,像是台灣早已是全球伺服器代工大國,在面對生成式AI應用需求暴漲的情況下,長期來看,伺服器需求勢必水漲船高。與此同時,全球AI晶片的設計與製造,台灣半導體產業也扮演舉足輕重的角色,如晶圓代工龍頭台積電與設計服務大廠創意電子與智原科技等,皆能在這波生成式AI浪潮下,佔有一席之地。不過,儘管台灣在硬體製程與半導體在生成式AI領域早已卡位,但在軟體應用領域亦有不錯表現,本篇報告重點將聚焦國內幾家重要的生成式AI軟體與應用業者在市場上的發展現況。
生成式AI與NLP基本概觀
在進入台灣軟體與應用服務業者的討論前,關於生成式AI與NLP(自然語言處理)系統等做簡要的概述與介紹。概括而言,生成式AI是眾多AI的一種類型,透過機器學習模型研究歷史數據的模式,進而生成文本、圖像、影片、音訊甚至是簡單的程式碼等各種內容。市調機構Gartner將生成式AI列為《2022年度重要戰略技術趨勢》的首位,並預測到2025年,生成式AI將占所有資料的10%,ChatGPT即為生成式AI的一種形式。
而生成式AI之所以會如此火紅,其背後的助力就是NLP系統,在概念上可分成兩大類,一是NLU(自然語言理解),另一個則是NLG(自然語言生成),前者自然是利用訓練出來的模式來理解文字內容,事先蒐集並設計相關詞庫,再透過分析文句中相關詞句出現的次數來進一步理解該段文句。其中更包含了正負面的情緒用字,做為該模型的基礎之一,以採用該模型的裝置得以理解此段文字的真正意涵。NLG則是接續NLU,因應NLU的內容判斷,進一步衍生出相應的文字內容,其背後也需要基本的邏輯、數據以及各國當地的文句結構來支撐。而將NLU與NLG加以結合,就成為Transformer,Transformer 被視為遷移式學習的一種,其概念是將學會 A 任務的模型套用至 B 任務的資料上繼續學習的技術。過往的 NLP 執行步驟會將理解與生成拆分成兩階段。若想完成NLG,業者一般會將先設計好前段的NLU模型,再將NLU所產生的結果投入至NLG的模型中,而遷移式學習則是將整段過程揉合在一起的框架。也因此,當ChatGPT暴紅之後,市場亦有許多憂心人士認為,這樣的學習模型若是放任不管,對於人類未來發展反而會帶來極為不利的影響。