四月_ChatGPT探討|ChatGPT帶動的商機與商業模式討論
目前OpenAI的營運模式是透過應用程式介面向用戶收取服務費,包括自然語言處理的ChatGPT模型、創建和編輯原始圖像的DALL·E模型、自動語音辨識的Whisper模型。該公司按照不同人工智慧模型和需求進行收費,生成的人工智慧圖像與語言文字各按照解析度、字元定價,此種商業模式稱為人工智慧生成內容(AIGC),是透過機器學習模型創造出全新內容,如文字、圖案、音訊、音樂、視訊、程式碼、各種設計、行銷廣告、3D模型等,應用場景橫跨運營、客戶體驗、產品與服務創新,涉及的領域多為知識性或創造性工作。
網際網路內容生產方式經歷專業生成內容(PGC)、用戶生成内容(UGC)與人工智慧生成內容等三階段。Web1.0時代的網際網路內容大都是專業人員製作的高品質文字和視訊,Web2.0時代則開始讓用戶可以自由上傳內容,預期Web3.0時代內容將逐漸改由人工智慧自動化生產,並有助於元宇宙發展,因為它所需的大量數位原生內容需要借助人工智慧完成創作。人工智慧生成內容技術發展歷程大致可分為三個階段,說明如下 :
- 1950到1990年代的早期萌芽期:受限於科技水平,該技術僅限於實驗用途。1957年Lejaren Hiller和Leonard Isaacson完成史上第一部由電腦創作的音樂作品”依利亞克組曲(Illiac Suite)”。1966年Joseph Weizenbaum和Kenneth Colbv共同開發了世界第一個聊天機器人”Eliza”,它透過分析輸入文字內容而將特定字句重組變成全新組合。1980年代IBM開發出語音控制打字機”Tangora”,能夠處理兩萬個單字。
- 1990到2010年代的技術發展期:該技術從實驗用途轉向商業化發展。雖然深度學習、圖形處理單元、張量處理器和訓練資料規模都取得重大突破,但受到演算法發展限制,其應用效果還有待提升。2007 年紐約大學人工智慧研究員Ross Goodwin完成世界上第一部由人工智慧創作的小說”1 The Road”。2012年Micorsoft展示全自動同聲傳譯系統,透過深度神經網路(DNN)技術,可以自動將英文演講者的內容通過語音辨識、語言翻譯、語音合成等技術生成中文語音。
- 2010年代起至今的快速成長期:由於深度學習顯著進步,讓該技術取得突破性進展,2022年後相關演算法出現爆炸性發展而使其技術逐漸商業化,主要集中在人工智慧生成圖像領域,如OpenAI的DALL·E、Meta的Make-A-Scene、Google的Imagen與Parti等模型。 更多詳細內容,請註冊會員或登入會員登入.