作者:王姵文
ChatGPT自去年推出後就被熱烈討論和引起使用熱潮,ChatGPT 由「OpenAI LP」所開發, OpenAI 在 2020 年推出自然語言處理(NLP)模型「GPT-3」,經過大量文本學習,熟悉人類慣用的文字接龍方向;透過人類訓練者標註,讓 AI 模仿答覆;再以人類回答的資料模型進行「增強式學習」,讓 AI 更精準模仿人類語言,才發展成如今見到的 ChatGPT 聊天機器人工具。
因為ChatGPT 聊天機器人能透過問答快速產生出文本,所以很多人拿來用作寫論文、文章等的工具,為了能夠辦釋出文字內容是AI還是人類所撰寫,一些人便開發出能辨識的工具。
AI Text Classifier
打造熱門 AI 聊天機器人 ChatGPT 的開發公司 OpenAI 於2/1對外宣告,已經開發出了可以初步檢測由 AI 所產生的文字的偵測工具:AI Text Classifier。這個語言模型是以人類和人工智慧針對相同主題所撰寫及生成的文字組資料加以訓練,使用多種來源,以處理自動生成的假消息,以及學術抄襲等問題。
不過根據 OpenAI 的說法,這個偵測工具除了需要至少 1,000 個字元(約 150 ~ 250 個字)才能使用;且目前能成功辨識的機率也還僅有 26% 而已。而 OpenAI 也表示他們正在與教育工作者合作,討論 ChatGPT 的功能和局限性,並將繼續致力於檢測 AI 生成的文字。
DetectGPT
史丹佛大學研究小組提出 DetectGPT 新技術,為打擊高等教育中用人工智慧模型產生文本的首批工具。
原理是 LLM 產生文字通常於模型對數機率函數的負曲率區域特定區域徘徊,故開發新指標,判斷文本是否由 AI 產生,且不需經過訓練人工智慧或收集大型資料庫以比較文本。
此方法稱為「Zero-Shot」,允許 DetectGPT 檢測 AI 產生文本,不需知道是用哪個人工智慧模型,操作簡單與其他需訓練「分類器」和真實及產生段落資料庫法形成鮮明對比。
團隊用假新聞測試 DetectGPT,檢測 AI 產生文本與否的表現優於其他 Zero-Shot 法。團隊稱檢測性能有提高,表示 DetectGPT 是有前途的方法,可仔細檢查 AI 產生的文本。
GPT-2 內容產出偵測器(GPT-2 Output Detector)
如果 OpenAI 工程師能打造出寫作能力和普通人不相上下、甚至更優異的機器人,那麼想設計出比人類更擅於判別 AI 內容的應用程式,想必也非難事。
目前此工具尚處於線上 demo 階段,使用者只需要將文本輸入指令框,就能即時看到這段文字為 AI 產出的可能性有多高。
GPTZero
這款應用程式由就讀普林斯頓大學的大四學生愛德華.田開發,他主修電腦科學、副修新聞,在寒假期間開發出 GPTZero,能夠辨別出內容是否由 ChatGPT 所撰寫;使用上非常方便,只要將文本複製貼上再送出,該工具就能告訴你文本是真、是假的可能性有多高。
給出判別前,GPTZero 會評估好幾個變因,其中一項評估項目就是文本的「變化性」——人類寫手作品在用字遣詞、句子長度上,往往都更多變。
小結
不久前我們還以為 AI 生成內容將從此成為主流,人類寫手恐怕會有失業的一天。但工程師們似乎決心不讓機器人專美於前,正嘗試開發多種偵測工具,可辨識出 ChatGPT 等聊天機器人程式之產出內容。