• 瀏覽: 72
+8
來源 | 科研圈(ID:keyanquan)


可用於 ChatGPT 的 11 個插件。|OpenAI

撰文 杜若雲

編輯 吳蘭、魏瀟

北京時間 3 月 23 日,OpenAI 發佈了第一批可接入 ChatGPT 的插件。這些插件由 11 個第三方提供,同時 OpenAI 官方也提供了兩個官方插件 Browsing 和 Code Interpreter。

根據 OpenAI 官網的介紹[2],第三方的插件可以用來查詢航班,訂機票(Expedia,KAYAK),對比商品價格,購物(Klarna Shopping,Shop,Instacart),檢索實時消息(FliscalNote),進行數學計算(Wolfram),學習語言(Speak)等等。在這些插件的加持下,ChatGPT 終於可以走出 2021 年之前的世界,與當下“聯網”了。

Wolfram 加持,數學能力顯著提高

第三方插件的接入使得 ChatGPT 更加強大。作為大型語言模型(LLM)神經網絡,ChatGPT 強大的生成文本材料能力有目共睹,但它並不能去做複雜的計算推理工作,也無法系統地產生正確的(而不是“看上去正確”的)數據。但在接入計算功能強大的 Wolfram 插件後,ChatGPT 不僅可以做這些事情, 在計算層面上“胡言亂語”的習慣也可以被改正。

通過下面這道大學數學題,就能看出接入插件前後 ChatGPT 的不同表現。圖 1 中的 Genie 來自代碼編輯器 VScode,它是該軟件的 ChatGPT 擴展,能夠代表沒有接入插件前的 ChatGPT。


圖 1 沒有接入計算插件 Wolfram 前,ChatGPT 的“胡言亂語”。|作者


圖 2 接入插件的 ChatGPT 給出了正確的答案。|[1]

通過簡單的檢查我們發現,在沒有接入 Wolfram 插件時,ChatGPT 給出了一個“看起來過程很完美”但是結果完全錯誤的回答,但是在接入 Wolfram 插件後的回答是完全正確的。那麼, 這個插件是如何避免 ChatGPT “胡說”的?解決方法聽起來很簡單:ChatGPT 會通過插件將問題發送給 WolframAlpha 進行計算,然後根據返回的結果來“決定”回答什麼。同時用戶可以點擊“Used Wolfram”按鈕來檢查 ChatGPT 是否“編造”回答。這意味著,通過 Wolfram 插件我們可以判斷出哪些信息(計算相關)是正確的,哪些是“編造”的。

對於與現實世界有關的問題,ChatGPT 也可以靠這種方法給自己打上“補丁”。比如向無插件版 ChatGPT 提問土耳其的畜牧數量有多少時,它“鄭重其事”地引用了土耳其統計局(Turkish Statistical Institute),並“編造”了一個看似合理的數據(圖 3)。當使用接入Wolfram 插件的 ChatGPT 時(圖 4),這個回答和 WolframAlpha(Wolfram 公司的一款軟件,也是 Wolfram 插件背後的“回答者”)中給出的答案完全相同,這也從側面驗證了該插件的工作原理。


圖 3 無插件的 ChatGPT 對土耳其畜牧業問題的編造回答。


圖 4 有插件後 ChatGPT 能夠給出正確答案。來源:[1]

目前,Wolfram 和 ChatGPT 的聯動,僅限於 ChatGPT 將用戶用自然語言詢問的問題通過插件發送給 WolframAlpha。由於 WolframAlpha 的構建初衷就是處理各種“混亂”的類人自然語言並給出答案,因此它可以處理來自 ChatGPT 的用戶詢問,並通過插件返回答案[1],因此目前的 Wolfram 插件對於 ChatGPT 是一個簡單版本, 未來也許可以通過訓練使 ChatGPT “搞懂”更復雜更強大的 Wolfram 語言,這對於 ChatGPT 的計算能力提高更為關鍵,對科研職業的作用也更為明顯。

數學家危險了?

那麼這是否意味著,插件的接入會使 ChatGPT 的功能足夠強大到影響以至於取代某些職業呢?

根據 OpenAI 最近發表在預印本網站 arXiv.org 上的研究論文[3],我們可以看到 不同職業對於 GPT 的“暴露”程度。這裡的“暴露”是指將完成任務的時間減少至少一半,即當“暴露”程度達到 100%,GPT 能至少幫你將完成任務的時間減少一半。不同職業的“暴露”程度有所不同,最令人驚訝的是, 數學家的暴露程度超越了很多看似技術含量不太高的工作,達到了 100%。作為對比,財務經理和平面設計師的暴露程度為 13%,公關專家和創意作家的暴露程度分別為 67% 和 69%,而經常“被失業”的翻譯和口譯的暴露程度,也只有 77%。


圖 5 OpenAI 關於 AI 對不同職業影響程度的研究結果 來源:[3]

從論文發表的時間來看,這些數據是 GPT-4 發佈後和 ChatGPT 插件發佈前的數據,但從插件的作用和機制來看, 插件的引入或許導致這些職業的“暴露”程度更高,同時會減少用戶檢查 ChatGPT 是否在“胡說八道”的時間。但這並不意味數學家將被取代,他們可以將大量繁瑣的計算和代碼工作交給 ChatGPT 來完成。 這將大大提高科學家的工作效率,讓他們有時間思考並進行原創性工作。如果 ChatGPT 可以幫助數學家和理論物理學家完成繁瑣的計算,並得到大量結果,這也會對我們理解新科學大有幫助。


圖 6 陶哲軒分享的 ChatGPT 使用心得 來源:[7]


圖 7 利用 ChatGPT 生成的 arXiv 論文檢索結果的 RSS。|作者

除此之外, 陶哲軒還會用 ChatGPT 幫自己備課,比如詢問它在線性代數課堂中聰明的學生可能會提出的問題,來啟發自己課程講授以及佈置作業的方向。在博客中他提到:“雖然這些 AI 工具無法直接幫助我完成核心任務——如嘗試解決一個尚沒有答案的數學問題,但是它們對於各種次要(但仍與工作相關)任務時非常有效(儘管之後需要一些手動調整)。”

隱私隱患如何解決

目前來看,這些職業是否會被 AI 取代,取決於後者的未來發展,但這毫無疑問會深刻改變我們的生活生產方式。OpenAI 公共政策主管 Anna Makanju 表示:“這項技術將深刻改變我們的生活方式。我們現在仍有時間來指導其發展軌跡、限制濫用並確保最廣泛有益的結果。”[6]

除了職業安全問題,我們還需要關心一下自己的隱私。 擔心“聰明”的 ChatGPT “竊取”用戶隱私是一個 AI 誕生起就如形隨形的問題,而第三方插件的引入使得這個問題更加複雜——我們難以保證這些插件不會利用 ChatGPT 獲得用戶隱私來牟利。3 月 20 日,ChatGPT 出了一個幾乎引發全網騷動的 bug,一些用戶可以在自己的聊天頁面裡看到他人的聊天記錄。OpenAI 不得不將 ChatGPT 強制下線修復[4],這令大批打工人叫苦不迭。更糟糕的是,ChatGPT 下線的幾個小時裡,一部分活躍用戶的姓名、電子郵件地址、支付地址、信用卡號的最後四位和信用卡到期時間也被洩露,儘管 OpenAI 官方認為洩漏的數據量很少,但如何採取措施確保用戶隱私安全將成為所有 AI 公司的首要任務。

如上所述,ChatGPT 這樣的 AI 在未來肯定會深刻地影響目前社會的生產生活格局,改變人們的工作生活方式,因此如何確保新的“人+AI”模式順利進行並對人類社會產生有益影響,對於政策制定者和 AI 公司有著極大的考驗。

參考文獻

[1]https://writings.stephenwolfram.com/2023/03/chatgpt-gets-its-wolfram-superpowers/

[2]https://openai.com/blog/chatgpt-plugins

[3]https://arxiv.org/pdf/2303.10130.pdf

[5]https://openai.com/blog/march-20-chatgpt-outage

[6]https://openai.com/safety

[7]https://mathstodon.xyz/@tao

封面圖來源:Pixabay。

本文經授權轉載自 科研圈( ID:keyanquan),如需二次轉載請聯繫原作者。歡迎轉發到朋友圈。 返回搜狐,查看更多

責任編輯:



原文連結:https://inewsdb.com/其他/最容易被chatgpt搶飯碗的科學家,竟然真的是數學家?/

inewsdb.com 日日新聞 . 掌握每日新鮮事



inewsdb.com 日日新聞 . 掌握每日新鮮事
[按此隱藏 Google 建議的相符內容]