主題: GPT-4專業(yè)和學(xué)術(shù)水平接近人類
2023-03-15 14:08:41          
功能: [發(fā)表文章] [回復(fù)] [快速回復(fù)] [進(jìn)入實(shí)時(shí)在線交流平臺(tái) #1
 
 
頭銜:金融島總管理員
昵稱:大牛股
發(fā)帖數(shù):112201
回帖數(shù):21834
可用積分?jǐn)?shù):99540120
注冊(cè)日期:2008-02-23
最后登陸:2024-10-24
主題:GPT-4專業(yè)和學(xué)術(shù)水平接近人類

 ChatGPT熱度還未散去,ChatGPT開發(fā)商OpenAI發(fā)布了更強(qiáng)大的GPT-4,堪稱“王炸”產(chǎn)品。

  當(dāng)?shù)貢r(shí)間3月14日,OpenAI公開發(fā)布大型多模態(tài)模型GPT-4,與ChatGPT所用的模型相比,GPT-4不僅能夠處理圖像內(nèi)容,且回復(fù)的準(zhǔn)確性有所提高。目前GPT-4沒有免費(fèi)版本,僅向ChatGPT Plus的付費(fèi)訂閱用戶及企業(yè)和開發(fā)者開放。

“這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑。”O(jiān)penAI介紹,GPT-4在專業(yè)和學(xué)術(shù)方面表現(xiàn)出近似于人類的水平。例如,它在模擬律師考試中的得分能夠排進(jìn)前10%左右,相比之下,GPT-3.5的得分只能排在倒數(shù)10%左右。

  與此前的GPT系列模型相比,GPT-4最大的突破之一是在文本之外還能夠處理圖像內(nèi)容。OpenAI表示,用戶同時(shí)輸入文本和圖像的情況下,它能夠生成自然語言和代碼等文本。

  目前圖像處理功能還未公開,不過該公司在官網(wǎng)上展示了一系列案例。例如,輸入如下圖片并詢問“這張圖片有什么不尋常之處”,GPT-4可作出回答“這張照片的不同尋常之處在于,一名男子正在行駛中的出租車車頂上,使用熨衣板熨燙衣服。”

在官方演示中,GPT-4幾乎就只花了1-2秒的時(shí)間,識(shí)別了手繪網(wǎng)站圖片,并根據(jù)要求實(shí)時(shí)生成了網(wǎng)頁代碼制作出了幾乎與手繪版一樣的網(wǎng)站。

  除了普通圖片,GPT-4還能處理更復(fù)雜的圖像信息,包括表格、考試題目截圖、論文截圖、漫畫等,例如根據(jù)專業(yè)論文直接給出論文摘要和要點(diǎn)。

與此前的模型相比,GPT-4的準(zhǔn)確性有所提高。OpenAI稱,該公司花費(fèi)6個(gè)月的時(shí)間,利用對(duì)抗性測(cè)試程序和ChatGPT的經(jīng)驗(yàn)教訓(xùn)迭代調(diào)整GPT-4,從而在真實(shí)性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來最好的結(jié)果,“至少對(duì)我們而言,GPT-4訓(xùn)練運(yùn)行前所未有地穩(wěn)定,成為首個(gè)能夠提前準(zhǔn)確預(yù)測(cè)其訓(xùn)練性能的大型模型?!?br />
  OpenAI稱,在公司內(nèi)部的對(duì)抗性真實(shí)性評(píng)估中,GPT-4的得分比最新的GPT-3.5高40%,相應(yīng)的“不允許內(nèi)容請(qǐng)求的傾向”降低了 82%,根據(jù)政策響應(yīng)敏感請(qǐng)求(如醫(yī)療建議和自我傷害)的頻率提高了29%。

  不僅是英語,該模型在多種語言方面均表現(xiàn)出優(yōu)越性。OpenAI稱,在測(cè)試的26種語言中,GPT-4在24種語言方面的表現(xiàn)均優(yōu)于GPT-3.5等其他大語言模型的英語語言性能。其中GPT-4的中文能夠達(dá)到80.1%的準(zhǔn)確性,而GPT-3.5的英文準(zhǔn)確性僅為70.1%,GPT-4英文準(zhǔn)確性提高到了85.5%。

 不過, 與早期的GPT模型一樣,GPT-4仍然存在一定的局限性。

  OpenAI稱,它并不完全可靠,可能會(huì)出現(xiàn)推理錯(cuò)誤 ,“GPT-4缺乏對(duì)絕大多數(shù)數(shù)據(jù)切斷后(2021年9月)發(fā)生的事件的了解,并且無法從中吸取經(jīng)驗(yàn)教訓(xùn)……它有時(shí)會(huì)出現(xiàn)簡單的推理錯(cuò)誤,它會(huì)輕信用戶明顯的虛假陳述,有時(shí)它會(huì)像人類一樣在難題上失敗,例如在它生成的代碼中引入安全漏洞?!?br />
  基于此,OpenAI提醒,用戶在使用語言模型時(shí)應(yīng)格外小心,最好輔助以人工審查、附加上下文、或完全避免在高風(fēng)險(xiǎn)情況下使用它。

  值得注意的是,GPT-4雖然于14日才正式公開,但早在一個(gè)月前,微軟的新版搜索引擎必應(yīng)(Bing)就已經(jīng)在GPT-4 上運(yùn)行。微軟表示,“如果您在過去五周內(nèi)的任何時(shí)間使用過新版必應(yīng),那么您已經(jīng)體驗(yàn)過GPT-4的早期版本。”

  與免費(fèi)的ChatGPT不同,GPT-4目前僅向ChatGPT Plus的付費(fèi)用戶開放,它也將作為API(應(yīng)用程序編程接口)提供給企業(yè)及開發(fā)者,開發(fā)者需進(jìn)入等候名單上,將該模型集成到他們的應(yīng)用程序中。

  OpenAI表示,已經(jīng)有多家公司將GPT-4搭載到他們的產(chǎn)品中,包括語言學(xué)習(xí)工具軟件多鄰國(Duolingo)、移動(dòng)支付公司Stripe和可汗學(xué)院(Khan Academy)。

【免責(zé)聲明】上海大牛網(wǎng)絡(luò)科技有限公司僅合法經(jīng)營金融島網(wǎng)絡(luò)平臺(tái),從未開展任何咨詢、委托理財(cái)業(yè)務(wù)。任何人的文章、言論僅代表其本人觀點(diǎn),與金融島無關(guān)。金融島對(duì)任何陳述、觀點(diǎn)、判斷保持中立,不對(duì)其準(zhǔn)確性、可靠性或完整性提供任何明確或暗示的保證。股市有風(fēng)險(xiǎn),請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)相應(yīng)責(zé)任。
 

結(jié)構(gòu)注釋

 
 提示:可按 Ctrl + 回車鍵(ENTER) 快速提交
當(dāng)前 1/1 頁: 1 上一頁 下一頁 [最后一頁]