伊人成人精品,久久成人激情视频,亚洲精品中文字幕视频,精品国产污,在线人成免费视频,av福利网址,狠狠干视频网站

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

重磅!OpenAI正式發(fā)布GPT-5:一鍵生成網(wǎng)頁(yè)、寫(xiě)作像詩(shī)人、更懂健康問(wèn)題!微軟搶先接入,免費(fèi)體驗(yàn)

2025-08-08 06:07:38

OpenAI正式推出新一代人工智能模型GPT-5,該模型能自動(dòng)識(shí)別何時(shí)快速響應(yīng)或深入思考。GPT-5在編程、創(chuàng)意寫(xiě)作和健康咨詢(xún)方面顯著提升,且出現(xiàn)幻覺(jué)的錯(cuò)誤信息率顯著降低。OpenAI引入安全訓(xùn)練形式并推出四種ChatGPT聊天預(yù)設(shè)性格。此外,微軟在GPT-5發(fā)布當(dāng)日即宣布,將其整合到廣泛的產(chǎn)品線中。

每經(jīng)編輯|杜宇    

當(dāng)?shù)貢r(shí)間周四(8月7日),OpenAI官方正式推出了備受外界期待的、性能更強(qiáng)的新一代人工智能模型GPT-5。

圖片來(lái)源:OpenAI官網(wǎng)

OpenAI在新聞稿中寫(xiě)道,GPT-5的智能性能遠(yuǎn)超公司之前的所有模型,在編碼、數(shù)學(xué)、寫(xiě)作、健康、視覺(jué)感知等領(lǐng)域均擁有卓越的性能。

聲明補(bǔ)充稱(chēng),GPT-5是一個(gè)統(tǒng)一的系統(tǒng),能夠識(shí)別何時(shí)快速響應(yīng),何時(shí)需要更長(zhǎng)時(shí)間的思考以提供專(zhuān)家級(jí)的應(yīng)答,不必由用戶(hù)手動(dòng)選擇使用常規(guī)語(yǔ)言模型還是推理系統(tǒng)。

OpenAI表示,GPT-5將面向所有用戶(hù)開(kāi)放,Plus會(huì)員可獲得更多使用量,Pro會(huì)員則可訪問(wèn)GPT-5 Pro版本——該版本具有擴(kuò)展推理能力,可提供更全面、更準(zhǔn)確的答案。

先前,OpenAI首席執(zhí)行官薩姆·奧爾特曼(Sam Altman)稱(chēng)GPT-5是一次“重大升級(jí)”,“這還是第一次,真的像是在與某個(gè)領(lǐng)域的專(zhuān)家對(duì)話?!?/p>

ChatGPT團(tuán)隊(duì)負(fù)責(zé)人Nick Turley表示,新模型在響應(yīng)速度、回答準(zhǔn)確性以及減少“幻覺(jué)”方面都優(yōu)于前代產(chǎn)品,“你跟它對(duì)話時(shí),會(huì)感覺(jué)自然了不少。”

在8月7日的簡(jiǎn)報(bào)會(huì)上,奧爾特曼對(duì)GPT-5給予了極高評(píng)價(jià),將GPT-5定位為通往AGI的重要里程碑。他表示:“在以往歷史上任何時(shí)期,擁有像GPT-5這樣的東西都是不可想象的。”

“這是第一次感覺(jué)就像在與任何領(lǐng)域的專(zhuān)家交談?!盇ltman在簡(jiǎn)報(bào)會(huì)上甚至不惜用“踩”GPT-4抬高GPT-5。他說(shuō):“我嘗試過(guò)用回GPT-4,但效果相當(dāng)糟糕?!?/p>

圖片來(lái)源:視覺(jué)中國(guó)

GPT-5擁有編程、創(chuàng)意寫(xiě)作、健康領(lǐng)域三大優(yōu)勢(shì)

根據(jù)OpenAI介紹,作為OpenAI的“最強(qiáng)大模型”,GPT-5在三個(gè)關(guān)鍵領(lǐng)域?qū)崿F(xiàn)了顯著提升。

首先是編程能力。GPT-5是OpenAI迄今為止最強(qiáng)大的編碼模型,在復(fù)雜的前端生成和大型代碼庫(kù)調(diào)試方面表現(xiàn)突出,能夠僅憑一個(gè)提示就創(chuàng)建美觀響應(yīng)式的網(wǎng)站、應(yīng)用程序App和游戲。早期測(cè)試者注意到其在間距、排版和留白等設(shè)計(jì)選擇方面的改進(jìn)。

在從GitHub獲取現(xiàn)實(shí)世界編碼任務(wù)的基準(zhǔn)測(cè)試SWE-bench Verified中,GPT-5思考后首次嘗試的準(zhǔn)確率達(dá)74.9%,高于OpenAI推理模型o3的69.1%和GPT-4o的30.8%。

評(píng)論指出,這意味著,GPT-5的表現(xiàn)略勝于Anthropic周二推出的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro,后兩者在SWE-bench Verified測(cè)試的得分分別為74.5%和59.6%。

不過(guò),在衡量數(shù)學(xué)、人文和自然科學(xué)領(lǐng)域模型表現(xiàn)的各學(xué)科專(zhuān)家級(jí)能力Humanity’s Last Exam測(cè)試中,帶有擴(kuò)展推理功能的GPT-5增強(qiáng)版本GPT-5 pro在使用工具的情況下得分42%。這略低于得分44.4%的xAI模型Grok 4 Heavy。

奧爾特曼稱(chēng),GPT-5尤其擅長(zhǎng)按需啟動(dòng)整個(gè)軟件App,也就是所謂的“氛圍編碼”、即用AI根據(jù)自然語(yǔ)言提示生成功能代碼,從而加快開(kāi)發(fā)速度。

作為實(shí)例,OpenAI的研究者演示了,要求GPT-5創(chuàng)建一款網(wǎng)頁(yè)App,幫助說(shuō)英語(yǔ)的用戶(hù)學(xué)習(xí)法語(yǔ),且該App必須有一個(gè)引人入勝的主題,包含抽認(rèn)卡、測(cè)驗(yàn)、經(jīng)典的貪吃蛇游戲,以及追蹤每日學(xué)習(xí)進(jìn)度的方法。

研究者將相同的提示詞提交到兩個(gè)GPT-5 窗口中,幾分鐘后生成了兩個(gè)不同的App。OpenAI的負(fù)責(zé)人稱(chēng),這些App“存在一些缺陷”,但用戶(hù)可以根據(jù)個(gè)人喜好再調(diào)整AI生成的軟件,例如更改背景或添加更多標(biāo)簽頁(yè)。

在創(chuàng)意寫(xiě)作方面,GPT-5能夠處理結(jié)構(gòu)復(fù)雜的寫(xiě)作任務(wù),如無(wú)韻律的抑揚(yáng)格五音步詩(shī)或自然流動(dòng)的自由詩(shī),猶如詩(shī)人。OpenAI的ChatGPT業(yè)務(wù)副總Nick Turley表示,GPT-5在創(chuàng)意任務(wù)上表現(xiàn)出“更好的品味”,響應(yīng)更自然。

健康咨詢(xún)是第三個(gè)重要提升領(lǐng)域。

GPT-5能更積極地標(biāo)記潛在健康問(wèn)題,幫助用戶(hù)解析醫(yī)療結(jié)果,盡管OpenAI強(qiáng)調(diào),ChatGPT不能替代醫(yī)療專(zhuān)業(yè)人員。

在名為HealthBench Hard Hallucinations的測(cè)試中,具備思考能力的GPT-5出現(xiàn)幻覺(jué)的錯(cuò)誤信息率僅為1.6%。這遠(yuǎn)低于GPT-4o和o3模型,后兩者的錯(cuò)誤信息率分別為15.8%和12.9%。

幻覺(jué)可能性顯著降低 新的安全訓(xùn)練模式

OpenAI稱(chēng),GPT-5相比此前的模型更可靠和實(shí)用,它能更準(zhǔn)確地回答現(xiàn)實(shí)世界的疑問(wèn),出現(xiàn)幻覺(jué)的可能性顯著降低。

在對(duì)代表ChatGPT生產(chǎn)流量的匿名提示詞啟用網(wǎng)絡(luò)搜索后,GPT-5響應(yīng)中包含事實(shí)錯(cuò)誤的可能性比GPT-4o低約45%;在思考后,GPT-5響應(yīng)中包含事實(shí)錯(cuò)誤的可能性比o3低約 80%。下圖可見(jiàn),GPT-5響應(yīng)的錯(cuò)誤信息率僅為4.8%,GPT-4o為20.6%,o3為22%。

OpenAI還表示,為GPT-5引入了一種新的安全訓(xùn)練形式,名為安全補(bǔ)全(safe completions)。它教模型在安全范圍內(nèi)盡可能給出最有幫助的答案。有時(shí),這可能意味著部分回答用戶(hù)的問(wèn)題,或者只提供高水平的回答。

如果需要拒絕,經(jīng)過(guò)訓(xùn)練的GPT-5會(huì)以透明的方式告知用戶(hù)拒絕的原因,并提供安全的替代方案。

在受控的實(shí)驗(yàn)和OpenAI的生產(chǎn)模型中,OpenAI都發(fā)現(xiàn)這種安全補(bǔ)全的方法更加細(xì)致入微,能夠更好地引導(dǎo)雙重用途問(wèn)題,增強(qiáng)對(duì)模糊意圖的魯棒性,并減少不必要的過(guò)度拒絕。

OpenAI的后訓(xùn)練負(fù)責(zé)人Michelle Pokrass表示:“GPT-5已經(jīng)過(guò)訓(xùn)練,能夠識(shí)別任務(wù)何時(shí)無(wú)法完成,避免猜測(cè),并能更清晰地解釋局限性,相比之前的模型,這減少了無(wú)根據(jù)的斷言?!?/p>

推出四種可選的ChatGPT聊天預(yù)設(shè)性格

OpenAI稱(chēng),GPT-5在指令執(zhí)行方面表現(xiàn)提升,其執(zhí)行自定義指令的能力也得到了相應(yīng)的提升。OpenAI將為所有ChatGPT用戶(hù)推出四種預(yù)設(shè)性格的全新研究預(yù)覽版。

初始的四種性格選項(xiàng)——憤世嫉俗者(Cynic)、機(jī)器人(Robot)、傾聽(tīng)者(Listener)和書(shū)呆子(Nerd)都是可選的,用戶(hù)可在設(shè)置中隨時(shí)調(diào)整,用以匹配ChatGPT和用戶(hù)的溝通風(fēng)格。

上述四種性格最初適用于文本聊天,之后將擴(kuò)展到語(yǔ)音聊天,讓用戶(hù)無(wú)需編寫(xiě)自定義提示詞即可設(shè)置ChatGPT的交互方式——無(wú)論是簡(jiǎn)潔專(zhuān)業(yè)的、周到支持的,還是略帶諷刺的。

此外,微軟在GPT-5發(fā)布當(dāng)日即宣布,將其整合到廣泛的產(chǎn)品線中。在企業(yè)級(jí)應(yīng)用方面,Microsoft 365 Copilot將利用GPT-5更好地處理復(fù)雜問(wèn)題、在長(zhǎng)對(duì)話中保持專(zhuān)注并理解用戶(hù)上下文。企業(yè)用戶(hù)可通過(guò)推理功能處理電子郵件、文檔和文件。

對(duì)于消費(fèi)者,Microsoft Copilot的新智能模式將利用GPT-5幫助用戶(hù)發(fā)現(xiàn)最佳解決方案。用戶(hù)可通過(guò)copilot.microsoft.com或Windows、Mac、Android和iOS設(shè)備上的Copilot應(yīng)用免費(fèi)體驗(yàn)GPT-5。

開(kāi)發(fā)者將通過(guò)GitHub Copilot和Visual Studio Code獲得GPT-5支持,用于編寫(xiě)、測(cè)試和部署代碼。Azure AI Foundry平臺(tái)將提供所有GPT-5模型,配備AI驅(qū)動(dòng)的模型路由器,根據(jù)每個(gè)任務(wù)的復(fù)雜性、性能需求和成本效率選擇最優(yōu)模型。

每日經(jīng)濟(jì)新聞綜合OpenAI官網(wǎng)、公開(kāi)資料


如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0