ChatGPT Agent正式發(fā)布了，看看實力如何

2025-07-18 13:29:03來源：TechWeb.com.cn 關鍵詞：ChatGPT ChatGPT Agent閱讀量：21554

導讀：即日起，專業(yè)版(Pro)、增強版(Plus)和團隊版(Team)ChatGPT 用戶都可使用ChatGPT Agent。ChatGPT Agent的使用入口沒變，還是在ChatGPT原頁面，“工具”下拉選擇“Agent mode”即可。

　　7月18日消息，OpenAI CEO 奧特曼(Sam Altman)帶隊直播25分鐘發(fā)布“ChatGPT Agent”，首個統(tǒng)一智能體，大大提升了ChatGPT處理現(xiàn)實世界任務需求的能力。

　　例如，通過ChatGPT Agent，可以讓ChatGPT處理以下請求：“查看我的日歷，并根據(jù)最新消息簡要介紹即將召開的客戶會議”、“計劃和購買食材，為四人做日式早餐”以及“分析三個競爭對手并創(chuàng)建幻燈片”。ChatGPT將智能地瀏覽網(wǎng)站、過濾結(jié)果、在需要時提示你安全登錄、運行代碼、進行分析，甚至提供可編輯的PPT、Excel，總結(jié)其分析結(jié)果。

　　奧特曼稱：“ChatGPT Agent使用計算機執(zhí)行復雜任務，對自己來說是一個真正感受AGI的時刻。”

　　即日起，專業(yè)版(Pro)、增強版(Plus)和團隊版(Team)ChatGPT 用戶都可使用ChatGPT Agent。

　　ChatGPT Agent的使用入口沒變，還是在ChatGPT原頁面，“工具”下拉選擇“Agent mode”即可。

　　融合三大能力，PPT比人做得好

　　今年1月，OpenAI發(fā)布了首個智能體Operator，讓AI像人類一樣直接與GUI交互，可以自主上網(wǎng)、點擊和輸入。

　　Operator推出2周后，OpenAI又推出了首個Deep Research，推理模型直接可以使用工具，開展研究，擅長分析和總結(jié)信息。

　　現(xiàn)在，ChatGPT Agent融合了此前三大技術突破的優(yōu)勢：Operator與網(wǎng)站交互的能力，Deep Research整合信息的技巧，以及ChatGPT智能對話優(yōu)勢。

　　“Agent mode”下的ChatGPT可以直接使用用戶的計算機資源，包括智能瀏覽網(wǎng)頁、篩選結(jié)果，在需要時提醒安全登錄、運行代碼、進行分析，還能直出PPT和Excel匯總發(fā)現(xiàn)結(jié)果。

　　為了展示ChatGPT Agent能力，團隊演示了一個真實場景：上傳一張團隊吉祥物圖片，ChatGPT 可以制作公司吉祥物漫畫風貼紙，然后再訂購500張并送到某個地址。

　　在理解提示詞后，ChatGPT 先整合搜索-再推理創(chuàng)作-再執(zhí)行任務，調(diào)用用工具Imagen生成動漫版圖片，設計貼紙，最后從StickerMule訂購500份寄到的用戶指定的地址。

　　另外，團隊還演示了ChatGPT Agent做PPT的能力。

　　要求ChatGPT從Google云中提取分析評估數(shù)據(jù)并制作成PPT，直接用圖表展示結(jié)果。

　　ChatGPT Agent 鏈接Google云API進行搜索，并讀取相關內(nèi)容信息，并編寫一些代碼。

　　模型使用圖像生成功能，為PPT 圖表做一些裝飾和優(yōu)化。

　　制作出第一張PPT，還不夠精致。

　　強化學習的一個關鍵特性是模型會審視自己的結(jié)果，并加以完善，以交付出色的最終結(jié)果。

　　最終，ChatGPT Agent調(diào)用模型生成了PPT圖表。

　　ChatGPT Agent “跑分”情況

　　在網(wǎng)頁瀏覽、現(xiàn)實任務完成能力的評估中，ChatGPT Agent全部刷新了SOTA。

　　在人類最后考試(HLE)中，ChatGPT Agent以41.6%的得分，刷新了最高紀錄。當研究團隊采用并行策略后，即同時運行最多8次并選取自信度最高結(jié)果，HLE得分直接刷到了44.4%。

　　在最難的數(shù)學基準測試FrontierMath中，通過使用工具，如訪問終端執(zhí)行代碼，ChatGPT Agent的準確率達到27.4%，遠遠優(yōu)于之前的o3和o4-mini兩種模型。

　　在旨在評估模型在復雜、經(jīng)濟上有價值的知識工作任務上的性能的內(nèi)部基準上，ChatGPT Agent的輸出大約有一半的情況下與人類相當或更好，同時明顯優(yōu)于o3和o4 mini。

　　在評估數(shù)據(jù)科學生產(chǎn)力任務的DSBench中，ChatGPT Agent顯著超越了人類表現(xiàn)。

　　在Excel編輯能力的SpreadsheetBench測試中，當能夠直接編輯電子表格時，ChatGPT Agent的得分甚至更高，為45.5%，而Excel中的Copilot為20.0%。

　　在投行分析師1-3年級建模任務的內(nèi)部評估中，ChatGPT Agent表現(xiàn)優(yōu)于Deep Research和o3模型。

　　在OpenAI發(fā)布的BrowseComp基準測試(衡量瀏覽代理在網(wǎng)絡上定位難以找到的信息的能力)，ChatGPT Agent以68.9%的準確率成為新SOTA，比Deep Research高出17.4%。

　　最后，關于WebArena?(在新窗口中打開)，這是一個旨在評估網(wǎng)絡瀏覽代理在完成現(xiàn)實世界網(wǎng)絡任務方面的性能的基準測試，ChatGPT Agent比基于o3的CUA(為Operator提供動力的模型)有所改進。

　　AI Agent三維競爭格局形成

　　2025年是全球AI Agent技術爆發(fā)元年，行業(yè)從基礎大模型競爭全面轉(zhuǎn)向智能體落地，競爭格局呈現(xiàn)多層級分化。

　　在通用領域，今年年初，中國團隊開發(fā)的全球首個通用Agent“Manus”發(fā)布即引發(fā)震撼，6月訪問量達1616萬次。

　　在垂直領域，就在OpenAI ChatGPT Agent發(fā)布前一天，亞馬遜云科技發(fā)布了企業(yè)級Agent部署平臺Amazon Bedrock AgentCore，提供七大核心服務(如運行時隔離、代碼沙盒、瀏覽器工具)，支持8小時異步任務，幫助開發(fā)者打通AI agent從概念驗證到生產(chǎn)部署之間的關鍵環(huán)節(jié)。

　　隨著OpenAI ChatGPT Agent的強勢加入，當前AI Agent已形成 “通用 vs 垂直”、“端到端 vs 多模型”、“C端工具 vs B端平臺”的三維競爭格局。

上一篇：曝谷歌下月發(fā)布會有8大新品，提前一窺究竟

下一篇：聯(lián)塑機器產(chǎn)品介紹 | 315CPVC管材擠出生產(chǎn)線

我要評論

昵稱

匿名

文明上網(wǎng)，理性發(fā)言。（您還可以輸入200個字符)

表情

所有評論僅代表網(wǎng)友意見，與本站立場無關。

早報|千億高空機器人賽道迎來爆發(fā)；OpenAI發(fā)布ChatGPT Agent
高空機器人賽道兩家頭部企業(yè)完成大額融資，將這條千億美元的“垂直賽道”瞬間點燃；OpenAI通過技術直播發(fā)布重磅產(chǎn)品ChatGPT Agent......
高空機器人OpenAIChatGPT Agent
2025-07-18 09:42:29
ChatGPT重磅升級GPT-4.1：編程專家模型登場
在實際測試中，GPT-4.1比GPT-4o更注重效率，不再過度聊天，這讓它在專業(yè)場景中更可靠。與舊版GPT-4o相比，GPT-4.1帶來了更全面的提升。
ChatGPTGPT-4.1
2025-05-15 11:56:23
再見，GPT-4將退出ChatGPT舞臺
自2025年4月30日起，GPT-4將在ChatGPT中退役，并完全被GPT-4o取代。GPT-4 仍將在API中可用。
GPT-4ChatGPT
2025-04-14 10:29:08
攤牌了！OpenAI：DeepSeek可與ChatGPT媲美愿在AI領域與中國合作
DeepSeek“干得不錯”，比如在展示思維鏈條以及允許大規(guī)模免費應用方面，這些“顯然都是用戶期望的”功能。
OpenAIDeepSeekChatGPT
2025-02-12 15:05:10
ChatGPT重大更新：新增實時搜索和高級語音
OpenAI對搜索算法進行了深度優(yōu)化，使得用戶提出問題后，能在極短的時間內(nèi)（分鐘級別）獲取到包括股票、新聞等在內(nèi)的實時內(nèi)容。這一更新無疑極大地提升了搜索的時效性和實用性。
ChatGPT搜索功能
2024-12-17 09:40:55
ChatGPT首次被植入人類大腦：幫助殘障人士開啟對話
這款命名為Synchron Switch的革命性設備，通過頸靜脈這一自然通道輕松進入大腦，精準定位于運動皮層附近，實現(xiàn)了大腦運動信號與外部設備的無線橋梁。
ChatGPT腦機接口
2024-08-07 09:12:42

版權與免責聲明：

凡本站注明“來源：智能制造網(wǎng)”的所有作品，均為浙江興旺寶明通網(wǎng)絡有限公司-智能制造網(wǎng)合法擁有版權或有權使用的作品，未經(jīng)本站授權不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權使用作品的，應在授權范圍內(nèi)使用，并注明“來源：智能制造網(wǎng)”。違反上述聲明者，本站將追究其相關法律責任。

本站轉(zhuǎn)載并注明自其它來源（非智能制造網(wǎng)）的作品，目的在于傳遞更多信息，并不代表本站贊同其觀點或和對其真實性負責，不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉(zhuǎn)載時，必須保留本站注明的作品第一來源，并自負版權等法律責任。如擅自篡改為“稿件來源：智能制造網(wǎng)”，本站將依法追究責任。

鑒于本站稿件來源廣泛、數(shù)量較多，如涉及作品內(nèi)容、版權等問題，請與本站聯(lián)系并提供相關證明材料：聯(lián)系電話：0571-89719789；郵箱：1271141964@qq.com。

不想錯過行業(yè)資訊？

訂閱 智能制造網(wǎng)APP

一鍵篩選來訂閱

信息更豐富

今日焦點/FOCUS 更多

熱門話題/TOPICS更多

人形機器人奏響“狂歡曲”

高難度！深圳眾擎實現(xiàn)全球首例人形機器人前空翻

宇樹科技王興興：預計年底H1機器人跑速達10米/秒超博爾特

智能體產(chǎn)業(yè)正加速崛起

智能體步入實體交互時代，具身智能產(chǎn)業(yè)落地進入加速期

智能體全面進化！埃斯頓酷卓發(fā)布新一代人形機器人Codroid 02

精彩直播/VIDEO更多

回放

【與智造同行】走進華為AI＋制造行業(yè)峰會2025——如何讓智能制造走深走實？華為給你答案！

: 數(shù)字孿生賦能新型工業(yè)化分論壇

: 數(shù)字孿生賦能低空經(jīng)濟分論壇

推薦產(chǎn)品/PRODUCT 更多

工業(yè)級高低溫冷熱溫度沖擊試驗箱三箱式
冷熱沖擊試驗箱,冷熱沖擊試驗機,冷熱沖擊箱推薦,不銹鋼冷熱沖擊試驗箱,兩槽式冷熱沖擊箱
品牌
廣皓天
德國進口伍爾特89027
893114116,89020,893113114,瑞士Dichta密封圈授權經(jīng)銷商
品牌
其他品牌
Hellma 730-009-44實驗室石英微孔板
實驗室石英微孔板,實驗室,低干擾與高可靠性,石英玻璃
品牌
Hellma
砂基透水速率測試裝置
砂基透水速率測試裝置,砂基透水磚,透水速率測定儀
品牌
其他品牌
德國HYDAC賀德克標準壓力控制閥
德國hydac溢流閥,賀德克控制閥使用,全新HYDAC溢流閥,德國賀德克壓力控制器標準款,德國賀德克液壓閥
品牌
賀德克/HYDAC
色素高速分散機
色素研磨分散機,管線式色素研磨分散機,色素分散機
品牌
其他品牌

放荡的巨乳空姐,91小宝寻花一区二区三区,欧美视频自拍偷拍,我被添得好爽在线视频欧美,国产一级在线看,一级毛片毛片,av解说在线观看

ChatGPT Agent正式發(fā)布了，看看實力如何

熱門評論

全部評論

放荡的巨乳空姐,91小宝寻花一区二区三区,欧美视频自拍偷拍,我被添得好爽在线视频欧美,国产一级在线看,一级毛片毛片,av解说在线观看

ChatGPT Agent正式發(fā)布了，看看實力如何

熱門評論

全部評論

ChatGPT Agent正式發(fā)布了，看看實力如何