OpenAI通過(guò)小型圓桌發(fā)布會(huì)發(fā)布AI Agent開(kāi)發(fā)套件
3月12日,OpenAI發(fā)布針對(duì)AI Agent打造的系列工具與API,助力開(kāi)發(fā)者更便捷地創(chuàng)建可自動(dòng)執(zhí)行任務(wù)的AI Agent。
--全新的Responses API:深度融合對(duì)話式API的交互簡(jiǎn)潔性與助手API的工具調(diào)用能力,打造面向智能體開(kāi)發(fā)的統(tǒng)一接口范式。該API支持動(dòng)態(tài)任務(wù)解析與工具鏈自主調(diào)度,顯著降低復(fù)雜業(yè)務(wù)流程的架構(gòu)復(fù)雜度。
--內(nèi)置工具:包括網(wǎng)絡(luò)搜索、文件搜索和計(jì)算機(jī)使用等功能。
--全新的智能體SDK:用于協(xié)調(diào)單代理和多代理工作流。
--集成的可觀測(cè)性工具:用于追蹤和檢查智能代理工作流的執(zhí)行情況。
OpenAI官方提供的Agent工作流執(zhí)行進(jìn)度跟蹤面板
這些新工具簡(jiǎn)化了智能體的核心邏輯、編排和交互,極大地降低了開(kāi)發(fā)者構(gòu)建智能體的入門門檻。在未來(lái)幾周和幾個(gè)月內(nèi),OpenAI計(jì)劃陸續(xù)推出更多工具和功能,進(jìn)一步簡(jiǎn)化并加速在OpenAI平臺(tái)上構(gòu)建智能體應(yīng)用的流程。
01.Responses API技術(shù)解析
作為OpenAI面向智能體開(kāi)發(fā)的基礎(chǔ)API組件,Responses API深度融合對(duì)話式接口的易用性與助手API的工具調(diào)度能力。該API旨在為開(kāi)發(fā)者構(gòu)建具備持續(xù)演進(jìn)能力的智能體系統(tǒng)提供核心支撐框架。
隨著模型能力的迭代升級(jí),Responses API將持續(xù)優(yōu)化其靈活性和擴(kuò)展性,使開(kāi)發(fā)者通過(guò)單次API調(diào)用即可完成多工具協(xié)同、多輪推理的復(fù)雜任務(wù)處理。
Responses API首批支持網(wǎng)絡(luò)搜索引擎、文件搜索和計(jì)算機(jī)使用等功能。這些工具旨在協(xié)同工作,將模型與現(xiàn)實(shí)世界連接起來(lái),使其在完成任務(wù)時(shí)更具實(shí)用性。
Responses API專為需要將OpenAI模型與內(nèi)置工具無(wú)縫集成至應(yīng)用系統(tǒng)的開(kāi)發(fā)者設(shè)計(jì),OpenAI默認(rèn)不會(huì)將存儲(chǔ)于其平臺(tái)的企業(yè)數(shù)據(jù)用于模型訓(xùn)練,該承諾在數(shù)據(jù)處理協(xié)議中有明確條款約束。
該API即日起面向所有開(kāi)發(fā)者開(kāi)放,采用標(biāo)準(zhǔn)化計(jì)費(fèi)體系:Tokens與工具調(diào)用均按官網(wǎng)公示費(fèi)率執(zhí)行?。
對(duì)現(xiàn)有API的影響
Chat Completions API??:作為OpenAI當(dāng)前市場(chǎng)占有率最高的接口方案,該API將持續(xù)獲得新型號(hào)模型與功能迭代支持。對(duì)于無(wú)需內(nèi)置工具調(diào)用的應(yīng)用場(chǎng)景,建議開(kāi)發(fā)者繼續(xù)沿用現(xiàn)有技術(shù)架構(gòu)。
?Assistants API??:基于Assistants API測(cè)試版獲得的開(kāi)發(fā)者反饋,OpenAI已將關(guān)鍵改進(jìn)整合至Responses API,使其更靈活、更快速、更易用,未來(lái)OpenAI將棄用Assistants API,目標(biāo)時(shí)間為2026年年中。
02.Responses API的內(nèi)置工具
網(wǎng)絡(luò)搜索
開(kāi)發(fā)者現(xiàn)在可以通過(guò)網(wǎng)絡(luò)獲取快速、最新的答案,并附帶清晰相關(guān)的引用來(lái)源。在Responses API中,使用gpt-4o和gpt-4o-mini時(shí),網(wǎng)絡(luò)搜索可作為工具使用,并可與其他工具或函數(shù)調(diào)用結(jié)合。
在早期測(cè)試中,開(kāi)發(fā)者群體已將網(wǎng)絡(luò)搜索應(yīng)用于多種用例,包括購(gòu)物助手、研究代理和旅行預(yù)訂代理——任何需要及時(shí)網(wǎng)絡(luò)信息的應(yīng)用場(chǎng)景。
演示使用OpenAI的API來(lái)生成與當(dāng)天新聞相關(guān)的文本響應(yīng)
GPT-4o搜索和4o-mini搜索的定價(jià)分別為每千次查詢30美元和25美元。
文件搜索
開(kāi)發(fā)者現(xiàn)在可以輕松從海量文檔中檢索相關(guān)信息。升級(jí)后的文件搜索工具支持多種文件類型、查詢優(yōu)化、元數(shù)據(jù)過(guò)濾及自定義重新排序,能夠提供快速精準(zhǔn)的搜索結(jié)果。通過(guò)Responses API,僅需幾行代碼即可完成集成。
展示如何使用OpenAI的API接口進(jìn)行文檔搜索,并獲取相關(guān)問(wèn)題的答案
文件搜索工具適用于多種實(shí)際場(chǎng)景:支持客服助手快速調(diào)取常見(jiàn)問(wèn)題庫(kù)、協(xié)助編程助手查詢技術(shù)文檔等。定價(jià)為每千次查詢2.50美元,文件存儲(chǔ)費(fèi)用為每GB每日0.10美元(首GB免費(fèi))。
計(jì)算機(jī)使用
開(kāi)發(fā)者現(xiàn)可通過(guò)Responses API構(gòu)建能夠操作計(jì)算機(jī)完成任務(wù)的智能體,該工具基于與Operator同源的計(jì)算機(jī)使用代理(CUA)模型。
展示如何使用OpenAI的API來(lái)創(chuàng)建一個(gè)響應(yīng)對(duì)象
該工具能捕獲模型生成的鼠標(biāo)與鍵盤操作軌跡,使開(kāi)發(fā)者可將這些動(dòng)作轉(zhuǎn)化為具體環(huán)境中的可執(zhí)行命令,實(shí)現(xiàn)計(jì)算機(jī)任務(wù)的自動(dòng)化處理。
安全方面:內(nèi)置防御提示注入的安全檢查、敏感操作確認(rèn)提示、環(huán)境隔離工具及策略違規(guī)檢測(cè)強(qiáng)化。OpenAI提示,建議涉及系統(tǒng)操作時(shí)保持人工監(jiān)督。
該工具現(xiàn)以研究預(yù)覽版形式向使用層級(jí)3-5的開(kāi)發(fā)者開(kāi)放于Responses API中,定價(jià)為每百萬(wàn)輸入Token 3美元、輸出Token 12美元。
03.智能體SDK
全新開(kāi)源的?智能體SDK?顯著簡(jiǎn)化多智能體工作流管理,相較去年發(fā)布的實(shí)驗(yàn)性工具Swarm?(已被開(kāi)發(fā)者社區(qū)廣泛采用并成功部署于多個(gè)客戶場(chǎng)景),本次升級(jí)包含以下改進(jìn):
--?智能體配置?:支持快速部署預(yù)置清晰指令與內(nèi)置工具的大語(yǔ)言模型。
--?流程交接?(Handoffs:):實(shí)現(xiàn)智能體間控制權(quán)的動(dòng)態(tài)轉(zhuǎn)移與上下文繼承。
--?安全護(hù)欄?(Guardrails):可定制的輸入輸出驗(yàn)證機(jī)制,防范有害內(nèi)容。
--追蹤與可觀測(cè)性:可視化智能體執(zhí)行軌跡以調(diào)試并優(yōu)化性能。
智能體SDK適用于多種現(xiàn)實(shí)場(chǎng)景,包括客戶支持自動(dòng)化、多步驟研究、內(nèi)容生成、代碼審查與銷售線索挖掘。它兼容Responses API與Chat Completions API。該SDK也支持其他提供商的模型。