OpenAI 首次開(kāi)發者日:新模型發布,支持 128K 上下(xià)文,價格直降,GPT 商(shāng)店(diàn)要來了
距離(lí) ChatGPT 在去(qù)年 11 月 30 日低調上線,已經接近一(yī)周年。這期間 OpenAI 處在絕對領導地位,推動着全球進入了「大(dà)模型時代」,并開(kāi)啓了新一(yī)輪的創新創業熱潮。
OpenAI 的首次 DevDay 開(kāi)發者日活動,于今日北(běi)京時間 11 月 7 日淩晨 02:00 開(kāi)始,Keynote 主論壇環節由 Sam Altman 主講并在油管現場直播,配合現場的演示,展示了多款新産品的發布,整整 45 分(fēn)鍾,内容緊湊而真誠。
Keynote 亮點摘要:
OpenAI 開(kāi)發者數據:全球超過 200 萬開(kāi)發者在使用 OpenAI 旗下(xià)的開(kāi)發者服務,其中(zhōng) 90% 來自世界 500 強企業,目前 OpenAI 每周活躍用戶超過一(yī)億;
GPT-4 Turbo:最新發布 GPT-4 Turbo 支持 128K 上下(xià)文窗口,Token 的費(fèi)用相較 GPT-4,低至原定價的 1/3 和 1/2;知(zhī)識庫更新至 2023 年 4 月;API 現在支持圖片和文本輸入;新版本中(zhōng)的 JSON 模式可以強制 GPT 以純 JSON 格式響應;集成 DALL-E 3、語音合成等新能力。
版權保護功能:承諾爲 API 用戶與企業客戶提供版權保護服務及侵權賠償服務。
定制化 GPT & GPTs 應用商(shāng)店(diàn):每個人都可以構建自己的 GPT,GPTs 應用商(shāng)店(diàn)即将于本月晚些時候正式發布,開(kāi)發者可上傳自己的 GPT 并獲得收入。
Assistants API :開(kāi)發者可以通過 Assistants API 提供的各類工(gōng)具(檢索、代碼解釋器、Python)、提供沙箱環境構建,高效創建 AI Agents。
多模态能力提升:GPT-4 Turbo with Vision、DALL-E 3 和 TextToSpeech 工(gōng)具現已上線,發布語音合成模型 tts-1、tts-1-hd 和語音轉文字模型 Whisper 3。
今日發布的 GPT-4 Turbo,最大(dà)的改動在于知(zhī)識庫的更新截至 2023 年 4 月,相較于過往版本隻收錄了 2021 年 9 月前的世界知(zhī)識,GPT-4 Turbo 擁有了更新的知(zhī)識庫。
另外(wài)就是 GPT-4 Turbo 支持 128k 上下(xià)文窗口,相當于 300 多頁文本的内容。Altman 還強調本次優化模型性能後,與 GPT-4 相比還能夠極大(dà)地壓縮 Token 的使用成本。
此前網絡中(zhōng)一(yī)直傳言将在本次開(kāi)發者日上正式發布 GPT-5,最終隻見證了 GPT-4 Turbo 的到來。雖然不能消除開(kāi)發者們對 GPT-5 不能及時發布的遺憾,但是也能感受到 OpenAI 在重大(dà)版本發布上的謹慎與克制。
GPT 商(shāng)店(diàn)即将上線:OpenAI 的生(shēng)态野心
科技圈常常将 ChatGPT 出現,類比于蘋果發布 iPhone 這類跨時代重大(dà)事件。在這次發布會的 GPTs 這部分(fēn),就能夠感受到 OpenAI 想通過模型技術建立更大(dà)生(shēng)态的雄心壯志(zhì)。
根據 Sam Altman 的解釋,GPTs 是針對特定目的進行自定義的 ChatGPT 版本,無需任何寫代碼的經驗,完全靠自然語言的輸入,就可以創造出屬于自己的 GPTs。現場 OpenAI 提供了自定義 GPT 示例:Canva 和 ZapierAI ,通過非常簡單的交互,就可以實現自定義 GPT 的生(shēng)成。
目前部分(fēn)自定義 GPT 已經支持 ChatGPT Plus 和企業用戶試用。
除了在主論壇環節詳細介紹 GPTs 生(shēng)态之外(wài),OpenAI 已經在官網上發布了博客文章,詳細介紹 GPTs 的特性與設計理念。在官方發布的一(yī)段視頻(pín),展示了如何使用一(yī)個寵物(wù)醫生(shēng) GPT 來解決狗狗日常護理的問題。
目前已經有 Amgen、Bain、and Square 等幾家公司,已經開(kāi)始使用 GPT 提供的 自定義 GPT 進入業務,預計将在近期向 API 用戶和企業客戶端用戶全面開(kāi)放(fàng)。
同時,在本月晚些時候,OpenAI 将會推出 GPT 商(shāng)店(diàn)功能,主要用于分(fēn)享用戶構建的自定義 GPT 助手。
Assistants API:Agent 第一(yī)步
Assistants API 是幫助開(kāi)發者在自己的程序中(zhōng)構建 Agent 的第一(yī)步,是一(yī)種專門構建的人工(gōng)智能産品,具有特定的指令,利用額外(wài)的知(zhī)識,并且可以調用模型和工(gōng)具來執行任務。新的 Assistants API 提供了代碼解釋器和檢索以及函數調用等新功能,可以處理你以前必須自己完成的大(dà)量繁重工(gōng)作,并使你能夠構建高質量的 AI 應用程序。
代碼解釋器:在沙盒執行環境中(zhōng)編寫和運行 Python 代碼,可以生(shēng)成圖形和圖表,并處理具有不同數據和格式的文件。它允許開(kāi)發者叠代運行代碼來解決複雜(zá)的代碼和數學問題等等。
檢索:利用模型之外(wài)的知(zhī)識來增強助手,例如專有領域數據、産品信息或用戶提供的文檔。這意味着開(kāi)發者不需要計算和存儲文檔的嵌入,或實現分(fēn)塊和搜索算法。Assistants API 根據在 ChatGPT 中(zhōng)構建知(zhī)識檢索的經驗,優化了要使用的檢索技術。
函數調用:使助手能夠調用你定義的函數并将函數響應合并到其消息中(zhōng)。
目前可以前往 Assistants Playground 來嘗試 Assistants API Beta 版。
多模态能力,持續推進、全面開(kāi)花
多模态作爲當前模型團隊重點關注和發展的技術,開(kāi)發者可以通過文本轉語音 API 從文本生(shēng)成人類質量的語音。
開(kāi)發者可以通過圖像 API 将 DALL·E 3直接集成到他們的應用程序和産品中(zhōng),并将 DALL·E-3 指定爲模型。目前 Snap、可口可樂和 Shutterstock 等公司已使用 DALL·E 3 爲其客戶和活動生(shēng)成圖像和設計的服務。
與之前版本的 DALL·E 類似,該 API 包含内置審核功能,可幫助開(kāi)發人員(yuán)保護其應用程序免遭濫用。目前提供不同的格式和質量選項,每生(shēng)成一(yī)張圖像的起價爲 0.04 美元,可以查看 API 中(zhōng)的 DALL·E 3 入門指南(nán)。
GPT-4 Turbo with vision,開(kāi)發者可以通過 API 中(zhōng)的 gpt-4-vision-preview 來訪問。OpenAI 計劃爲主要的 GPT-4 Turbo 模型提供視覺支持,價格取決于輸入圖像的大(dà)小(xiǎo),例如像素 1080×1080 的圖像需要的成本爲 0.00765 美元。
另外(wài),其中(zhōng) OpenAI 本次發布的 TTS 模型(文本轉語音)提供可六種預設聲音可供選擇以及兩種模型變體(tǐ),tts-1 和 tts-1-hd. tts 都針對實時用例進行了優化,并 tts-1-hd 針對質量進行了優化。
這次 DevDay 中(zhōng),Sam Altman 在緊湊的四十五分(fēn)鍾内,介紹了近期的多項重要更新和産品的未來願景,本身就像是一(yī)個精煉了知(zhī)識的大(dà)模型,不斷輸出高密度信息。
這場開(kāi)發者日的新品發布,是否也讓你們感到驚喜呢?
内容參考:
發布會回放(fàng):https://www.youtube.com/watch?v=U9mJuUkhUzk
DevDay:https://openai.com/blog/new-models-and-developer-products-announced-at-devday
GPTs:https://openai.com/blog/introducing-gpts
特邀現場觀察團:Keven Liu
500px: https://500px.com/rongxinliu
Github: https://github.com/rongxin-liu
————————————————
原文鏈接:https://blog.csdn.net/csdnnews/article/details/134259228
Keynote 亮點摘要:
OpenAI 開(kāi)發者數據:全球超過 200 萬開(kāi)發者在使用 OpenAI 旗下(xià)的開(kāi)發者服務,其中(zhōng) 90% 來自世界 500 強企業,目前 OpenAI 每周活躍用戶超過一(yī)億;
GPT-4 Turbo:最新發布 GPT-4 Turbo 支持 128K 上下(xià)文窗口,Token 的費(fèi)用相較 GPT-4,低至原定價的 1/3 和 1/2;知(zhī)識庫更新至 2023 年 4 月;API 現在支持圖片和文本輸入;新版本中(zhōng)的 JSON 模式可以強制 GPT 以純 JSON 格式響應;集成 DALL-E 3、語音合成等新能力。
版權保護功能:承諾爲 API 用戶與企業客戶提供版權保護服務及侵權賠償服務。
定制化 GPT & GPTs 應用商(shāng)店(diàn):每個人都可以構建自己的 GPT,GPTs 應用商(shāng)店(diàn)即将于本月晚些時候正式發布,開(kāi)發者可上傳自己的 GPT 并獲得收入。
Assistants API :開(kāi)發者可以通過 Assistants API 提供的各類工(gōng)具(檢索、代碼解釋器、Python)、提供沙箱環境構建,高效創建 AI Agents。
多模态能力提升:GPT-4 Turbo with Vision、DALL-E 3 和 TextToSpeech 工(gōng)具現已上線,發布語音合成模型 tts-1、tts-1-hd 和語音轉文字模型 Whisper 3。
OpenAI DevDay 交流區
GPT-4 Turbo 正式發布,支持 128k 上下(xià)文窗口今日發布的 GPT-4 Turbo,最大(dà)的改動在于知(zhī)識庫的更新截至 2023 年 4 月,相較于過往版本隻收錄了 2021 年 9 月前的世界知(zhī)識,GPT-4 Turbo 擁有了更新的知(zhī)識庫。
另外(wài)就是 GPT-4 Turbo 支持 128k 上下(xià)文窗口,相當于 300 多頁文本的内容。Altman 還強調本次優化模型性能後,與 GPT-4 相比還能夠極大(dà)地壓縮 Token 的使用成本。
圖片版本價格對比
GPT-4 Turbo 還加入了 JSON 模式,這确保模型将使用有效的 JSON 進行響應。新的 API 參數 response_format 使模型能夠限制其輸出,以生(shēng)成語法正确的 JSON 對象。JSON 模式對于開(kāi)發者在函數調用之外(wài),在對話(huà)窗口就能完成 API 中(zhōng)生(shēng)成 JSON。此前網絡中(zhōng)一(yī)直傳言将在本次開(kāi)發者日上正式發布 GPT-5,最終隻見證了 GPT-4 Turbo 的到來。雖然不能消除開(kāi)發者們對 GPT-5 不能及時發布的遺憾,但是也能感受到 OpenAI 在重大(dà)版本發布上的謹慎與克制。
GPT 商(shāng)店(diàn)即将上線:OpenAI 的生(shēng)态野心
科技圈常常将 ChatGPT 出現,類比于蘋果發布 iPhone 這類跨時代重大(dà)事件。在這次發布會的 GPTs 這部分(fēn),就能夠感受到 OpenAI 想通過模型技術建立更大(dà)生(shēng)态的雄心壯志(zhì)。
根據 Sam Altman 的解釋,GPTs 是針對特定目的進行自定義的 ChatGPT 版本,無需任何寫代碼的經驗,完全靠自然語言的輸入,就可以創造出屬于自己的 GPTs。現場 OpenAI 提供了自定義 GPT 示例:Canva 和 ZapierAI ,通過非常簡單的交互,就可以實現自定義 GPT 的生(shēng)成。
目前部分(fēn)自定義 GPT 已經支持 ChatGPT Plus 和企業用戶試用。
除了在主論壇環節詳細介紹 GPTs 生(shēng)态之外(wài),OpenAI 已經在官網上發布了博客文章,詳細介紹 GPTs 的特性與設計理念。在官方發布的一(yī)段視頻(pín),展示了如何使用一(yī)個寵物(wù)醫生(shēng) GPT 來解決狗狗日常護理的問題。
目前已經有 Amgen、Bain、and Square 等幾家公司,已經開(kāi)始使用 GPT 提供的 自定義 GPT 進入業務,預計将在近期向 API 用戶和企業客戶端用戶全面開(kāi)放(fàng)。
同時,在本月晚些時候,OpenAI 将會推出 GPT 商(shāng)店(diàn)功能,主要用于分(fēn)享用戶構建的自定義 GPT 助手。
Assistants API:Agent 第一(yī)步
Assistants API 是幫助開(kāi)發者在自己的程序中(zhōng)構建 Agent 的第一(yī)步,是一(yī)種專門構建的人工(gōng)智能産品,具有特定的指令,利用額外(wài)的知(zhī)識,并且可以調用模型和工(gōng)具來執行任務。新的 Assistants API 提供了代碼解釋器和檢索以及函數調用等新功能,可以處理你以前必須自己完成的大(dà)量繁重工(gōng)作,并使你能夠構建高質量的 AI 應用程序。
代碼解釋器:在沙盒執行環境中(zhōng)編寫和運行 Python 代碼,可以生(shēng)成圖形和圖表,并處理具有不同數據和格式的文件。它允許開(kāi)發者叠代運行代碼來解決複雜(zá)的代碼和數學問題等等。
檢索:利用模型之外(wài)的知(zhī)識來增強助手,例如專有領域數據、産品信息或用戶提供的文檔。這意味着開(kāi)發者不需要計算和存儲文檔的嵌入,或實現分(fēn)塊和搜索算法。Assistants API 根據在 ChatGPT 中(zhōng)構建知(zhī)識檢索的經驗,優化了要使用的檢索技術。
函數調用:使助手能夠調用你定義的函數并将函數響應合并到其消息中(zhōng)。
目前可以前往 Assistants Playground 來嘗試 Assistants API Beta 版。
多模态能力,持續推進、全面開(kāi)花
多模态作爲當前模型團隊重點關注和發展的技術,開(kāi)發者可以通過文本轉語音 API 從文本生(shēng)成人類質量的語音。
開(kāi)發者可以通過圖像 API 将 DALL·E 3直接集成到他們的應用程序和産品中(zhōng),并将 DALL·E-3 指定爲模型。目前 Snap、可口可樂和 Shutterstock 等公司已使用 DALL·E 3 爲其客戶和活動生(shēng)成圖像和設計的服務。
與之前版本的 DALL·E 類似,該 API 包含内置審核功能,可幫助開(kāi)發人員(yuán)保護其應用程序免遭濫用。目前提供不同的格式和質量選項,每生(shēng)成一(yī)張圖像的起價爲 0.04 美元,可以查看 API 中(zhōng)的 DALL·E 3 入門指南(nán)。
GPT-4 Turbo with vision,開(kāi)發者可以通過 API 中(zhōng)的 gpt-4-vision-preview 來訪問。OpenAI 計劃爲主要的 GPT-4 Turbo 模型提供視覺支持,價格取決于輸入圖像的大(dà)小(xiǎo),例如像素 1080×1080 的圖像需要的成本爲 0.00765 美元。
另外(wài),其中(zhōng) OpenAI 本次發布的 TTS 模型(文本轉語音)提供可六種預設聲音可供選擇以及兩種模型變體(tǐ),tts-1 和 tts-1-hd. tts 都針對實時用例進行了優化,并 tts-1-hd 針對質量進行了優化。
這次 DevDay 中(zhōng),Sam Altman 在緊湊的四十五分(fēn)鍾内,介紹了近期的多項重要更新和産品的未來願景,本身就像是一(yī)個精煉了知(zhī)識的大(dà)模型,不斷輸出高密度信息。
這場開(kāi)發者日的新品發布,是否也讓你們感到驚喜呢?
内容參考:
發布會回放(fàng):https://www.youtube.com/watch?v=U9mJuUkhUzk
DevDay:https://openai.com/blog/new-models-and-developer-products-announced-at-devday
GPTs:https://openai.com/blog/introducing-gpts
特邀現場觀察團:Keven Liu
500px: https://500px.com/rongxinliu
Github: https://github.com/rongxin-liu
————————————————
原文鏈接:https://blog.csdn.net/csdnnews/article/details/134259228
上一(yī)新聞:沒有了
下(xià)一(yī)新聞:小(xiǎo)米産業鏈概念股漲幅居前,藍(lán)思科技等多股跟漲