OpenAI是美國知名的人工智能研究實驗室,致力於透過發展通用人工智能(AGI)來塑造人工智能的未來。他們的指導原則是確保通用人工智能被開發出來是既"安全又有益"的。對於 AGI,它指的是"在經濟價值最高的工作中超越人類的高度自治系統"。
如今,OpenAI在全球人工智能領域取得了巨大的成功,產生了包括 GPT-4、DALL-E、OpenAI Five、ChatGPT、OpenAI Codex 等突破性創新成果。此外,Microsoft在認識到OpenAI工作的潛力後,並投入了巨資,於2019年提供了10億美元,並於2023年再度投入100億美元,以推進OpenAI的研究和創新。該組織承諾致力於安全性並努力避免人工智能的有害應用或不適當的權力集中,使其在該行業中獨樹一格。
網站 | https://openai.com/ |
---|---|
成立 | 2015年12月11日 |
主要成員 | Sam Altman, Elon Musk, Ilya Sutskever, Greg Brockman, Trevor Blackwell, Vicki Cheung, Andrej Karpathy, Durk Kingma, Jessica Livingston, John Schulman, Pamela Vagata, and Wojciech Zaremba |
知識庫 | https://github.com/openai/ |

OpenAI的關鍵貢獻和創新
毫無疑問,OpenAI確實為AI領域提供了重要的工具和技術。以下是OpenAI開發的主要產品和技術:
GPT模型
關鍵發展時間線:
2016年6月16日 - OpenAI在生成模型上發布了研究,這些模型通過收集在特定領域的大量數據並生成相似的數據進行訓練。
2019年9月19日 - OpenAI在GPT-2語言模型的微調上發布了研究,這是通過人類的喜好和反饋進行的。
2022年1月27日- OpenAI發布了對InstructGPT模型的研究,這是ChatGPT的兄弟模型。這些模型展示出了改善的指令執行能力,減少了事實的捏造,減少了有害的輸出。
2022年11月30日- OpenAI使用GPT-3.5引入了ChatGPT,作為一個免費的研究預覽的一部分。
2023年3月14日 - OpenAI在ChatGPT和Bing中發布了GPT-4,承諾更好的可靠性,創新性和問題解決能力。
GPT-3
GPT-3(生成預訓練Transformer 3)是一款具有突破性的AI模型,利用機器學習技術生成類似人類的文本。這項技術使用一種基於Transformer架構的語言預測模型。GPT-3擁有1750億個機器學習參數,幫助訓練其根據文本中使用的先前單詞來預測詞的可能性的能力。最終,它可以生成令人印象深刻的連貫和語境相關的句子。
此外,GPT-3通過人類反饋強化學習(RLHF)進行微調。這種方法是人工智能的一個裡程碑,因為它使創建更高級的人工智能模型成為可能,並被廣泛地用作各種OpenAI模型的基礎技術
GPT-3.5
2023年3月1日發布的GPT-3.5是GPT-3的升級版本,因為它具有一套精於理解和生成自然語言或代碼的高級模型。GPT-3.5有五種不同的模型變體,每種都有專業的能力。其中四個專門為文本完成任務優化,剩下的一個在代碼完成任務中有更好的性能。

GPT-4
GPT-4模型代表了AI語言模型的新時代。它強化了其前身GPT-3和GPT-3.5的優勢,同時解決了它們的缺點。GPT-4經過進一步微調,以提高跟隨指令的能力,減少捏造的事實,並減少有毒的輸出,從而使其更可靠且更富有創新性。
OpenAI發布GPT-4標誌著ChatGPT演變的裡程碑,提升了其理解和生成文本的能力,以及更好的語境理解和問題解決能力。作為最大和最先進的模型,GPT-4為未來的AI發展設定了更高的標準。

ChatGPT
ChatGPT是一種先進的語言模型,能以對話的方式模仿人類的文本生成。以GPT-3模型為基礎建立的ChatGPT專門被設計用以生成對用戶輸入的互動式響應。憑藉其處理跟進查詢、糾正錯誤、挑戰謬論和拒絕不適當請求的能力,ChatGPT在對話參與中展現了高度的複雜性。
微調
OpenAI的微調技術提供了一種從AI模型中提取最佳性能的方法。.
其特徵包括:
提高結果的質量
可以在更多的樣本上進行訓練
使用更短的prompt以節省字符的使用
快速處理請求。
工作原理是在比 prompt可以容納的更大的數據集上訓練像GPT-3這樣的預訓練模型,這有助於提高模型在各種任務上的性能
嵌入
在OpenAI的語境中,嵌入是文本串相關性的度量。這樣的嵌入廣泛用於搜索操作,聚類,推薦,異常檢測,多樣性測量和分類等多個領域。相關性以向量的形式表示,兩個向量之間的距離指示了它們的相似性等級。
Whisper
Whisper是一種出色的自動語音識別系統,它處理從廣泛的多語言和多任務訓練數據集中收集的文本。Whisper擅長處理不同的口音,技術語言和背景噪音,具有更高的準確性,這對英語語音識別非常有用。它在開發者社區中非常受歡迎。此外,你還可以使用Whisper API。

DALL-E 2/圖像生成
DALL-E 2是OpenAI的另一項令人印象深刻的AI系統,能夠根據自然語言描述生成真實的圖像和藝術作品。無論是創造原始圖像,擴展現有圖像,進行真實的編輯,還是生成給定圖像的不同變體,DALL-E 2都能借助深度學習模型完成所有這些任務。

Codex
OpenAI的 Codex 能將自然語言轉譯成程式碼,以幫助開發者完成編程任務。它支持多種程式語言,能理解並執行簡單的命令,從而讓現有應用程式建立自然語言介面成為可能。Codex 是 Github Copilot 的基礎模型,它是 GPT-3 的升級版,並利用混合的自然語言和數十億行源程式碼進行訓練。

OpenAI API
OpenAI API是一個雲接口。托管在Microsoft Azure上,一旦OpenAI發布了模型API,你就可以訪問OpenAI開發的新AI模型,如 DALL-E、Codex和GPT-3。
與大多數為單一用例設計的AI系統不同,現在的API提供了通用的“輸入文字,輸出文字”的接口,允許使用者在幾乎任何英語語言任務上嘗試使用。
如何使用它?只需申請訪問權限以將API集成到你的產品中,然後你就可以開發一個全新的應用 —— 例如,基於OpenAI的API的圖像生成器。

OpenAI模型定價
以下是OpenAI開發的各種模型的定價結構概述:
語言模型
OpenAI提供了具有獨特功能和不同價格的多種語言模型。價格是每1000個字符列出的,大約750個單詞。
GPT-4
模型 | 輸入成本 | 輸出成本 |
---|---|---|
8000個字符的上下文 | 每1000個字符0.03美元 | 每1000個字符0.06美元 |
32000個字符的上下文 | 每1000個字符0.06美元 | 每1000個字符0.12美元 |
GPT-3.5 Turbo
模型 | 輸入成本 | 輸出成本 |
---|---|---|
4000個字符的上下文 | 每1000個字符0.0015美元 | 每1000個字符0.002美元 |
16000個字符的上下文 | 每1000個字符0.003美元 | 每1000個字符0.004美元 |
微調模型
模型 | 訓練成本 | 使用成本 |
---|---|---|
Babbage | 每1000個字符0.0006美元 | 每1000個字符0.0024美元 |
Curie | 每1000個字符0.003美元 | 每1000個字符0.012美元 |
Davinci | 每1000個字符0.03美元 | 每1000個字符0.12美元 |
Babbage | 每1000個字符0.0006美元 | 每1000個字符0.0024美元 |
嵌入模型
模型 | 使用成本 |
---|---|
使用上下文 | 每1000個字符0.0001美元 |
圖像模型
OpenAI的圖像模型,如DALL·E,可以被直接嵌入到應用程序中,以生成和編輯全新的圖片和藝術作品。這類模型提供了三個層次的分辨率選項,以提高靈活性。
分辨率 | 價格 |
---|---|
1024×1024 | 每張圖片0.020美元 |
512×512 | 每張圖片0.018美元 |
256×256 | 每張圖片0.016美元 |
音頻模型
模型 | 價格 |
---|---|
Whisper | 每分鐘0.006美元(四捨五入至最接近的秒) |
OpenAI的傑出客戶
OpenAI的創新技術在各行各業中得到了應用。以下是我們一些尊貴客戶如何利用我們的人工智能模型的能力的簡要概述:
摩根士丹利
摩根士丹利的財富管理部門利用GPT-4的功能整理其龐大的知識庫,提高了效率和客戶服務水平。
Stripe
Stripe使用GPT-4優化其用戶體驗並打擊欺詐活動,確保所有用戶的交易安全流暢。
冰島政府
在一個獨特的人工智能應用中,冰島政府正在使用GPT-4來保護其語言的豐富遺產,確保其文化和傳統延續到數字時代
Khan學院
Khan學院正在探索人工智能世界,開展一個有限的試點項目,研究GPT-4在改變在線學習和輔導方面的潛在應用。
Duolingo
Duolingo通過結合GPT-4,增強其語言學習平台的功能,深化對話練習,提高用戶的語言技能。