OpenAI是美国著名的人工智能研究实验室,致力于通过发展通用人工智能(AGI)来塑造人工智能的未来。 他们的指导原则是确保通用人工智能的开发既“安全又有益”。 对于 AGI 来说,它意味着“在最具经济价值的工作中超越人类的高度自治系统”。
如今,OpenAI在全球人工智能领域取得了巨大成功,产生了包括GPT-4、DALL-E、OpenAI Five、ChatGPT、OpenAI Codex等突破性创新成果。 此外,微软认识到 OpenAI 工作的潜力,并投入巨资,于 2019 年提供 10 亿美元,并于 2023 年进一步提供 100 亿美元,以推进 OpenAI 的研究和创新。 该组织承诺致力于安全并努力避免人工智能的有害应用或不适当的权力集中,这使其在该行业中脱颖而出。
Website | https://openai.com/ |
---|---|
成立 | 2015年12月11日 |
主要成员 | Sam Altman, Elon Musk, Ilya Sutskever, Greg Brockman, Trevor Blackwell, Vicki Cheung, Andrej Karpathy, Durk Kingma, Jessica Livingston, John Schulman, Pamela Vagata, and Wojciech Zaremba |
知识库 | https://github.com/openai/ |
![openai样式](https://www.gate2ai.com/images/article-page/tech/openai-banner.webp)
OpenAI的关键贡献和创新
毫无疑问,OpenAI确实为AI领域提供了重要的工具和技术。以下是OpenAI开发的主要产品和技术:
GPT模型
关键发展时间线:
2016年6月16日 - OpenAI在生成模型上发布了研究,这些模型通过收集在特定领域的大量数据并生成相似的数据进行训练。
2019年9月19日 - OpenAI在GPT-2语言模型的微调上发布了研究,这是通过人类的喜好和反馈进行的。
2022年1月27日- OpenAI发布了关于InstructGPT模型的研究,这是ChatGPT的兄弟模型。这些模型展示出了改善的指令执行能力,减少了事实的捏造,减少了有害的输出
2022年11月30日- OpenAI使用GPT-3.5引入了ChatGPT,作为一个免费的研究预览的一部分。
2023年3月14日 - OpenAI在ChatGPT和Bing中发布了GPT-4,承诺更好的可靠性,创新性和问题解决能力。
GPT-3
GPT-3(生成预训练Transformer 3)是一款具有突破性的AI模型,利用机器学习技术生成类似人类的文本。这项技术使用一种基于Transformer架构的语言预测模型。GPT-3拥有1750亿个机器学习参数,帮助训练其根据文本中使用的先前单词来预测词的可能性的能力。最终,它可以生成令人印象深刻的连贯和语境相关的句子。
此外,GPT-3通过人类反馈强化学习(RLHF)进行微调。这种方法是人工智能的一个里程碑,因为它使创建更高级的人工智能模型成为可能,并被广泛地用作各种OpenAI模型的基础技术。
GPT-3.5
2023年3月1日发布的GPT-3.5是GPT-3的升级版本,因为它具有一套精于理解和生成自然语言或代码的高级模型。GPT-3.5有五种不同的模型变体,每种都有专业的能力。其中四个专门为文本完成任务优化,剩下的一个在代码完成任务中有更好的性能。
![GPT3.5五种模型](https://www.gate2ai.com/images/article-page/gpt/gpt3.5-five-models.png)
GPT-4
GPT-4模型代表了AI语言模型的新时代。它强化了其前身GPT-3和GPT-3.5的优势,同时解决了它们的缺点。GPT-4经过进一步微调,以提高跟随指令的能力,减少捏造的事实,并减少有毒的输出,从而使其更可靠和富有创新性。
OpenAI发布GPT-4标志着ChatGPT演变的里程碑,提升了其理解和生成文本的能力,以及更好的语境理解和问题解决能力。作为最大和最先进的模型,GPT-4为未来的AI发展设定了更高的标准。
![GPT-4和GPT-3.5在一系列最近的美国考试中的成绩分析](https://www.gate2ai.com/images/article-page/gpt/exam-results-of-gpt-4-and-gpt-3.5-on-a-range-of-recent-u.s.-exams.png)
ChatGPT
ChatGPT是一种高级语言模型,能以对话的方式模仿人类的文本生成。以GPT-3模型为基础构建的ChatGPT专门被设计用以生成对用户输入的交互式响应。凭借其处理跟进查询、纠正错误、挑战谬误和拒绝不适当请求的能力,ChatGPT在对话参与中展现了高度的复杂性。
微调
OpenAI的微调技术提供了一种从AI模型中提取最佳性能的方法。
其特征包括:
提高结果的质量
可以在更多的样本上进行训练
使用更短的prompts以节省字符的使用
快速处理请求。
工作原理是在比 prompt可以容纳的更大的数据集上训练像GPT-3这样的预训练模型,这有助于提高模型在各种任务上的性能。
嵌入
在OpenAI的语境中,嵌入是文本串相关性的度量。这样的嵌入广泛用于搜索操作,聚类,推荐,异常检测,多样性测量和分类等多个领域。相关性以向量的形式表示,两个向量之间的距离指示了它们的相似性等级。
Whisper
Whisper是一种出色的自动语音识别系统,它处理从广泛的多语言和多任务训练数据集中收集的文字。Whisper擅长处理不同的口音,技术语言和背景噪声,具有更高的准确性,这对英语语音识别非常有用。它在开发者社区中非常受欢迎。此外,你还可以使用Whisper API。
![Openai Whisper Api](https://www.gate2ai.com/images/article-page/tech/openai-whisper-api.webp)
DALL-E 2/图像生成
DALL-E 2是OpenAI的另一项令人印象深刻的AI系统,能够根据自然语言描述生成真实的图像和艺术作品。无论是创造原始图像,扩展现有图像,进行真实的编辑,还是生成给定图像的不同变体,DALL-E 2都能借助深度学习模型完成所有这些任务。
![PenAI DALL-样式](https://www.gate2ai.com/images/article-page/tech/openai-dall-e-banner.webp)
Codex
OpenAI的 Codex 可以将自然语言转译成代码,以帮助开发人员完成编程任务。它支持多种编程语言,并能理解并执行简单的命令,从而使现有应用程序创建自然语言接口成为可能。Codex 是 Github Copilot 的基础模型,它是 GPT-3 的升级版,并利用混合的自然语言和数十亿行源代码进行训练。
![openai-codex-样式](https://www.gate2ai.com/images/article-page/tech/openai-codex-banner.webp)
OpenAI API
OpenAI API是一个云接口。托管在Microsoft Azure上,一旦OpenAI发布了模型API,你就可以访问OpenAI开发的新AI模型,如 DALL-E、Codex和GPT-3。
与大多数为单一用例设计的AI系统不同,现在的API提供了通用的“输入文本,输出文本”接口,允许用户在几乎任何英语语言任务上尝试使用。
如何使用它?只需申请访问权限以将API集成到你的产品中,然后你就可以开发一个全新的应用——例如,基于OpenAI的API的图像生成器。
![OpenAI API样式](https://www.gate2ai.com/images/article-page/tech/openai-api-banner.webp)
OpenAI模型定价
以下是OpenAI开发的各种模型的定价结构概述:
语言模型
OpenAI提供了具有独特功能和不同价格的多种语言模型。价格是每1000个字符列出的,大约750个单词。
GPT-4
模型 | 输入成本 | 输出成本 |
---|---|---|
8000字符的上下文 | 每1000个字符0.03美元 | 每1000个字符0.06美元 |
2000字符的上下文 | 每1000个字符0.06美元 | 每1000个字符0.12美元 |
GPT-3.5 Turbo
模型 | 输入成本 | 输出成本 |
---|---|---|
4000字符的上下文 | 每1000个字符0.0015美元 | 每1000个字符0.002美元 |
16000字符的上下文 | 每1000个字符0.003美元 | 每1000个字符0.004美元 |
微调模型
模型 | 训练成本 | 使用成本 |
---|---|---|
Ada | 每1000个字符0.0004美元 | 每1000个字符0.0016美元 |
Babbage | 每1000个字符0.0006美元 | 每1000个字符0.0024美元 |
Curie | 每1000个字符0.003美元 | 每1000个字符0.012美元 |
Davinci | 每1000个字符0.03美元 | 每1000个字符0.12美元 |
嵌入模型
模型 | 使用成本 |
---|---|
使用上下文 | 每1000个字符0.0001美元 |
图像模型
OpenAI的图像模型,如DALL·E,可以被直接嵌入到应用程序中,以生成和编辑全新的图片和艺术作品。这类模型提供了三个层次的分辨率选项,以提高灵活性。
分辨率 | 价格 |
---|---|
1024×1024 | 每张图片0.020美元 |
512×512 | 每张图片0.018美元 |
256×256 | 每张图片0.016美元 |
音频模型
模型 | 使用成本 |
---|---|
Whisper | 每分钟0.006美元(四舍五入至最接近的秒) |
OpenAI的杰出客户
OpenAI的开创性技术在各行各业中得到了应用。以下是我们一些尊贵客户如何利用我们的人工智能模型的能力的简要概述
摩根士丹利
摩根士丹利的财富管理部门利用GPT-4的功能整理其庞大的知识库,提高了效率和客户服务水平。
Stripe
Stripe使用GPT-4优化其用户体验并打击欺诈活动,确保所有用户的交易安全流畅。
冰岛政府
在一个独特的人工智能应用中,冰岛政府正在使用GPT-4来保护其语言的丰富遗产,确保其文化和传统延续到数字时代。
Khan学院
Khan 学院正在探索人工智能世界,开展一个有限的试点项目,研究GPT-4在改变在线学习和辅导方面的潜在应用。
Duolingo
Duolingo通过结合GPT-4,增强其语言学习平台的功能,深化对话练习,提高用户的语言技能。