5 分で OpenAI を理解する: ChatGPT、DALL·E 2 など

米国の著名な人工知能研究機関である OpenAI は、汎用人工知能 (AGI) の開発を通じて AI の未来を形作ることに専念しています。 彼らの基本原則は、AGI 開発が「安全かつ有益」であることを保証することです。 AGI にとって、それは「最も経済的に価値のある作業において人間を上回るパフォーマンスを発揮する高度に自律的なシステム」を意味します。

現在、OpenAI はグローバル AI で大きな成功を収めており、GPT-4、DALL-E、OpenAI Five、ChatGPT、OpenAI Codex などの画期的なイノベーションを生み出しています。 さらに、Microsoft は OpenAI の取り組みの可能性を認識し、多額の投資を行っており、OpenAI の研究とイノベーションを推進するために 2019 年に 10 億ドル、2023 年にはさらに 100 億ドルを提供しています。 この組織の安全性への取り組みと、AGI における有害なアプリケーションや権力の過度の集中を避けるための取り組みは、業界内で際立っています。

Webサイト

https://openai.com/

設立

2015 年 12 月 11 日

主要チームメンバー

サム・アルトマン、イーロン・マスク、イリヤ・サツキーバー、グレッグ・ブロックマン、トレバー・ブラックウェル、ヴィッキー・チャン、アンドレイ・カルパシー、ダーク・キングマ、ジェシカ・リビングストン、ジョン・シュルマン、パメラ・ヴァガタ、ヴォイチェフ・ザレンバ

リポジトリ

https://github.com/openai/

OpenAI ホームページ

OpenAI による主な貢献とイノベーション

OpenAI は確かに、いくつかの重要なツールとテクノロジーを AI の世界に貢献してきました。 OpenAI が開発した主な製品とテクノロジーは次のとおりです。

GPTモデル

主要な開発のタイムライン:

2016 年 6 月 16 日 - OpenAI は、特定のドメインで大量のデータを収集し、同様のデータを生成するようにモデルを教えることによってトレーニングされる生成モデルに関する研究を発表しました。

2019 年 9 月 19 日 - OpenAI は、人間の好みやフィードバックを使用して GPT-2 言語モデルを微調整することに関する研究を発表しました。

2022 年 1 月 27 日 - OpenAI は、ChatGPT の兄弟である InstructGPT モデルに関する研究を公開しました。 これらのモデルは、指示に従う能力が向上し、事実の捏造が減少し、有毒物質の排出が減少したことを示しています。

2022 年 11 月 30 日 - OpenAI は、無料研究プレビューの一環として GPT-3.5 を使用した ChatGPT を導入しました。

2023 年 3 月 14 日 - OpenAI は、ChatGPT と Bing で GPT-4 をリリースし、信頼性、創造性、問題解決スキルの向上を約束しました。

GPT-3

GPT-3 (Generative Pretrained Transformer 3) は、機械学習技術を活用して人間のようなテキストを生成する画期的な AI モデルです。 このテクノロジーは、Transformer アーキテクチャを利用した言語予測モデルを使用します。 GPT-3 には 1,750 億の機械学習パラメーターがあり、テキスト内で使用されている以前の単語に基づいて単語の可能性を予測する能力をトレーニングするのに役立ちます。 最終的には、非常に一貫性があり、文脈に関連した文章を生成することができます。

さらに、GPT-3 はヒューマン フィードバック強化学習 (RLHF) を使用して微調整されています。 このアプローチは、より高度な人工知能モデルの作成を可能にし、さまざまな OpenAI モデルの基盤テクノロジーとして広く使用されているため、人工知能のマイルストーンです。

GPT-3.5

2023 年 3 月 1 日にリリースされた GPT-3.5 は、自然言語またはコードの理解と生成に熟達した高度なモデルのセットを備えているため、GPT-3 の拡張バージョンです。 GPT-3.5 には 5 つの異なるモデル バリアントがあり、それぞれが特殊な機能を備えています。 そのうち 4 つはテキスト補完タスク用に特に最適化されており、残りの 1 つはコード補完タスクのパフォーマンスが向上しています。

GPT3.5 5モデル

GPT-4

GPT-4 モデルは、AI 言語モデルの新時代を表します。 これは、以前の GPT-3 および GPT-3.5 の長所を強化すると同時に、その欠点にも対処します。 GPT-4 は、指示に従う能力を向上させ、事実の捏造を減らし、有毒な出力を減らすためにさらに微調整されており、より信頼性と創造性を高めています。

OpenAI による GPT-4 のリリースは、ChatGPT の進化におけるマイルストーンとなり、より優れた文脈理解と問題解決スキルによってテキストを解釈および生成する能力を向上させました。 GPT-4 は、最大かつ最先端のモデルとして、将来の AI 開発の基準をより高く設定しました。

最近の米国の範囲における GPT 4 および GPT 3.5 の試験結果 試験

ChatGPT

ChatGPT は、会話形式で人間のようなテキスト生成を反映する高度な言語モデルです。 GPT-3 モデルに基づいて構築された ChatGPT は、ユーザー入力に対するインタラクティブな応答を生成するように特別に設計されています。 ChatGPT は、フォローアップの質問に対応し、間違いを修正し、誤った意見に異議を唱え、不適切な要求を拒否する機能を備えているため、高度な対話エンゲージメントを実現します。

微調整

OpenAI の微調整技術は、AI モデルから最適なパフォーマンスを引き出す方法を提供します。

その特徴は次のとおりです。

  • 結果の品質の向上、

  • より多くの例でトレーニングできる能力

  • 短いプロンプトを使用してトークンの使用量を節約します。

  • リクエストをより高速に処理します。

これは、プロンプト内に収まりきらない大きなデータセットで GPT-3 のような事前トレーニング済みモデルをトレーニングすることで機能し、さまざまなタスクにわたってモデルのパフォーマンスを向上させるのに役立ちます。

埋め込み

OpenAI のコンテキストにおける埋め込みは、テキスト文字列の関連性の尺度です。 このような埋め込みは、検索操作、クラスタリング、推奨、異常検出、多様性測定、分類などのさまざまな分野で幅広く使用されています。 関連性はベクトルの形式で取得され、2 つのベクトル間の距離が類似性のレベルを示します。

Whisper

Whisper は、広範な多言語およびマルチタスクのトレーニング データセットから収集された単語を処理する、優れた自動音声認識システムです。 Whisper は、さまざまなアクセント、専門用語、背景雑音をより高い精度で処理することに優れており、英語の音声認識に優れています。 開発者コミュニティでは非常に人気があります。 また、Whisper API を使用することもできます。

OpenAI Whisper API

DALL-E 2/画像生成

OpenAI のもう 1 つの優れた AI システムである DALL-E 2 は、自然言語の記述に基づいてリアルな画像とアートワークを生成できます。 オリジナル画像の作成、既存画像の拡張、現実的な編集、特定の画像のさまざまなバリエーションの生成など、DALL-E 2 は深層学習モデルの助けを借りてすべてを処理します。

OpenAI Dall E ホームページ

Codex

OpenAI Codex は自然言語をコードに変換し、開発者のプログラミング タスクを支援します。 複数のプログラミング言語をサポートし、単純なコマンドを理解して実行できるため、既存のアプリケーション用の自然言語インターフェイスの作成が容易になります。 GitHub Copilot の基礎となるモデルである Codex は GPT-3 の進化版であり、トレーニングに自然言語と数十億行のソース コードを組み合わせて利用します。

OpenAI Codex ホームページ

OpenAI API

OpenAI APIはクラウドインターフェースです。 Microsoft Azure でホストされているため、OpenAI がモデル API をリリースすると、DALL-E、Codex、GPT-3 など、OpenAI によって開発された新しい AI モデルにアクセスできます。

単一のユースケース向けに設計されたほとんどの AI システムとは異なり、今日の API は汎用の「テキスト入力、テキスト出力」インターフェイスを提供しており、ユーザーはほぼすべての英語タスクでそれを試すことができます。

それの使い方? API を製品に統合するためのアクセスをリクエストするだけで、まったく新しいアプリケーション (たとえば、OpenAI の API に基づく画像ジェネレーター) を開発できます。

OpenAI API ホームページ

OpenAI モデルの価格

以下は、OpenAI によって開発されたさまざまなモデルの価格体系の概要です。

言語モデル

OpenAI は、独自の機能とさまざまな価格帯を備えたいくつかの言語モデルを提供します。 価格は 1,000 トークン、約 750 ワードごとに記載されています。

GPT-4

モデル

投入コスト

出力コスト

8Kコンテキスト

$0.03 / 1,000 トークン

$0.06 / 1,000 トークン

32K コンテキスト

$0.06 / 1,000 トークン

$0.12 / 1,000 トークン

GPT-3.5 Turbo

モデル

投入コスト

出力コスト

4K コンテキスト

$0.0015 / 1,000 トークン

$0.002/1,000 トークン

16K コンテキスト

$0.003/1,000 トークン

$0.004 / 1,000 トークン

モデルの微調整

モデル

トレーニング費用

利用料金

エイダ

$0.0004 / 1,000 トークン

$0.0016/1,000 トークン

バベジ

$0.0006/1,000 トークン

$0.0024 / 1,000 トークン

キュリー

$0.0030 / 1,000 トークン

$0.0120 / 1,000 トークン

ダ・ヴィンチ

$0.0300 / 1,000 トークン

$0.1200 / 1,000 トークン

モデルの埋め込み

モデル

利用料金

使用状況

$0.0001 / 1,000 トークン

画像モデル

DALL・E のような OpenAI の画像モデルは、アプリケーションに直接組み込んで、新しい画像やアートを生成および編集できます。 これらのモデルは、柔軟性を高めるために 3 段階の解像度を提供します。

解決

価格

1024×1024

$0.020/画像

512×512

$0.018/画像

256×256

$0.016/画像

オーディオモデル

モデル

利用料金

ささやき

$0.006 / 分 (秒単位で四捨五入)

OpenAI の特別な顧客

OpenAI の画期的なテクノロジーは、さまざまな業界や分野にわたって応用されています。 ここでは、当社の一部の尊敬されるお客様が当社の AI モデルの機能をどのように活用しているかを簡単に概要説明します。

モルガン・スタンレー

モルガン・スタンレーの資産管理部門は、GPT-4 の力を利用して広範な知識ベースを整理し、効率と顧客サービスを強化しています。

Stripe

Stripe は GPT-4 を採用してユーザー エクスペリエンスを最適化し、不正行為と闘い、すべてのユーザーに安全でシームレスなトランザクションを保証します。

アイスランド政府

AI のユニークな応用として、アイスランド政府は GPT-4 を使用して言語の豊かな遺産を保存し、その文化と伝統がデジタル時代に確実に引き継がれるようにしています。

カーンアカデミー

カーン アカデミーは、オンライン学習と家庭教師の再構築における GPT-4 の潜在的な応用を探る限定的なパイロット プログラムで AI の世界に挑戦しています。

Duolingo

Duolingo は、GPT-4 を組み込むことで言語学習プラットフォームを強化し、会話の練習を深め、ユーザーの言語スキルを向上させます。

AI の最新技術の進歩を深く掘り下げる

以下に提供する詳細な記事と AI ツールをチェックして、当社の AI テクノロジーのこれらのエキサイティングなアプリケーションについてさらに詳しく読むことをお勧めします。 最新の進歩に関する情報を常に入手し、AI が自分の分野にどのような革命をもたらすかを探ってください。

このページでは にジャンプ