OpenAI, un destacado laboratorio de investigación de inteligencia artificial estadounidense, se dedica a dar forma al futuro de la IA a través del desarrollo de la Inteligencia General Artificial (AGI). Su principio rector es garantizar que el desarrollo de AGI sea "seguro y beneficioso". Para AGI, significa "sistemas altamente autónomos que superan a los humanos en el trabajo económicamente más valioso".
Hoy, OpenAI ha logrado un gran éxito en el campo global de la IA, produciendo innovaciones revolucionarias que incluyen GPT-4, DALL-E, OpenAI Five, ChatGPT y OpenAI Codex. Además, Microsoft reconoce el potencial del trabajo de OpenAI y ha invertido mucho, proporcionando $1 mil millones en 2019 y $10 mil millones adicionales en 2023, para avanzar en la investigación y la innovación en OpenAI. El compromiso de la organización con la seguridad y los esfuerzos para evitar aplicaciones dañinas o una concentración indebida de poder en AGI la distinguen en la industria.
Sitio web | https://openai.com/ |
---|---|
Establecido | December 11, 2015 |
Miembros principales del equipo | Sam Altman, Elon Musk, Ilya Sutskever, Greg Brockman, Trevor Blackwell, Vicki Cheung, Andrej Karpathy, Durk Kingma, Jessica Livingston, John Schulman, Pamela Vagata, and Wojciech Zaremba |
Repositorio | https://github.com/openai/ |

Contribuciones e innovaciones clave de OpenAI
Absolutamente, OpenAI ha contribuido con algunas herramientas y tecnologías significativas al mundo de la IA. Estos son los principales productos y tecnologías desarrollados por OpenAI:
modelo GPT
Cronología de desarrollos clave:
16 de junio de 2016: OpenAI publicó una investigación sobre modelos generativos, que se entrenan recopilando una gran cantidad de datos en un dominio específico y enseñando al modelo a generar datos similares.
19 de septiembre de 2019: OpenAI publicó una investigación sobre cómo ajustar el modelo de lenguaje GPT-2 con las preferencias y los comentarios humanos.
27 de enero de 2022: OpenAI publicó una investigación sobre los modelos InstructGPT, los hermanos de ChatGPT. Estos modelos muestran una mejor capacidad de seguimiento de instrucciones, una reducción de la fabricación de hechos y una disminución de la producción tóxica.
30 de noviembre de 2022: OpenAI presentó ChatGPT usando GPT-3.5 como parte de una vista previa de investigación gratuita.
14 de marzo de 2023: OpenAI lanzó GPT-4 en ChatGPT y Bing, prometiendo una mayor confiabilidad, creatividad y habilidades para resolver problemas.
GPT-3
El GPT-3 (Generative Pretrained Transformer 3) es un modelo de IA innovador que aprovecha las técnicas de aprendizaje automático para generar texto similar al humano. Esta tecnología utiliza un modelo de predicción de idioma que utiliza la arquitectura Transformer. GPT-3 tiene 175 mil millones de parámetros de aprendizaje automático, que ayudan a entrenar su capacidad para predecir la probabilidad de una palabra en función de las palabras anteriores utilizadas en el texto. En última instancia, puede generar oraciones impresionantemente coherentes y relevantes para el contexto.
Además, GPT-3 se ajusta utilizando el aprendizaje reforzado por retroalimentación humana (RLHF). Este enfoque es un hito en la inteligencia artificial, ya que permite la creación de modelos de inteligencia artificial más avanzados y se usa ampliamente como tecnología subyacente de varios modelos de OpenAI.
GPT-3.5
Lanzado el 1 de marzo de 2023, GPT-3.5 es una versión mejorada de GPT-3 porque tiene un conjunto de modelos avanzados que son competentes para comprender y generar lenguaje natural o código. GPT-3.5 tiene cinco variantes de modelo diferentes, cada una con capacidades especializadas. Cuatro de ellos están optimizados específicamente para tareas de finalización de texto y el restante tiene un mejor rendimiento en tareas de finalización de código.

GPT-4
El modelo GPT-4 representa una nueva era en los modelos de lenguaje de IA. Mejora las fortalezas de sus predecesores, GPT-3 y GPT-3.5, al tiempo que aborda sus deficiencias. GPT-4 se ha perfeccionado aún más para mejorar la capacidad de seguimiento de instrucciones, reducir la fabricación de hechos y disminuir la producción tóxica, haciéndolo más confiable y creativo.
El lanzamiento de OpenAI de GPT-4 marcó un hito en la evolución de ChatGPT, elevando sus habilidades para interpretar y generar texto con una mejor comprensión contextual y habilidades para resolver problemas. Como el modelo más grande y avanzado, GPT-4 ha puesto el listón más alto para futuros desarrollos de IA.

ChatGPT
ChatGPT es un modelo de lenguaje avanzado que refleja la generación de texto similar a la humana de una manera conversacional. Basado en el modelo GPT-3, ChatGPT está diseñado específicamente para generar respuestas interactivas a las entradas de los usuarios. Con su capacidad para abordar consultas de seguimiento, rectificar errores, desafiar falacias y rechazar solicitudes inadecuadas, ChatGPT demuestra un alto grado de sofisticación en el diálogo.
Sintonia FINA
La técnica de ajuste fino de OpenAI proporciona una forma de extraer un rendimiento óptimo de los modelos de IA.
Sus características incluyen:
Calidad de resultado mejorada,
La capacidad de entrenar sobre un mayor número de ejemplos,
Use indicaciones más cortas para ahorrar uso de tokens,
y procesar solicitudes a una velocidad más rápida.
Funciona entrenando un modelo previamente entrenado como GPT-3 en un conjunto de datos más grande que el que se puede acomodar dentro de un aviso, lo que ayuda a mejorar el rendimiento del modelo en varias tareas.
Incrustaciones
Las incrustaciones en el contexto de OpenAI son medidas de la relación de las cadenas de texto. Tales incrustaciones encuentran un amplio uso en diversas áreas como operaciones de búsqueda, agrupación, recomendaciones, detección de anomalías, medición de diversidad y clasificación. La relación se captura en forma de vectores, donde la distancia entre dos vectores indica su nivel de similitud.
Whisper
Whisper es un notable sistema automático de reconocimiento de voz que procesa palabras recopiladas de un extenso conjunto de datos de entrenamiento multilingüe y multitarea. Whisper sobresale en el manejo de diferentes acentos, lenguaje técnico y ruido de fondo con mayor precisión, lo cual es excelente para el reconocimiento de voz en inglés. Es muy popular en la comunidad de desarrolladores. Además, puede usar la API Whisper.

DALL-E 2/Generación de imágenes
DALL-E 2, otro impresionante sistema de inteligencia artificial de OpenAI, puede generar imágenes y obras de arte realistas basadas en descripciones en lenguaje natural. Ya sea que se trate de crear imágenes originales, expandir las existentes, realizar ediciones realistas o generar diferentes variaciones de una imagen dada, DALL-E 2 lo maneja todo con la ayuda de modelos de aprendizaje profundo.

Codex
OpenAI Codex traduce el lenguaje natural en código, ayudando a los desarrolladores en sus tareas de programación. Admite múltiples lenguajes de programación y comprende y ejecuta comandos simples, lo que facilita la creación de interfaces de lenguaje natural para aplicaciones existentes. Codex, el modelo subyacente de GitHub Copilot, es una evolución de GPT-3 y utiliza una combinación de lenguaje natural y miles de millones de líneas de código fuente para su entrenamiento.

OpenAI API
OpenAI API es una interfaz en la nube. Alojado en Microsoft Azure, puede acceder a nuevos modelos de IA desarrollados por OpenAI, como DALL-E, Codex y GPT-3, una vez que OpenAI publique la API del modelo.
A diferencia de la mayoría de los sistemas de IA diseñados para un solo caso de uso, las API actuales brindan una interfaz genérica de "entrada de texto, salida de texto", lo que permite a los usuarios probarla en casi cualquier tarea en inglés.
¿Cómo usarlo? Simplemente solicite acceso para integrar la API en su producto y luego podrá desarrollar una aplicación completamente nueva, por ejemplo, un generador de imágenes basado en la API de OpenAI.

Precios del modelo OpenAI
A continuación se muestra un resumen de la estructura de precios para varios modelos desarrollados por OpenAI:
Modelos de lenguaje
OpenAI ofrece varios modelos de lenguaje con capacidades únicas y diferentes puntos de precio. Los precios se enumeran por 1.000 tokens, aproximadamente 750 palabras.
GPT-4
Modelo | Costo de entrada | Costo de salida |
---|---|---|
contexto 8K | $0,03 / 1K tokens | $0,06 / 1K tokens |
contexto 32K | $0,06 / 1K tokens | $0,12 / 1K tokens |
GPT-3.5 Turbo
Modelo | Costo de entrada | Costo de salida |
---|---|---|
contexto 4K | $0,0015 / 1K tokens | $0,002/ 1K tokens |
contexto 16K | $0,003/ 1K tokens | $0,004 / 1K tokens |
Modelos de ajuste fino
Modelo | Costo de entrenamiento | Costo de uso |
---|---|---|
Ada | $0,0004 / 1K tokens | $0,0016/ 1K tokens |
Babbage | $0,0006/ 1K tokens | $0,0024 / 1K tokens |
Curie | $0,0030 / 1K tokens | $0,0120 / 1K tokens |
Davinci | $0,0300 / 1K tokens | $0,1200 / 1K tokens |
Embedding Models
Modelo | Costo de uso |
---|---|
Contexto de uso | $0,0001 / 1K tokens |
Modelos de imagen
Los modelos de imagen de OpenAI, como DALL·E, se pueden integrar directamente en las aplicaciones para generar y editar imágenes y arte novedosos. Estos modelos ofrecen tres niveles de resolución para mayor flexibilidad.
Resolución | Precio |
---|---|
1024×1024 | $0,020 / imagen |
512×512 | $0,018 / imagen |
256×256 | $0,016 / imagen |
Modelos de audio
Modelo | Costo de uso |
---|---|
Whisper | $0,006 / minuto (redondeado al segundo más cercano) |
Clientes distinguidos de OpenAI
La tecnología innovadora de OpenAI ha encontrado aplicación en varias industrias y sectores. Aquí hay una breve descripción de cómo algunos de nuestros estimados clientes han aprovechado las capacidades de nuestros modelos de IA:
Morgan Stanley
El sector de gestión patrimonial de Morgan Stanley aprovecha el poder de GPT-4 para organizar su amplia base de conocimientos, mejorando la eficiencia y el servicio al cliente.
Stripe
Stripe emplea GPT-4 para optimizar su experiencia de usuario y combatir actividades fraudulentas, asegurando transacciones seguras y sin problemas para todos sus usuarios.
Gobierno de Islandia
En una aplicación única de IA, el Gobierno de Islandia está utilizando GPT-4 para preservar la rica herencia de su idioma, asegurando que su cultura y tradiciones se trasladen a la era digital.
Khan Academy
Khan Academy se está aventurando en el mundo de la IA con un programa piloto limitado que explora las posibles aplicaciones de GPT-4 para remodelar el aprendizaje y la tutoría en línea.
Duolingo
Duolingo mejora su plataforma de aprendizaje de idiomas al incorporar GPT-4, profundizar la práctica de conversación y mejorar las habilidades lingüísticas de los usuarios.