Descubra o OpenAI em 5 minutos: ChatGPT, DALL·E 2 e mais

O OpenAI, um importante laboratório de pesquisa em inteligência artificial americano, dedica-se a moldar o futuro da IA por meio do desenvolvimento da Inteligência Artificial Geral (AGI). Seu princípio orientador é garantir que o desenvolvimento da AGI seja "seguro e benéfico". Para AGI, significa "sistemas altamente autônomos que superam os humanos no trabalho economicamente mais valioso".

Hoje, a OpenAI alcançou grande sucesso no campo global de IA, produzindo inovações revolucionárias, incluindo GPT-4, DALL-E, OpenAI Five, ChatGPT e OpenAI Codex. Além disso, a Microsoft reconhece o potencial do trabalho da OpenAI e investiu pesadamente, fornecendo US$ 1 bilhão em 2019 e mais US$ 10 bilhões em 2023, para promover a pesquisa e a inovação na OpenAI. O compromisso da organização com a segurança e os esforços para evitar aplicações prejudiciais ou concentração indevida de poder na AGI a diferenciam no setor.

Website	https://openai.com/
Fundado	11 de dezembro de 2015
Principais membros da equipe	Sam Altman, Elon Musk, Ilya Sutskever, Greg Brockman, Trevor Blackwell, Vicki Cheung, Andrej Karpathy, Durk Kingma, Jessica Livingston, John Schulman, Pamela Vagata, and Wojciech Zaremba
Repositório	https://github.com/openai/

Principais contribuições e inovações da OpenAI

Com certeza, a OpenAI realmente contribuiu com algumas ferramentas e tecnologias significativas para o mundo da IA. Aqui estão os principais produtos e tecnologias desenvolvidos pela OpenAI:

Modelo GPT

Timeline of Key Developments:

Linha do tempo dos principais desenvolvimentos:

16 de junho de 2016 - A OpenAI publicou pesquisas sobre modelos generativos, que são treinados coletando uma grande quantidade de dados em um domínio específico e ensinando o modelo a gerar dados semelhantes.

19 de setembro de 2019 - A OpenAI publicou uma pesquisa sobre como ajustar o modelo de linguagem GPT-2 com preferências e feedback humanos.

27 de janeiro de 2022 - A OpenAI publicou uma pesquisa sobre os modelos InstructGPT, irmãos do ChatGPT. Esses modelos mostram capacidade aprimorada de seguir instruções, fabricação reduzida de fatos e diminuição da produção tóxica.

30 de novembro de 2022 - A OpenAI apresentou o ChatGPT usando o GPT-3.5 como parte de uma prévia de pesquisa gratuita.

14 de março de 2023 - A OpenAI lançou o GPT-4 no ChatGPT e no Bing, prometendo maior confiabilidade, criatividade e habilidades de resolução de problemas.

GPT-3

O GPT-3 (Transformador pré-treinado generativo 3) é um modelo de IA inovador que utiliza técnicas de aprendizado de máquina para gerar texto semelhante ao humano. Essa tecnologia usa um modelo de predição de linguagem que utiliza a arquitetura Transformer. O GPT-3 possui 175 bilhões de parâmetros de aprendizado de máquina, que ajudam a treinar sua capacidade de prever a probabilidade de uma palavra com base em palavras anteriores usadas no texto. Em última análise, pode gerar frases impressionantemente coerentes e relevantes para o contexto.

Além disso, o GPT-3 é ajustado usando o Human Feedback Reinforcement Learning (RLHF). Essa abordagem é um marco na inteligência artificial, pois permite a criação de modelos de inteligência artificial mais avançados e é amplamente utilizada como tecnologia subjacente de vários modelos OpenAI.

GPT-3.5

Lançado em 1º de março de 2023, o GPT-3.5 é uma versão aprimorada do GPT-3 porque possui um conjunto de modelos avançados que são proficientes em entender e gerar código ou linguagem natural. O GPT-3.5 possui cinco variantes de modelo diferentes, cada uma com recursos especializados. Quatro deles são otimizados especificamente para tarefas de conclusão de texto e o restante tem melhor desempenho em tarefas de conclusão de código.

GPT-4

O modelo GPT-4 representa uma nova era nos modelos de linguagem AI. Ele aprimora os pontos fortes de seus predecessores, GPT-3 e GPT-3.5, ao mesmo tempo em que aborda suas deficiências. O GPT-4 foi ainda mais ajustado para melhorar a capacidade de seguir instruções, reduzir a fabricação de fatos e diminuir a produção tóxica, tornando-o mais confiável e criativo.

O lançamento do GPT-4 pela OpenAI marcou um marco na evolução do ChatGPT, elevando suas habilidades para interpretar e gerar texto com melhor compreensão contextual e habilidades de resolução de problemas. Como o maior e mais avançado modelo, o GPT-4 elevou a fasquia para futuros desenvolvimentos de IA.

Resultados do exame de GPT 4 e GPT 3.5 em uma variedade de exames recentes dos EUA

ChatGPT

O ChatGPT é um modelo de linguagem avançado que espelha a geração de texto humano de maneira conversacional. Construído sobre o modelo GPT-3, o ChatGPT foi projetado especificamente para gerar respostas interativas às entradas do usuário. Com sua capacidade de abordar consultas de acompanhamento, corrigir erros, desafiar falácias e recusar solicitações inadequadas, o ChatGPT demonstra um alto grau de sofisticação no diálogo.

Afinação

A técnica de ajuste fino do OpenAI fornece uma maneira de extrair o desempenho ideal dos modelos de IA.

Suas características incluem:
Melhor qualidade de resultado,
A capacidade de treinamento em um número maior de exemplos,
Use prompts mais curtos para economizar usos de token,
e processar solicitações em uma velocidade mais rápida.

Ele funciona treinando um modelo pré-treinado como GPT-3 em um conjunto de dados maior do que pode ser acomodado em um prompt, o que ajuda a melhorar o desempenho do modelo em várias tarefas.

Incorporações

Embeddings no contexto do OpenAI são medidas de parentesco de strings de texto. Tais incorporações encontram uso extensivo em diversas áreas, como operações de busca, agrupamento, recomendações, detecção de anomalias, medição de diversidade e classificação. A relação é capturada na forma de vetores, com a distância entre dois vetores indicando seu nível de similaridade.

Sussurrar

O Whisper é um notável sistema automático de reconhecimento de fala que processa palavras coletadas de um extenso conjunto de dados de treinamento multilíngue e multitarefa. O Whisper se destaca ao lidar com diferentes sotaques, linguagem técnica e ruído de fundo com maior precisão, o que é excelente para o reconhecimento de fala em inglês. É super popular na comunidade de desenvolvedores. Além disso, você pode usar a API Whisper.

DALL-E 2/geração de imagem

O DALL-E 2, outro impressionante sistema de IA da OpenAI, pode gerar imagens e obras de arte realistas com base em descrições de linguagem natural. Quer se trate de criar imagens originais, expandir as existentes, fazer edições realistas ou gerar diferentes variações de uma determinada imagem, o DALL-E 2 lida com tudo com a ajuda de modelos de aprendizado profundo.

Códice

O OpenAI Codex traduz a linguagem natural em código, auxiliando os desenvolvedores em suas tarefas de programação. Ele oferece suporte a várias linguagens de programação e compreende e executa comandos simples, facilitando assim a criação de interfaces de linguagem natural para aplicativos existentes. O Codex, o modelo básico do GitHub Copilot, é uma evolução do GPT-3 e utiliza uma mistura de linguagem natural e bilhões de linhas de código-fonte para seu treinamento.

API OpenAI

API OpenAI é uma interface de nuvem. Hospedado no Microsoft Azure, você pode acessar novos modelos de IA desenvolvidos pela OpenAI, como DALL-E, Codex e GPT-3, assim que a OpenAI liberar a API do modelo.

Ao contrário da maioria dos sistemas de IA projetados para um único caso de uso, as APIs de hoje fornecem uma interface genérica de "entrada de texto, saída de texto", permitindo que os usuários experimentem em praticamente qualquer tarefa em inglês.

Como usá-lo? Basta solicitar acesso para integrar a API ao seu produto e, então, você poderá desenvolver um aplicativo totalmente novo, por exemplo, um gerador de imagens baseado na API da OpenAI.

Preço do modelo OpenAI

Abaixo está um esboço da estrutura de preços para vários modelos desenvolvidos pela OpenAI:

modelos de linguagem

A OpenAI oferece vários modelos de linguagem com recursos exclusivos e preços variados. Os preços são listados por 1.000 tokens, aproximadamente 750 palavras.

GPT-4

Modelo	Custo de entrada	Custo de saída
contexto 8K	$ 0,03 / 1K tokens	US$ 0,06 / 1 mil fichas
contexto 32K	US$ 0,06 / 1 mil fichas	$ 0,12 / 1K tokens

GPT-3.5 Turbo

Modelo	Custo de entrada	Custo de saída
contexto 4K	$ 0,0015 / 1K tokens	$ 0,002/1K tokens
contexto 16K	$ 0,003/1K tokens	$ 0,004 / 1K tokens

Modelos de ajuste fino

Modelo	Custo de Treinamento	Custo de uso
Ada	$ 0,0004 / 1K tokens	$ 0,0016/1K tokens
Babbage	$ 0,0006/1K tokens	$ 0,0024 / 1K tokens
curie	$ 0,0030 / 1K tokens	$ 0,0120 / 1K tokens
Da Vinci	$ 0,0300 / 1K tokens	$ 0,1200 / 1K tokens

Incorporando modelos

Modelo	Custo de uso
Contexto de uso	$ 0,0001 / 1K tokens

Modelos de imagem

Os modelos de imagem da OpenAI, como DALL·E, podem ser construídos diretamente em aplicativos para gerar e editar novas imagens e arte. Esses modelos oferecem três níveis de resolução para flexibilidade.

Resolução	Preço
1024×1024	US$ 0,020 / imagem
512×512	US$ 0,018 / imagem
256×256	US$ 0,016 / imagem

Audio Models

Model	Custo de uso
Whisper	Sussurrar US$ 0,006 / minuto (arredondado para o segundo mais próximo)

Model

Custo de uso

Whisper

Sussurrar

US$ 0,006 / minuto (arredondado para o segundo mais próximo)

Clientes Ilustres da OpenAI

A tecnologia inovadora da OpenAI encontrou aplicação em várias indústrias e setores. Aqui está uma breve visão geral de como alguns de nossos estimados clientes aproveitaram os recursos de nossos modelos de IA:

Morgan Stanley

O setor de gestão de patrimônio do Morgan Stanley aproveita o poder do GPT-4 para organizar sua extensa base de conhecimento, aumentando a eficiência e o atendimento ao cliente.

Stripe

A Stripe emprega o GPT-4 para otimizar a experiência do usuário e combater atividades fraudulentas, garantindo transações seguras e contínuas para todos os usuários.

Governo da Islândia

Em uma aplicação única de IA, o governo da Islândia está usando o GPT-4 para preservar a rica herança de seu idioma, garantindo que sua cultura e tradições sejam transportadas para a era digital.

Khan Academy

A Khan Academy está se aventurando no mundo da IA com um programa piloto limitado que explora as possíveis aplicações do GPT-4 na reformulação do aprendizado e tutoria online.

Duolingo

O Duolingo aprimora sua plataforma de aprendizado de idiomas incorporando GPT-4, aprofundando a prática de conversação e melhorando as habilidades linguísticas dos usuários.

Incentivamos você a ler mais sobre essas aplicações empolgantes de nossa tecnologia de IA, verificando os artigos detalhados e as ferramentas de IA fornecidas abaixo. Mantenha-se informado sobre os avanços mais recentes e explore como a IA pode revolucionar seu próprio campo.