ChatGPT: Cómo usar, para qué sirve y cómo funciona

  • Por Andreina Mendes
  • 30/01/2023 às 10:44 atualizado em (30/01/2023 às 10:44)
  • 12min de leitura

ChatGPT es una tecnología revolucionaria porque está entrenada para aprender lo que los humanos quieren decir cuando hacen una pregunta.

La herramienta es una Inteligencia Artificial (IA) que puede ser muy útil para tu día a día. ChatGPT puede responder, con gran precisión, a preguntas complejas a través de una conversación. Fue presentada por OpenAI, una empresa de inteligencia artificial en la que invirtió Elon Musk.

Muchos usuarios están impresionados por su capacidad para ofrecer respuestas de calidad humana, lo que da la sensación de que con el tiempo podría tener el poder de cambiar la forma en que los humanos interactúan con las computadoras y cambiar la forma en que se realizan las búsquedas de información.

¿Qué es ChatGPT?

ChatGPT es un estupendo chatbot (una inteligencia artificial para conversaciones) desarrollado por OpenAI y basado en el GPT-3.5 (un modelo de lenguaje autorregresivo que utiliza el aprendizaje profundo para producir texto similar al humano). Tiene una notable capacidad para interactuar en forma de diálogo conversacional y ofrecer respuestas que pueden parecer sorprendentemente humanas.

ChatGPT tiene una capa adicional de entrenamiento que utiliza el feedback humano para aprender la capacidad de seguir instrucciones y generar respuestas satisfactorias para los humanos: el Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF).

¿Quién creó ChatGPT?

ChatGPT fue creado por la empresa de inteligencia artificial OpenAI, con sede en San Francisco. OpenAI es famosa por su conocido DALL-E, un modelo de aprendizaje profundo que genera imágenes a partir de instrucciones de texto llamadas prompts.

Microsoft es socio e inversor de Open AI por valor de 1.000 millones de dólares. Desarrollaron conjuntamente la plataforma Azure AI.

Grandes Modelos de Lenguaje

ChatGPT es un Gran Modelo de Lenguaje (Large Language Model o simplemente LLM). Los LLM se entrenan con grandes cantidades de datos para predecir con exactitud qué palabra viene a continuación en una frase.

Se ha comprobado que el aumento de la cantidad de datos incrementa la capacidad de los modelos de lenguaje. Según la Universidad de Stanford (en traducción libre):

“El GPT-3 tiene 175 mil millones de parámetros y se entrenó con 570 gigabytes de texto. A modo de comparación, su predecesor, el GPT-2, era 100 veces más pequeño, con 1.500 millones de parámetros.

Este aumento de escala cambia drásticamente el comportamiento del modelo. El GPT-3 es capaz de realizar tareas para las que no estaba explícitamente entrenado, como traducir frases del inglés al francés, con pocos o ningún ejemplo de entrenamiento.

Este comportamiento estuvo ausente principalmente en el GPT-2. Además, en algunas tareas, el GPT-3 supera a los modelos que han sido entrenados explícitamente para resolver estas tareas, aunque en otras se queda corto.”

Los LLM predicen la siguiente palabra de una serie de palabras de una frase y las frases siguientes: como el autocompletado, pero a una escala absolutamente mayor. Esta capacidad les permite escribir párrafos y páginas enteras de contenido, pero están limitados porque no siempre entienden exactamente lo que quiere un humano.

Y ahí es donde ChatGPT entra en juego, con el ya mencionado entrenamiento de Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF).

¿Cómo se entrenó el ChatGPT?

El GPT-3.5 se entrenó con grandes cantidades de datos sobre código e información de internet, incluidas fuentes como los debates de Reddit, para ayudarlo a aprender a dialogar y conseguir un estilo humano de respuesta.

ChatGPT también se entrenó utilizando el feedback de los humanos (una técnica llamada Aprendizaje por Refuerzo con Retroalimentación Humana) para que la IA aprendiera lo que los humanos esperaban cuando hacían una pregunta. Entrenar el LLM de este modo es revolucionario porque va más allá del simple entrenamiento para predecir la siguiente palabra.

Un trabajo de investigación de marzo de 2022 titulado Training Language Models to Follow Instructions with Human Feedback explica por qué se trata de un enfoque innovador (en traducción libre):

“Este trabajo está motivado por nuestro objetivo de aumentar el impacto positivo de los grandes modelos de lenguaje, entrenándolos para que hagan lo que un determinado conjunto de humanos quiere que hagan.

Por defecto, los modelos de lenguaje optimizan el objetivo de predecir la siguiente palabra, lo que no es más que un inicio de lo que queremos que hagan estos modelos.

Nuestros resultados indican que nuestras técnicas prometen hacer que los modelos de lenguaje sean más útiles, veraces e inofensivos.

Aumentar el tamaño de los modelos de lenguaje no significa que sean mejores a la hora de seguir la intención del usuario.

Por ejemplo, los grandes modelos de lenguaje pueden generar resultados falsos, tóxicos o simplemente no útiles para el usuario.

En otras palabras, estos modelos no están alineados con sus usuarios”.

Principales diferencias con otros chatbots

Lo que diferencia a ChatGPT de un simple chatbot es que ha sido entrenado específicamente para comprender la intención humana en una pregunta y proporcionar respuestas útiles, veraces e inofensivas.

Gracias a esta formación, ChatGPT puede rebatir ciertas preguntas y descartar partes de la pregunta que no tengan sentido.

Otro trabajo de investigación relacionado muestra cómo entrenaron a la IA para predecir lo que prefieren los humanos.

Los investigadores observaron que las métricas utilizadas para evaluar los resultados de la inteligencia artificial de procesamiento del lenguaje natural daban lugar a máquinas que obtenían buenos resultados estadísticos, pero que no se ajustaban a lo que esperaban los humanos.

Explicación de los investigadores

Los investigadores explicaron el problema de la siguiente manera (en traducción libre):

“Muchas aplicaciones de aprendizaje automático optimizan métricas sencillas que no son más que aproximaciones de lo que pretende el diseñador. Esto puede acarrear problemas, como las recomendaciones que promueven el click-bait en YouTube”.

Así que la solución que diseñaron fue crear una inteligencia artificial que pudiera generar respuestas optimizadas para lo que preferían los humanos. Para ello, la entrenaron utilizando conjuntos de datos de diversas respuestas humanas, de modo que la máquina mejoró en la predicción de lo que los humanos consideraban respuestas satisfactorias.

¿Cuáles son las limitaciones de ChatGPT?

Las limitaciones de respuestas tóxicas

ChatGPT está específicamente programado para no proporcionar respuestas tóxicas o dañinas. Por lo tanto, evitará responder a este tipo de preguntas.

La calidad de las respuestas depende de la calidad de las preguntas

Una limitación importante de ChatGPT es que la calidad del resultado depende de la calidad de la pregunta. En otras palabras, una buena instrucción de texto (prompts) genera una mejor respuesta.

Las respuestas no siempre son correctas

Otra limitación es que los programadores han entrenado a ChatGPT para que proporcione respuestas que parezcan correctas a los humanos, por lo que las respuestas pueden tener errores y hacerles creer a los humanos que la información es correcta.

Muchos usuarios han descubierto que ChatGPT puede proporcionar respuestas parcialmente incorrectas, incluso algunas completamente incorrectas. Por ejemplo, un usuario respondió que los elefantes son los mamíferos que ponen los huevos más grandes. Sin embargo, es posible que esto se deba a la incapacidad de la inteligecia artificial para diferenciar escenarios hipotéticos de escenarios reales.

OpenAI explica las limitaciones de ChatGPT

El anuncio de OpenAI ofrecía esta advertencia (en traducción libre):

“ChatGPT a veces escribe respuestas que parecen plausibles, pero incorrectas o sin sentido.

Solucionar este problema es un reto porque:

(1) durante el entrenamiento de aprendizaje por refuerzo, actualmente no hay ninguna fuente de verdad;

(2) entrenar al modelo para que sea más cauto hace que rechace preguntas que puede responder correctamente; y

(3) el entrenamiento supervisado engaña al modelo porque la respuesta ideal depende de lo que sabe el modelo, no de lo que sabe el humano”.

¿Es gratuito ChatGTP?

Actualmente, el uso de ChatGPT es gratuito, sin embargo ya hay rumores de que la versión de pago podría salir pronto y costará 42 dólares al mes.

En la actualidad, el chatbot está abierto para que los usuarios experimenten y den su opinión sobre las respuestas, de modo que la IA pueda responder mejor a las preguntas y aprender de sus errores.

El anuncio oficial afirma que OpenAI está deseando recibir comentarios sobre los errores (en traducción libre):

“Aunque nos hemos esforzado para que el modelo rechace peticiones inapropiadas, a veces responde a instrucciones perjudiciales o muestra un comportamiento sesgado.

Estamos utilizando la API de moderación para advertir o bloquear determinados tipos de contenidos inseguros, pero es de esperar que por ahora haya algunos falsos negativos y positivos.

Estamos deseando recoger las opiniones de los usuarios para que nos ayuden en nuestro trabajo continuo de mejorar este sistema.”

¿Cómo utilizar ChatGPT?

1. Ingresa al sitio de ChatGPT

chatgpt-login

Contudo, é possível que o serviço esteja fora do ar por conta da quantidade de usuários, mas não desanime! Normalmente, em poucos minutos, o serviço volta à ativa.

Sin embargo, es posible que el servicio esté caído debido al número de usuarios, pero no te desanimes, normalmente, en unos minutos, el servicio vuelve a estar en línea.

2. Regístrate en ChatGPT

signup-chatgpt

Actualmente, el servicio es gratuito, pero es necesario iniciar sesión con un nombre de usuario y una contraseña. Si lo prefieres, puedes sincronizar el chat con tu cuenta de Google o Microsoft.

3. Empieza a chatear

Escribe en el campo de chat (marcado en rojo) tu comando o pregunta (puede ser en español).

ChatGPT Español

4. Espera la respuesta de ChatGPT

En el menú de la izquierda, puedes crear un nuevo chat (“new chat”) o seleccionar un chat anterior. De este modo, no mezclas los temas.

ChatGPT Español Pregunta

¿Los Modelos de Lenguaje sustituirán a las Búsquedas en Google?

La propia Google ya ha creado un chatbot de IA que se llama LaMDA. El rendimiento del chatbot de Google fue tan parecido al de una conversación humana que un ingeniero de Google afirmó que LaMDA era sensible.

Dado que estos magníficos modelos de lenguaje pueden responder a tantas preguntas, ¿es improbable que una empresa como OpenAI, Google o Microsoft sustituya algún día la búsqueda tradicional por un chatbot de IA?

Algunos twitteros ya están declarando que ChatGPT será el próximo Google.

La idea de que un chatbot de preguntas y respuestas pueda sustituir algún día a Google asusta a quienes se ganan la vida como profesionales del marketing de búsquedas. Esto ha generado un debate en las comunidades de marketing de búsqueda en línea, como el popular SEOSignals Lab de Facebook, donde alguien preguntó si las búsquedas podrían pasar de los motores de búsqueda a los chatbots.

Después de haber probado ChatGPT, estamos de acuerdo en que el miedo a que la búsqueda sea sustituida por un chatbot no es infundado.

La tecnología aún tiene sus limitaciones, pero ya podemos vislumbrar un futuro híbrido en el que los motores de búsqueda se alíen con los chatbots para obtener información.

Pero la actual implementación de este chatbot parece ser una herramienta que en algún momento requerirá la compra de créditos para su uso.

¿Cómo puedo utilizar ChatGPT?

ChatGPT puede escribir códigos, poemas, canciones e incluso relatos cortos al estilo de un autor concreto.

La experiencia de seguir instrucciones hace que ChatGPT pase de ser una fuente de información a una herramienta que puedes solicitar para realizar una tarea.

Esto lo hace útil para escribir artículos sobre prácticamente cualquier tema. ChatGPT puede funcionar como herramienta para generar esbozos de artículos o incluso novelas enteras.

Dará respuesta a prácticamente cualquier tarea a la que pueda responder en texto escrito.

¿Qué dice sobre sí mismo ChatGPT?

Para participar un poco en la diversión, le pedí a ChatGPT que escribiera un artículo sobre…ChatGPT. Esta fue la respuesta:

“ChatGPT es un modelo de lenguaje basado en el modelo transformer desarrollado por OpenAI. Es un modelo de lenguaje de gran escala entrenado en un gran conjunto de datos de texto, lo que le permite generar texto coherente y natural en diferentes idiomas y contextos.

Funciona mediante el uso de una red neuronal que se entrena para predecir la próxima palabra en una secuencia de texto dada. A medida que se le proporciona más texto, el modelo va “entendiendo” el contexto y puede generar respuestas o continuaciones más precisas y coherentes. El modelo también puede ser utilizado para realizar tareas como la traducción automática, la generación de respuestas automáticas y la generación de contenido”

Conclusión

Como ya se ha mencionado, los desarrolladores crearon ChatGPT como una herramienta que, eventualmente, el público tendrá que pagar en algún momento. Más de un millón de usuarios se han registrado para utilizarlo en los primeros cinco días desde que se abrió al público.

Le he pedido a ChatGPT que se despida y esto es lo que me ha dicho:

Despedida