Tutoriales

Cómo subir una imagen a ChatGPT con GPT-4

Te explicamos este complejo asunto. ¿Es posible subir una imagen a ChatGPT? Descúbrelo en nuestra guía completa sobre esta función.

Vamos a explicarte todo lo que necesitas saber sobre cómo subir una imagen de ChatGPT. Esta es una de las novedades de GPT-4 que OpenAI anunció durante su lanzamiento y qué más ha sorprendido. Primero, vamos a analizar los ejemplos prácticos que la propia compañía ha puesto sobre esta tecnología y, posteriormente, te explicaremos si tú también puedes utilizarla y cómo.

¿Qué se puede hacer al subir una imagen a ChatGPT con GPT-4?

Todos los ejemplos de los que te vamos a hablar aquí no los hemos llevado a la práctica nosotros. Más bien, forman parte de la documentación oficial de GPT-4 que ha publicado la empresa desarrolladora, OpenAI. Con ellos es más fácil darse cuenta del potencial que tiene subir una imagen a ChatGPT o en cualquier otra herramienta que funcione con el motor GPT-4.

Un hombre planchando en un taxi

GPT-4 tiene la capacidad de detectar anomalías en una fotografía. Es decir, cosas extrañas que, por muy posibles que sean, no suelen verse habitualmente. Es el caso del hombre que plancha ropa atado a la parte trasera del coche. La pregunta que se le formula a GPT-4 es “¿Qué tiene de inusual esta imagen?”.

La respuesta de la IA es contundente: “Lo inusual de esta imagen es que un hombre está planchando ropa en una tabla de planchar atada al techo de un taxi en movimiento.”

El conector VGA para iPhone

Otro ejemplo muy llamativo sobre la capacidad de reconocer imágenes de ChatGPT con GPT-4 es lo que han denominado el cargador VGA. Un usuario de Reddit ha publicado unas imágenes de un cable lightning modificado de tal manera que parezca que el teléfono está conectado mediante un cabezal VGA. Tras subir la imagen, se le ha preguntado a GPT-4: “¿Qué tiene de gracioso esta imagen? Descríbelo panel por panel.”

La respuesta no solo describe lo que aparece en las imágenes, sino que sabe encontrar cuál es el motivo por el cual este conjunto de fotografías es gracioso. GPT-4 devuelve esta respuesta:

La imagen muestra un paquete para un adaptador «Lightning Cable» con tres paneles.

Panel 1: Un teléfono inteligente con un conector VGA (un conector grande, azul de 15 pines que generalmente se usa para monitores de computadora) conectado a su puerto de carga.

Panel 2: El paquete para el adaptador «Lightning Cable» con una imagen de un conector VGA en él.

Panel 3: Un primer plano del conector VGA con un pequeño conector Lightning (utilizado para cargar iPhone y otros dispositivos Apple) en el extremo.

El humor en esta imagen proviene de lo absurdo de conectar un conector VGA grande y obsoleto en un puerto de carga de teléfono inteligente pequeño y moderno.

Resumen de documentos

En ningún momento, OpenAI ha mencionado que las herramientas desarrolladas con GPT-4, como ChatGPT, vayan a ser capaz de recibir a modo de entrada un documento PDF o DOCX. No obstante, como sí que admite imágenes, es muy fácil enviarle varios folios con texto y gráficos en un formato correspondiente.

En el siguiente ejemplo se ve cómo a GPT-4 se le pide lo siguiente: A continuación, se muestra parte del documento InstuctGPT. ¿Podría leerlo y resumirlo?

La respuesta de GPT-4 es, en parte, la siguiente:

El documento InstructGPT se centra en entrenar modelos de lenguaje grandes para seguir instrucciones con retroalimentación humana. Los autores señalan que hacer modelos de lenguaje más grandes no los hace inherentemente mejores para seguir la intención de un usuario. Los modelos grandes pueden generar resultados falsos, tóxicos o simplemente inútiles.

Subir una imagen a ChatGPT todavía no está disponible

El reconocimiento de imágenes es una de las capacidades más destacadas de GPT-4. Se espera que aterrice en herramientas como ChatGPT y el nuevo Bing de Microsoft, que se basan en este modelo de lenguaje. Sin embargo, esta función todavía no está disponible para el público general. Lo que conocemos de ella es lo que se ha mostrado en las demostraciones oficiales.

El reconocimiento de imágenes de GPT-4 utiliza un sistema multimodal que combina dos tipos de datos: texto e imagen. Detectar el contenido de una imagen es posible gracias al uso de redes neuronales específicas. Una vez los datos se han convertido en texto, GPT-4 ofrece una respuesta coherente y natural que describe la imagen.

La capacidad de subir una imagen a ChatGPT con GPT-4 todavía no está disponible. Podemos suponer que hay varios motivos de peso para que esta funcionalidad no haya llegado al público en general. La primera es la dificultad de asegurar una fiabilidad máxima en los resultados. Por otro lado, posiblemente el coste de mantener una infraestructura con sistema multimodal sea muy elevado.

En vista de esto, tendremos que esperar un poco más para poder disfrutar del reconocimiento de imágenes en GPT-4. De hecho, la compañía no ha confirmado todavía cuándo llegará.

Subir una imagen a ChatGPT con un enlace

Si bien es cierto que las capacidades de GPT-4 para leer imágenes todavía están por llegar, ya hay algunas cosas que puedes hacer con ChatGPT al respecto. Algunos usuarios mencionan que es posible enviar la URL de un gráfico y pedirle que lo interprete. No obstante, nosotros lo hemos probado y los resultados no funcionan realmente.

Primero, le hemos pedido que reconociera el logotipo de Google. Lo ha hecho correctamente. Luego, le hemos ordenado que generara el código de una web basándose en un mockup que hemos encontrado en Internet. Aunque ha creado un código, lo cierto es que no se ajustaba al aspecto que le habíamos pedido.

Lo más probable es que en realidad ChatGPT no lea la imagen y genere texto tomando en cuenta el contenido de la URL. Esto queda demostrado cuando le hemos demandado que nos diga qué veía en un GIF. Este contenía el logotipo de Google modificado, pero el nombre del archivo no contenía referencias a la marca. El resultado es que GPT se inventa por completo lo que aparece en la imagen.

La conclusión es que enviar un enlace con una imagen en ChatGPT no sirve de mucho. El sistema trata de adivinar el contenido tomando en cuenta el texto de la URL, no el contenido real de la imagen. Es evidente que todavía toca esperar.

Consulta qué es Perplexity AI

Y tú, ¿has probado a subir una imagen a ChatGPT con un enlace? ¿Cuáles han sido los resultados? Déjanos tus impresiones más abajo. ¡Te leemos!

Recent Posts

  • Android

WhatsApp empieza a desplegar la transcripción de audios

Hace semanas se confirmaba y ahora comienza su despliegue: la transcripción de audios se hace…

3 mins atrás
  • Tarjetas gráficas

RTX 5070 Ti: Revelan posibles especificaciones con unos 8960 núcleos CUDA.

Estas es una de las primeras informaciones que tenemos sobre el modelo RTX 5070 Ti…

7 mins atrás
  • Noticias

Google habría cancelado también la Pixel Tablet 2

Ayer mismo saltaba la noticia de la posible cancelación de la Pixel Tablet 3, la…

43 mins atrás