Impulsa las notificaciones en mitad del viaje con Poe
Notificaciones en mitad del viaje con Poe
Poe es una plataforma que proporciona acceso a numerosos chatbots y LLMs, tanto de forma simultánea como individual, a través de una interfaz unificada. Además de algunos LLMs habituales, como ChatGPT, Llama y otros, Poe tiene acceso a numerosos chatbots personalizados, como aquellos que reformulan tu entrada en emojis; que no tienen ningún interés en lo que les preguntas (de verdad); que consideran que cualquier cosa que hagas es un delito; y muchos más. El sitio tiene niveles gratuitos y de suscripción. Poe fue creado por Quora.
Midjourney es un servicio de generación de imágenes de IA de pago. Arguablemente, el modelo más capaz que resulta en imágenes generadas de la más alta calidad actualmente disponibles, perfeccionar las indicaciones de Midjourney y obtener los mejores resultados es un arte en sí mismo, a menudo requiere muchas iteraciones y mucho tiempo. Ahí es donde entra en juego Poe.
Uno de los bots más populares en Poe es el bot de Midjourney. No, el bot no proporciona acceso a los modelos de Midjourney; en cambio, toma tu indicación aproximada como entrada y la reescribe para aumentar tus posibilidades de generar imágenes aceptables desde el principio.
En este artículo vamos a intentar algunas iteraciones de este proceso y comparar los resultados, lo que nos dará una idea de cómo este bot de Poe puede permitirnos mejorar nuestras imágenes desde el principio.
- Compañía de autos sin conductor utiliza chatbots para hacer sus veh...
- Amazon adapta la tecnología sin cajeros para tiendas de ropa
- Chris Sullens, CEO de CentralReach – Serie de Entrevistas
Para cada una de estas comparaciones, el autor realizó únicamente las comparaciones que se muestran a continuación, realizó exactamente una ejecución de generación de imágenes para cada indicación y no seleccionó los resultados de ninguna manera. Todas las decisiones subjetivas fueron tomadas únicamente por el autor. Ten en cuenta que cualquier parámetro adicional de Midjourney que Poe pueda haber agregado a su nueva indicación, con el fin de comparar frutas similares. He agregado --ar 16:9
a todas las indicaciones, ya que la proporción de imagen aceptable es de 16:9, fin de la historia.
Ciudad Vieja de Jerusalén
Empecemos con uno de los lugares más icónicos y fácilmente reconocibles del planeta: la Ciudad Vieja de Jerusalén. No busco nada en particular, no hay lugares específicos, solo quiero una imagen que represente y se asemeje al aspecto distintivo de la Ciudad Vieja.
Mi indicación básica y los resultados:
representación artística abstracta de la Ciudad Vieja de Jerusalén –ar 16:9
Indicación asistida por Poe y resultados:
fotografía en color de una representación artística abstracta de la Ciudad Vieja de Jerusalén. El tema es una interpretación vibrante y dinámica de la ciudad antigua, capturando su rica historia y significado espiritual. La foto muestra una ráfaga de pinceladas audaces y colores vibrantes, evocando una sensación de energía y movimiento. El entorno está lleno de un aura de misticismo, con las calles estrechas, murallas antiguas y bulliciosos mercados que se unen en un caos armonioso. La configuración de la cámara es experimental y vanguardista, empujando los límites de la fotografía tradicional. Se utiliza una Hasselblad X1D II 50C, junto con un objetivo Lensbaby Velvet 56, que permite efectos creativos de desenfoque y enfoque suave. Se emplean técnicas de exposición doble y movimiento intencional de la cámara para añadir una calidad etérea y onírica a la imagen. Colaboradores improbables para esta escena serían Alejandro González Iñárritu, el director visionario conocido por su narrativa inmersiva, Emmanuel Lubezki, el aclamado director de fotografía famoso por sus imágenes poéticas, David LaChapelle, el fotógrafo provocativo famoso por sus composiciones surrealistas y vibrantes, e Iris van Herpen, la innovadora diseñadora de moda celebrada por sus diseños futuristas y esculturales –ar 16:9
En primer lugar, observa cuánto más detallada es esa indicación generada por Poe. Observa algunos de los detalles específicos, incluyendo la controvertida frase “al estilo de”.
Ahora, podrías taparme los ojos y podría moverme más o menos por la Ciudad Vieja de Jerusalén, y puedo decirte que ninguna de las imágenes generadas representa realmente ningún lugar allí. Pero no podemos juzgar las imágenes generadas por esta métrica; en cambio, tenemos que utilizar estándares subjetivos de valor artístico.
Nota: Aunque puedes discutir el uso del término “valor artístico” (o cualquier cosa “artística”) al hablar de imágenes generadas por IA, considero que es la mejor palabra para expresar lo que intento transmitir en este escenario. ¿Te molesta? Imagina que escribí “valor artístico imitado”. ¿Todavía te molesta? Bueno, las imágenes generadas por IA están aquí y no van a desaparecer, y aunque personas razonables pueden discrepar sobre cómo nos referimos al proceso y los resultados finales de la generación de imágenes por IA, esa no es una discusión que busco tener aquí, en este momento. Simplemente estoy demostrando cómo las personas que tienen la intención de mejorar sus indicaciones de generación de imágenes por IA podrían intentar hacerlo.
Encuentro que las imágenes originales son un poco aburridas, sin ninguna imagen interesante que capture mi atención más allá de una primera mirada. La segunda ronda, asistida por Poe, es más colorida y merece una inspección adicional más allá de una mirada rápida, al menos en mi opinión. La belleza está en los ojos del espectador y todo eso, por lo que las opiniones aquí diferirán, pero seleccioné la imagen de la esquina superior derecha en ambos casos como la representante “mejor” para ambas ejecuciones de generación de imágenes. Amplié ambas y las comparto a continuación.
Nuevamente, esto es completamente subjetivo, pero al final estoy más impresionado por el resultado “mejor” utilizando la sugerencia de Poe. En resumen, encuentro que las imágenes generadas por la sugerencia de Poe, en conjunto, son mejores que las imágenes de la sugerencia original, y también encuentro que el mejor esfuerzo de Poe es superior al mejor esfuerzo de mi sugerencia original.
Retrato Profesional
Intentemos algo diferente, algunas imágenes con humanos. Generemos algunos retratos profesionales.
Mi sugerencia sencilla:
retrato profesional mujer en la calle
Comparemos estos con la sugerencia ampliada de Poe:
fotografía en color de un retrato profesional de una mujer en la calle. La protagonista es una mujer segura y elegante, que irradia profesionalismo y elegancia en medio del entorno urbano. Su retrato captura su sonrisa radiante y su personalidad cálida, mostrando su accesibilidad y profesionalismo. El entorno es una calle bulliciosa de la ciudad, con peatones y tráfico borrosos en el fondo, lo que enfatiza a la mujer como punto focal. La configuración de la cámara se elige cuidadosamente para resaltar sus rasgos y capturar su esencia. Se utiliza una Nikon D850, junto con un objetivo para retratos, como un Nikon AF-S NIKKOR 85mm f/1.4G, para lograr una profundidad de campo reducida y crear un efecto de desenfoque agradable. La foto está enmarcada con una composición equilibrada, utilizando líneas guía de la arquitectura circundante para agregar interés visual. Colaboradores inesperados para esta escena podrían ser Sofia Coppola, la aclamada directora conocida por su narrativa íntima, Darius Khondji, el renombrado director de fotografía celebrado por su iluminación atmosférica, Annie Leibovitz, la icónica fotógrafa famosa por sus retratos cautivadores, y Stella McCartney, la influyente diseñadora de moda reconocida por sus diseños atemporales y sostenibles
Nuevamente, comparen las diferencias entre los detalles de las sugerencias. Ahora, dejando de lado el hecho de que todas las mujeres generadas parecen ser blancas, una discusión completamente diferente que merece su propia atención, a continuación se muestran las 2 imágenes “mejores” en mi opinión, una de cada sugerencia.
Nota: Por transparencia, por curiosidad ejecuté la sugerencia de Poe 4 veces más después, y de las 16 mujeres adicionales que generó, ninguna existía y 5 de ellas parecían no ser blancas. Haz lo que quieras con esta información, pero pensé que valía la pena intentarlo y reportar los resultados.
Imagen “mejor” de las generadas por Midjourney utilizando la sugerencia básica
Imagen “mejor” de las generadas por Midjourney utilizando la sugerencia de Poe
Nuevamente, encuentro que las sugerencias asistidas por Poe tienen un aspecto más realista. Parecen tener una sensación más “natural” y determinar que son generadas por IA lleva un poco más de tiempo que hacerlo con las imágenes de la sugerencia básica. La iluminación y los aspectos al aire libre parecen más naturales y, aunque no es por mucho, diría que son un pequeño porcentaje mejores.
Conclusión
Tal vez este artículo debería haberse llamado “Prompts de Midjourney con Poe???” Creo que el jurado puede estar en duda si este bot de Poe ayuda a crear definitivamente mejores sugerencias para la generación de imágenes, y en caso afirmativo, ¿en qué medida? Sin embargo, eso definitivamente no se resolverá con un par de ejemplos insignificantes. Tiendo a preferir un poco más las sugerencias asistidas por Poe que las sugerencias básicas, pero, una vez más, esto es subjetivo y una decisión basada en muy pocos puntos de datos. Quizás las conclusiones deberían ser que el diseño de la sugerencia es una bestia compleja y caprichosa, y que el arte (tanto real como generado por IA) es demasiado subjetivo para determinar cuándo algo es mejor que otra cosa.
Dale una oportunidad a Poe para tus propios proyectos de generación de imágenes y mira cómo funciona para ti.
Matthew Mayo (@mattmayo13) tiene un título de Maestría en ciencias de la computación y un diploma de posgrado en minería de datos. Como Editor en Jefe de VoAGI, Matthew tiene como objetivo hacer que los conceptos complejos de ciencia de datos sean accesibles. Sus intereses profesionales incluyen el procesamiento del lenguaje natural, los algoritmos de aprendizaje automático y explorar la inteligencia artificial emergente. Está impulsado por una misión de democratizar el conocimiento en la comunidad de ciencia de datos. Matthew ha estado programando desde que tenía 6 años.