El Hollywood en casa DragNUWA es un modelo de IA que puede lograr la generación de video controlable
La IA generativa ha dado un gran salto en los últimos dos años gracias al exitoso lanzamiento de modelos de difusión ...
El truco para hacer que LLaMa quepa en tu bolsillo conoce OmniQuant, un método de IA que combina la eficiencia y el rendimiento de las LLMs
Los modelos de lenguaje grandes (LLMs), como el infame ChatGPT, han logrado un rendimiento impresionante en una varie...
Avanzando en el relleno de imágenes Acortando la brecha entre manipulaciones 2D y 3D con este novedoso relleno de IA para Campos de Radiación Neurales
Ha habido un interés duradero en la manipulación de imágenes debido a su amplio rango de aplicaciones en la creación ...
Amplificando lo invisible Este método de inteligencia artificial AI utiliza NeRFs para visualizar movimientos sutiles en 3D
Vivimos en un mundo lleno de movimiento, desde los movimientos sutiles de nuestros cuerpos hasta los movimientos a gr...
¿Adivina qué vi hoy? Este modelo de IA decodifica las señales de tu cerebro para reconstruir las cosas que viste
Cerebro . El órgano más fascinante del cuerpo humano. Comprender cómo funciona es la clave para desvelar los secretos...
Conoce WavJourney Un marco de IA para la creación de audio compositivo con modelos de lenguaje grandes.
El campo emergente de la inteligencia artificial (IA) multimodal combina datos visuales, auditivos y textuales, ofrec...
Hacer que ChatGPT vuelva a ver Este enfoque de IA explora el aprendizaje de contexto de enlaces para habilitar el aprendizaje multimodal
Los modelos de lenguaje han revolucionado la forma en que nos comunicamos con las computadoras gracias a su capacidad...
Descubre los secretos de la segmentación anatómica con HybridGNet un codificador-decodificador de IA para la decodificación plausible de estructuras anatómicas
Los avances recientes en redes neuronales profundas han permitido nuevos enfoques para abordar la segmentación anatóm...
Observa y Aprende Pequeño Robot Este Enfoque de IA Enseña a los Robots la Manipulación Generalizable Utilizando Demostraciones en Video de Humanos
Los robots siempre han estado en el centro de atención en el panorama tecnológico. Siempre han encontrado un lugar en...
La edición de video ya no es un desafío INVE es un método de IA que permite la edición interactiva de videos neuronales
¿Puedes imaginar Internet sin edición de imágenes? Todos esos memes divertidos, fotos elegantes de Instagram, paisaje...
Más allá del bolígrafo la destreza del IA en la generación de texto manuscrito a partir de arquetipos visuales
El campo emergente de la Generación de Texto Manuscrito Estilizado (HTG, por sus siglas en inglés) busca crear imágen...
El primo de la IA de Michelangelo Neuralangelo es un modelo de IA que puede lograr una reconstrucción de superficie 3D de alta fidelidad [Código incluido]
Las redes neuronales han avanzado significativamente en los últimos años y se han encontrado casos de uso en casi tod...
Investigadores de IA de Apple y la Universidad de British Columbia proponen FaceLit un nuevo marco de IA para caras tridimensionales relumbrantes
En tiempos recientes, ha habido una creciente fascinación con la tarea de adquirir un modelo generativo 3D a partir d...
Investigación de Inteligencia Artificial de Google propone VidLNs un procedimiento de anotación que obtiene descripciones de video enriquecidas que son semánticamente correctas y densamente fundamentadas con localizaciones espaciotemporales precisas.
La investigación en visión y lenguaje es un campo en constante evolución que ha presenciado avances notables reciente...
Colócame en el centro rápidamente Subject-Diffusion es un modelo de IA que puede lograr la generación de texto a imagen personalizada en un dominio abierto.
Los modelos de texto a imagen han sido la piedra angular de cada discusión de IA durante el último año. El avance en ...
No el héroe que los NeRF merecen, pero el héroe que los NeRF necesitan CopyRNeRF es un enfoque de IA que protege los derechos de autor de los NeRF
Si has estado prestando atención al desarrollo en el dominio de la gráfica por computadora, deberías estar familiariz...
MLOps abarcando todo el ciclo de vida del aprendizaje automático Resumen del artículo
Este artículo AI proporciona un examen exhaustivo del campo de MLOps. MLOps es una disciplina emergente que se centra...
Avanzando en el reconocimiento de acciones humanas en realidad virtual Este artículo de IA presenta LKA-GCN con atención de núcleo grande esquelético para un rendimiento incomparable
El Reconocimiento de Acciones Humanas basado en Esqueletos es un campo de visión por computadora que identifica accio...
Investigadores de Stanford presentan Gisting Una novedosa técnica para la compresión eficiente de indicaciones en modelos de lenguaje
La especialización del modelo implica adaptar un modelo de aprendizaje automático pre-entrenado a una tarea o dominio...
Conozca TEXTure un nuevo marco de Inteligencia Artificial (IA) para la texturización guiada por texto de mallas 3D.
La generación de imágenes a partir de texto es un área novedosa y fascinante de investigación en el campo de la intel...
Esta investigación de Brain-AI recrea imágenes a partir de la lectura de ondas cerebrales con difusión estable.
Construir sistemas artificiales que vean y reconozcan el mundo de manera similar a los sistemas visuales humanos es u...
Investigadores de China proponen un enfoque de aumento de datos llamado CarveMix para la segmentación de lesiones cerebrales
La segmentación automatizada de lesiones cerebrales utilizando redes neuronales convolucionales (CNN) se ha convertid...
Esta biblioteca de Python ‘Imitation’ proporciona implementaciones de código abierto de algoritmos de aprendizaje por imitación y recompensa en PyTorch.
En áreas con funciones de recompensa claramente definidas, como los juegos, el aprendizaje por refuerzo (RL) ha super...
Una Difusión para Gobernar la Difusión Modulando Modelos de Difusión Pre-entrenados para la Síntesis Multimodal de Imágenes
Los modelos de IA de generación de imágenes han irrumpido en el dominio en los últimos meses. Probablemente hayas oíd...
Conoce a PaLM-E un nuevo modelo de lenguaje multimodal y encarnado con 562 mil millones de parámetros que realiza tareas como la planificación de manipulación robótica y preguntas y respuestas visuales.
Los modelos de lenguaje grandes (LLMs) muestran habilidades sólidas de razonamiento en una variedad de campos, incluy...

- Presentamos 🤗 Accelerate
- Google AI presenta TSMixer un modelo multivariante avanzado para pronósticos a largo plazo que aprovecha las características del modelo lineal para un alto rendimiento de referencia
- Convertir Transformers a ONNX con Hugging Face Optimum
- ¿Buscas un Ingeniero de Promoción con más de 10 años de experiencia?
- NASA detecta señal de Voyager 2 después de perder contacto debido a un comando incorrecto
- Balanceo de carga efectivo con Ray en Amazon SageMaker
- Melting Pot una suite de evaluación para el aprendizaje por refuerzo multiagente
- Una nueva investigación de IA introduce el Ajuste de Tareas Múltiples de Solicitud (MPT) para el Aprendizaje por Transferencia
- Una Edad de Oro ‘Age of Empires III’ se une a GeForce NOW.
- Cómo crear un histograma polar con Python y Matplotlib
- Ajusta tu LLM en una sola GPU con Gradient Checkpointing, LoRA y Cuantización.
- Evaluando Modelos de Incremento
- La colaboración Amazon SageMaker y Hugging Face
- Microsoft Azure lanza ChatGPT para IA empresarial
- Cómo Google Pixel Watch sabe cuando te caes