- ai4devs
- Posts
- ai4Devs #2: FLUX, Responses API, LlamaStack y el consumo energético de la IA.
ai4Devs #2: FLUX, Responses API, LlamaStack y el consumo energético de la IA.
Resumen bi-semanal de todo lo que pasó relevante en AI para técnicos y en español.
TL;DR - Novedades en esta edición ⚡
Black Forest Labs ha estrenado FLUX 1 Kontext, una suite de modelos que combinan generación y edición instantánea de imágenes con alta coherencia.
OpenAI ha ampliado la Response API con soporte para servidores MCP remotos, generación de imágenes, Code Interpreter, mejoras en búsqueda de archivos y un nuevo “background mode” para tareas asíncronas.
Mistral AI ha lanzado su Agents API, que permite a los modelos ejecutar acciones, mantener contexto y orquestar flujos con conectores para código, búsqueda web, generación de imágenes y bibliotecas de documentos, todo compatible con MCP.
Deepseek ha mejorado su modelo R1, elevando la calidad de resultados y reduciendo precios.
Google ha lanzado AI Edge Gallery, app Android para descargar y ejecutar modelos de Hugging Face en móvil sin conexión.
Un artículo de MIT Technology Review calcula el coste energético de la IA.
👉 También encontrarás novedades como ElevenLabs Conversational AI 2.0, una guía de Cursor para desarrollo web, el curso de Prompt Engineering de Anthropic, LlamaStack y alguna curiosidad más.
Doble-clic en las noticias 🔍
Han incorporado soporte para servidores MCP remotos, generación de imágenes, Code Interpreter y mejoras en la búsqueda de archivos, disponibles para modelos GPT-4o, GPT-4.1 y los modelos de razonamiento OpenAI o-series (o3, o4-mini).
Estos avances permiten a los desarrolladores conectar agentes inteligentes a herramientas externas a través del famoso MCP. Puedes ver una guía detallada sobre como usar la MCP tool en la Responses API aquí.
Además, la API de Responses introduce “background mode” para tareas asíncronas.
Diseñada para dotar a los modelos de capacidad para ejecutar acciones concretas, mantener contexto de forma persistente y orquestar múltiples agentes en flujos de trabajo complejos.
Entre sus características principales destacan conectores integrados para ejecución de código, búsqueda en web, generación de imágenes y acceso a bibliotecas de documentos, así como la capacidad de invocar herramientas MCP.
Se trata de una aplicación móvil de momento disponible para Android que permite descargar modelos de AI open-source en el móvil de Hugging Face y experimentar su performance local sin conexión a internet.
La gente de Black Forest Labs ha lanzado FLUX.1 Kontext, una suite de modelos de “flow matching” generativo que permite generar y editar imágenes combinando inputs de texto e imágenes y con la capacidad de producir múltiples imágenes con un nivel de coherencia muy alto entre sí.
A diferencia de los modelos clásicos de texto a imagen, FLUX.1 Kontext unifica generación y edición instantánea sin necesidad de fine-tuning o flujos de trabajo complejos.
Han lanzado las variantes [pro] y [max] que ofrecen edición local iterativa y generación pura, manteniendo consistencia de personajes y tipografía a velocidades.
Además, también han lanzado el modelo [dev] de código abierto (12 B parámetros), aun en beta privada.
Puedes probar los modelos en su playground.

Rajoy en un barco en el 1400 (generada con un solo prompt y una imagen de Google directamente en el playground de bfl).
Esta nueva versión de su plataforma promete mejoras en el flujo de las conversaciones con mayor entendimiento de interrupciones y capacidad para mantener conversaciones multi-lenguaje, entre otras.
Este artículo ha hecho cálculos alrededor del consumo energético ligado a la IA. Si bien los grandes proveedores no comparten información, el artículo se basa en datos públicos y estimaciones directas.
Hacerle una pregunta a ChatGPT cuesta unos 1,080 julios, mientras que generar un vídeo de 5 segundos con IA consume 3.4 millones de julios, la energía equivalente a recorrer 60 km en bicicleta eléctrica.
El consumo energético actual estimado para la IA es de 100 TWh anuales, cifra menor al de la minería de criptomonedas (alrededor de 130 TWh a nivel global). A pesar de ello, hay un claro movimiento de las grandes empresas tecnológicas como Meta, Google u OpenAI hacia la energía nuclear y las renovables para mitigar el impacto.
⚒️ Tool de la semana
¿Conoces LlamaStack?
Se trata de un framework open-source de Meta que unifica APIs modulares para construir, evaluar y desplegar aplicaciones LLM en diferentes entornos (local, cloud y edge), simplificando la integración de modelos y pudiendo correr la misma aplicación en local con Ollama o en remoto con OpenAI u otros proveedores.
Permite orquestar componentes críticos como inferencia, agentes autónomos, RAG, telemetría, seguridad y evaluación bajo una arquitectura plug-and-play.
Cuenta con SDKs en Python, Typescript, Swift y Kotlin. En el artículo, encontrarás también algunos casos de uso práctico.
Puedes profundizar en LlamaStack en este artículo. Especiales gracias a Juanma por escribirlo y hacérmelo llegar 👐
Aquí la documentación oficial y un repo que cubre lo básico de LlamaStack
🧑💻 Guías, Cursos y Repos
Guía: Descubre el set up recomendado de Cursor (IDE con AI integrada) para desarrollo web y como conectarlo con herramientas como Figma o Linear a través de MCP.
Además, en este enlace, puedes ver cómo darle acceso a tu editor de código con AI a un buscador web.Curso/Repo: Desde Anthropic (creadores de Claude) han lanzado un curso de Prompt Engineering.
Repo: Esta herramienta open-source permite convertir un screenshot en código usando modelos como Claude Sonnet 3.7 o GPT-4o.
P.S: Quieres un listado completo con frameworks para crear AI Agents y una descripción de para qué sirve cada uno?
Lo hemos creado para ti 👉 Aquí.