Safa Global · Claude Code
4.8 + ultracode + Workflows. La versión que convierte a Claude Code de un compañero de programación turno por turno en un orquestador de cientos de agentes en segundo plano, y lo que eso significa para la forma en que Safa entrega su trabajo.
Briefing ejecutivo en audio. Dos voces, unos 22 minutos.
Lo esencial
Opus 4.8 no es principalmente la historia de un "modelo más inteligente". El verdadero cambio son los flujos de trabajo dinámicos: ahora Claude escribe un script que orquesta de docenas a cientos de subagentes en segundo plano, con agentes que se revisan entre sí de forma adversarial, mientras tu sesión sigue libre. Trabajo planeado en trimestres puede terminar en días.
ultracode (/effort ultracode) es el botón fácil: máximo esfuerzo de razonamiento más orquestación automática de flujos de trabajo, así Claude decide cuándo una tarea merece un enjambre de agentes. Úsalo para auditorías a lo largo de toda la base de código y migraciones grandes; deja el trabajo rutinario en /effort high, los flujos de trabajo cuestan bastantes más tokens.
El modelo más capaz de Anthropic con disponibilidad general, lanzado el 28 de mayo de 2026. Diseñado para ingeniería de software profesional, trabajo agéntico complejo y tareas empresariales de alto impacto, al mismo precio por token que 4.7.
high (el valor por defecto de 4.8) → xhigh ("extra") → max. Más esfuerzo significa que Claude piensa más seguido y más profundo, cambiando tokens por calidad; los límites de uso se elevan para compensar.| Palanca | Detalle |
|---|---|
| Precio estándar | $5 / M de entrada · $25 / M de salida (sin cambio respecto a 4.7) |
| Modo rápido | $10 / M de entrada · $50 / M de salida, 3× más barato que en modelos anteriores |
| Caché / lote | Hasta 90% de descuento con prompt caching · 50% de descuento con lote |
| Niveles de esfuerzo | high (por defecto) · xhigh · max |
Un flujo de trabajo dinámico es un script de JavaScript que Claude escribe y que orquesta subagentes a escala. Un runtime lo ejecuta en segundo plano mientras tu sesión de chat sigue respondiendo, y solo la respuesta final regresa al contexto de Claude.
El cambio mental clave es quién tiene el plan. Con subagentes y skills, Claude es el orquestador y cada resultado intermedio llena su contexto. Un flujo de trabajo mueve el ciclo, las ramificaciones y los resultados intermedios al código, de modo que puede aplicar un patrón de calidad repetible: agentes independientes trazan un plan desde varios ángulos, o revisan los hallazgos del otro de forma adversarial, antes de reportar nada.
| Subagentes | Skills | Flujos de trabajo | |
|---|---|---|---|
| Qué es | Un trabajador que Claude genera | Instrucciones que Claude sigue | Un script que ejecuta el runtime |
| Quién planea | Claude, turno por turno | Claude, por prompt | El script |
| Los resultados viven en | El contexto de Claude | El contexto de Claude | Variables del script |
| Escala | Unos pocos por turno | Igual | De docenas a cientos |
| Si se interrumpe | Reinicia el turno | Reinicia el turno | Se puede reanudar |
Hasta 16 agentes en paralelo (menos en máquinas con pocos núcleos), un tope duro de 1,000 agentes por corrida, sin entrada del usuario a mitad de corrida (corre cada etapa de aprobación como su propio flujo de trabajo), y la reanudación solo funciona dentro de la misma sesión de Claude Code.
Prueba de ello: Bun se portó de Zig a Rust, unas 750,000 líneas, con 99.8% de la suite de pruebas existente pasando, en once días usando flujos de trabajo dinámicos, con dos agentes revisores por archivo.
ultracode = esfuerzo de razonamiento xhigh + orquestación automática de flujos de trabajo. Actívalo y Claude planea por sí mismo un flujo de trabajo para cada tarea sustancial, en lugar de esperar a que se lo pidas.
| Activar | /effort ultracode, dura la sesión actual, se reinicia en una nueva |
| Volver atrás | /effort high cuando regreses al trabajo rutinario |
| Comportamiento | Una sola petición puede convertirse en varios flujos de trabajo seguidos: entender el código → hacer el cambio → verificarlo |
| El costo | Cada tarea usa más tokens y toma más tiempo. Solo disponible en modelos que soportan el esfuerzo xhigh |
Piensa en las tres velocidades: /effort high para el trabajo de todos los días, la palabra clave workflow para una sola tarea grande bajo demanda, y /effort ultracode cuando estás concentrado en algo grande y quieres que Claude escale por su cuenta.
/deep-research <pregunta> abre búsquedas web por varios ángulos, contrasta fuentes, vota cada afirmación y devuelve un reporte con citas y con las afirmaciones débiles filtradas. La forma más rápida de ver correr un flujo de trabajo.workflow en cualquier parte de tu prompt y Claude escribe un script en lugar de avanzar turno por turno. Presiona alt+w para cancelar el disparador si no era tu intención./effort ultracode y deja que Claude decida por tarea./workflowsLas corridas suceden en segundo plano; /workflows abre la vista de progreso: fases con conteo de agentes, totales de tokens y tiempo transcurrido.
| Tecla | Acción |
|---|---|
| p | Pausar / reanudar la corrida |
| x | Detener un agente, o todo el flujo de trabajo |
| r | Reiniciar un agente en ejecución |
| s | Guardar el script de la corrida como un /command reutilizable |
Guarda en .claude/workflows/ (compartido con el repo) o en ~/.claude/workflows/ (personal, en todos los proyectos). Un flujo de trabajo guardado se vuelve /<name> en sesiones futuras, la orquestación en sí se vuelve repetible, no solo el prompt.
Vista previa de investigación. Requiere Claude Code v2.1.154+. Activo por defecto en Max y Team; actívalo desde la fila de flujos de trabajo dinámicos en /config en Pro; Enterprise necesita activación del administrador. Funciona en CLI, Desktop, extensiones de IDE, claude -p y el Agent SDK.
| Recurre a un flujo de trabajo | Quédate en el chat normal |
|---|---|
| Auditorías a lo largo de toda la base de código (seguridad, código muerto, autenticación faltante) | Una edición de un solo archivo o un arreglo rápido |
| Migraciones grandes: cambios de framework, deprecaciones de API, portar lenguajes en cientos de archivos | Una pregunta que puedes responder en un turno |
| Trabajo de alto impacto donde una respuesta equivocada sale cara y quieres verificación adversarial | Cualquier cosa que una sola conversación ya maneja bien |
| Investigación que debe contrastar muchas fuentes entre sí | Ida y vuelta exploratoria donde guías cada paso |
Una corrida genera muchos agentes, así que puede usar bastantes más tokens que hacer la misma tarea en conversación, y cuenta para el uso y los límites de tu plan. Empieza acotado para aprender el patrón de uso. Revisa /model antes de una corrida grande, y pídele a Claude que dirija a un modelo más pequeño las etapas que no necesitan el modelo más fuerte.
Dónde ultracode y los flujos de trabajo ganan primero su costo en tokens, dado nuestro stack:
~/aquiii-webapp/src en busca de verificaciones de autenticación faltantes, luego verifica que la rotación del token de Shopify pendiente esté del todo propagada. Agentes independientes por ruta, revisados de forma adversarial.SKILL.md de las 13 Skills, en lugar de editarlas una por una./branch-review. Construye la revisión una vez en una rama de feature, presiona s, y reutiliza la misma orquestación multiagente en cada rama de ahí en adelante./effort high en el día a día; reserva /effort ultracode para migraciones y auditorías donde los tokens extra compran corrección verificada.