Ranking

Ranking Modelos UI by Sho

Mi ranking personal de modelos que hacen buena UI. No estoy midiendo solo capacidad de código: aquí pesa el harness, el criterio visual y qué tanto evitan el AI Slop, es decir, interfaces generadas por IA que se ven pulidas pero fallan en intención, consistencia o uso real.

Histórico vivo

Modelos para UI, mes a mes

Mayo funciona como referencia inicial y Junio muestra cómo han evolucionado los modelos. La idea es actualizarlo mes a mes para ver qué mejora de verdad en interfaz, qué harness potencia cada modelo y cuáles siguen generando demasiado AI Slop.

Posición 1 significa mi recomendación principal para lograr buena UI con un modelo. Mayo es la referencia anterior; Junio muestra cómo evolucionaron las versiones y el ranking: Opus, Composer y Sonnet cambian de versión; GPT 5.5 y Gemini se comparan como continuidad directa. Las líneas punteadas son expectativa visual hasta julio, sin cambios de posición.

Harness: El entorno donde corre el modelo cambia el resultado: Figma, Codex, Cursor, Stitch o AI Studio.
AI Slop: Qué tanto cae en patrones visuales genéricos, sobredecorados o sin intención de producto.
Criterio UI: Capacidad de decidir jerarquía, composición, densidad, claridad y acabado.
Constraints: Qué tanto necesita instrucciones cerradas para llegar a una interfaz usable.

Buenos modelos de UI

Los modelos que mejor convierten intención visual en interfaz

Para mí, un buen modelo de UI no es el que más componentes escupe. Es el que entiende jerarquía, composición y restricciones, y que además trabaja bien dentro del harness correcto.

Mejor con Figma

#1 · GPT 5.5

Codex + Figma

El mejor cuando el objetivo es una UI bien resuelta usando Figma como parte del flujo.

GPT 5.5 queda primero porque con Figma entiende mejor intención visual, estructura y acabado. No solo genera pantalla: ayuda a tomar decisiones de composición, jerarquía y producto.

FigmaCriterio visualBuen polishEstructura claraMenos AI Slop

Trade-off: Lo uso desde Codex; el harness importa mucho para que esa calidad se traduzca bien al producto.
Menos AI Slop

#2 · Composer 2.5

Cursor

El que suele entregar resultados más limpios y menos genéricos dentro de Cursor.

Composer 2.5 queda segundo porque evita bastante el AI Slop: ese look genérico, sobredecorado o poco intencional que delata una interfaz hecha por IA sin dirección de diseño.

Menos AI SlopBuen criterio baseCursorLayouts limpiosIteración rápida

Trade-off: No siempre llega al nivel de criterio visual que logra GPT 5.5 con Figma, pero es muy consistente.
Mejor en Cursor

#3 · Opus 4.7

Cursor

Potente para razonar la UI, pero con AI Slop intermedio si el harness no ayuda.

Opus 4.7 funciona mejor en Cursor porque el entorno le da un mejor harness para revisar, editar y corregir. En Claude Code tiende a irse más hacia interfaces con demasiado AI Slop.

RazonamientoCursor como harnessRefinamientoComponentesBuen contexto

Trade-off: Necesita dirección visual clara para no caer en decisiones demasiado obvias o artificiales.
Rápido pero descuidado

#4 · Sonnet 4.6

Cursor

Muy útil, pero con más riesgo de AI Slop si la instrucción visual no está bien cerrada.

Sonnet 4.6 queda debajo de Opus porque comparte parte del problema: puede producir UI funcional, pero con un acabado más genérico si no recibe constraints fuertes.

VelocidadCursorBuen soporteIteraciónImplementación

Trade-off: Igual que Opus, necesita un harness y una dirección visual sólida para no volverse demasiado AI Slop.
UI complicada

#5 · Gemini 3 Pro

Cursor

No siempre produce mucho AI Slop, pero sus interfaces tienden a sentirse complicadas.

Gemini 3 Pro puede evitar parte del look genérico, pero a cambio suele proponer interfaces más enredadas de lo necesario. Para buena UI, la simplicidad pesa mucho.

CursorMenos genéricoIdeas ampliasExploraciónCapacidad técnica

Trade-off: Lo veo deficiente para UI porque complica demasiado la interfaz y exige más corrección posterior.
Rápido con constraints

#6 · Gemini 3.5

Stitch + AI Studio

Rápido cuando las instrucciones están muy definidas, pero menos fuerte como criterio autónomo de UI.

Gemini 3.5 queda sexto porque puede moverse rápido en Stitch y AI Studio, pero necesita instrucciones muy precisas. Si el brief queda abierto, la calidad visual baja rápido.

RápidoStitchAI StudioBriefs cerradosExploración

Trade-off: Funciona mejor como ejecutor con constraints que como modelo principal para decidir una buena UI.