Volver a ideas

Ranking

Ranking Modelos UI by Sho

Mi ranking personal de modelos que hacen buena UI. No estoy midiendo solo capacidad de código: aquí pesa el harness, el criterio visual y qué tanto evitan el AI Slop, es decir, interfaces generadas por IA que se ven pulidas pero fallan en intención, consistencia o uso real.

Histórico vivo

Modelos para UI, mes a mes

Mayo funciona como referencia inicial y Junio muestra cómo han evolucionado los modelos. La idea es actualizarlo mes a mes para ver qué mejora de verdad en interfaz, qué harness potencia cada modelo y cuáles siguen generando demasiado AI Slop.

Histórico del ranking personal de modelos para UI Gráfica histórica de Mayo a Junio 2026. En Mayo el orden es Opus 4.6, GPT 5.5, Gemini 3 Pro, Gemini 3.5, Sonnet 4.5 y Composer 2. En Junio el orden evoluciona a GPT 5.5, Composer 2.5, Opus 4.7, Sonnet 4.6, Gemini 3 Pro y Gemini 3.5. Equivalencias de evolución: Opus 4.6 pasa a Opus 4.7, Composer 2 pasa a Composer 2.5, Sonnet 4.5 pasa a Sonnet 4.6, y GPT 5.5, Gemini 3 Pro y Gemini 3.5 se mantienen como líneas comparables entre meses. Julio y Agosto 2026 aparecen como expectativa visual: todos los modelos mantienen su posición de Junio, sin cambios. Mayo 2026 Junio 2026 Julio 2026 2. GPT 5.5 1. GPT 5.5 6. Composer 2 2. Composer 2.5 1. Opus 4.6 3. Opus 4.7 5. Sonnet 4.5 4. Sonnet 4.6 3. Gemini 3 Pro 5. Gemini 3 Pro 4. Gemini 3.5 6. Gemini 3.5
Posición 1 significa mi recomendación principal para lograr buena UI con un modelo. Mayo es la referencia anterior; Junio muestra cómo evolucionaron las versiones y el ranking: Opus, Composer y Sonnet cambian de versión; GPT 5.5 y Gemini se comparan como continuidad directa. Las líneas punteadas son expectativa visual hasta julio, sin cambios de posición.
Harness
El entorno donde corre el modelo cambia el resultado: Figma, Codex, Cursor, Stitch o AI Studio.
AI Slop
Qué tanto cae en patrones visuales genéricos, sobredecorados o sin intención de producto.
Criterio UI
Capacidad de decidir jerarquía, composición, densidad, claridad y acabado.
Constraints
Qué tanto necesita instrucciones cerradas para llegar a una interfaz usable.

Buenos modelos de UI

Los modelos que mejor convierten intención visual en interfaz

Para mí, un buen modelo de UI no es el que más componentes escupe. Es el que entiende jerarquía, composición y restricciones, y que además trabaja bien dentro del harness correcto.

  1. Mejor con Figma

    #1 · GPT 5.5

    Codex + Figma

    El mejor cuando el objetivo es una UI bien resuelta usando Figma como parte del flujo.

    GPT 5.5 queda primero porque con Figma entiende mejor intención visual, estructura y acabado. No solo genera pantalla: ayuda a tomar decisiones de composición, jerarquía y producto.

    FigmaCriterio visualBuen polishEstructura claraMenos AI Slop

    Trade-off: Lo uso desde Codex; el harness importa mucho para que esa calidad se traduzca bien al producto.

  2. Menos AI Slop

    #2 · Composer 2.5

    Cursor

    El que suele entregar resultados más limpios y menos genéricos dentro de Cursor.

    Composer 2.5 queda segundo porque evita bastante el AI Slop: ese look genérico, sobredecorado o poco intencional que delata una interfaz hecha por IA sin dirección de diseño.

    Menos AI SlopBuen criterio baseCursorLayouts limpiosIteración rápida

    Trade-off: No siempre llega al nivel de criterio visual que logra GPT 5.5 con Figma, pero es muy consistente.

  3. Mejor en Cursor

    #3 · Opus 4.7

    Cursor

    Potente para razonar la UI, pero con AI Slop intermedio si el harness no ayuda.

    Opus 4.7 funciona mejor en Cursor porque el entorno le da un mejor harness para revisar, editar y corregir. En Claude Code tiende a irse más hacia interfaces con demasiado AI Slop.

    RazonamientoCursor como harnessRefinamientoComponentesBuen contexto

    Trade-off: Necesita dirección visual clara para no caer en decisiones demasiado obvias o artificiales.

  4. Rápido pero descuidado

    #4 · Sonnet 4.6

    Cursor

    Muy útil, pero con más riesgo de AI Slop si la instrucción visual no está bien cerrada.

    Sonnet 4.6 queda debajo de Opus porque comparte parte del problema: puede producir UI funcional, pero con un acabado más genérico si no recibe constraints fuertes.

    VelocidadCursorBuen soporteIteraciónImplementación

    Trade-off: Igual que Opus, necesita un harness y una dirección visual sólida para no volverse demasiado AI Slop.

  5. UI complicada

    #5 · Gemini 3 Pro

    Cursor

    No siempre produce mucho AI Slop, pero sus interfaces tienden a sentirse complicadas.

    Gemini 3 Pro puede evitar parte del look genérico, pero a cambio suele proponer interfaces más enredadas de lo necesario. Para buena UI, la simplicidad pesa mucho.

    CursorMenos genéricoIdeas ampliasExploraciónCapacidad técnica

    Trade-off: Lo veo deficiente para UI porque complica demasiado la interfaz y exige más corrección posterior.

  6. Rápido con constraints

    #6 · Gemini 3.5

    Stitch + AI Studio

    Rápido cuando las instrucciones están muy definidas, pero menos fuerte como criterio autónomo de UI.

    Gemini 3.5 queda sexto porque puede moverse rápido en Stitch y AI Studio, pero necesita instrucciones muy precisas. Si el brief queda abierto, la calidad visual baja rápido.

    RápidoStitchAI StudioBriefs cerradosExploración

    Trade-off: Funciona mejor como ejecutor con constraints que como modelo principal para decidir una buena UI.