Ranking
Ranking de Modelos UI by Sho
Meu ranking pessoal de modelos que fazem boa UI. Não estou medindo só a capacidade de código: aqui pesam o harness, o critério visual e o quanto evitam o AI Slop, ou seja, interfaces geradas por IA que parecem polidas mas falham em intenção, consistência ou uso real.
Histórico vivo
Modelos para UI, mês a mês
Maio funciona como referência inicial e Junho mostra como os modelos evoluíram. A ideia é atualizá-lo mês a mês para ver o que realmente melhora em interface, qual harness potencializa cada modelo e quais continuam gerando AI Slop demais.
- Harness
- O ambiente onde o modelo roda muda o resultado: Figma, Codex, Cursor, Stitch ou AI Studio.
- AI Slop
- O quanto cai em padrões visuais genéricos, sobredecorados ou sem intenção de produto.
- Critério de UI
- Capacidade de decidir hierarquia, composição, densidade, clareza e acabamento.
- Constraints
- O quanto precisa de instruções fechadas para chegar a uma interface utilizável.
Bons modelos de UI
Os modelos que melhor convertem intenção visual em interface
Para mim, um bom modelo de UI não é o que mais cospe componentes. É o que entende hierarquia, composição e restrições, e que ainda trabalha bem dentro do harness certo.
-
Melhor com Figma
#1 · GPT 5.5
Codex + Figma
O melhor quando o objetivo é uma UI bem resolvida usando o Figma como parte do fluxo.
GPT 5.5 fica em primeiro porque com o Figma entende melhor a intenção visual, a estrutura e o acabamento. Não só gera tela: ajuda a tomar decisões de composição, hierarquia e produto.
FigmaCritério visualBom polishEstrutura claraMenos AI SlopTrade-off: Eu o uso a partir do Codex; o harness importa muito para que essa qualidade se traduza bem no produto.
-
Menos AI Slop
#2 · Composer 2.5
Cursor
O que costuma entregar resultados mais limpos e menos genéricos dentro do Cursor.
Composer 2.5 fica em segundo porque evita bastante o AI Slop: aquele visual genérico, sobredecorado ou pouco intencional que entrega uma interface feita por IA sem direção de design.
Menos AI SlopBom critério baseCursorLayouts limposIteração rápidaTrade-off: Nem sempre chega ao nível de critério visual que o GPT 5.5 alcança com o Figma, mas é muito consistente.
-
Melhor no Cursor
#3 · Opus 4.7
Cursor
Potente para raciocinar a UI, mas com AI Slop intermediário se o harness não ajudar.
Opus 4.7 funciona melhor no Cursor porque o ambiente lhe dá um harness melhor para revisar, editar e corrigir. No Claude Code tende a ir mais para interfaces com AI Slop demais.
RaciocínioCursor como harnessRefinamentoComponentesBom contextoTrade-off: Precisa de direção visual clara para não cair em decisões óbvias demais ou artificiais.
-
Rápido mas desleixado
#4 · Sonnet 4.6
Cursor
Muito útil, mas com mais risco de AI Slop se a instrução visual não estiver bem fechada.
Sonnet 4.6 fica abaixo do Opus porque compartilha parte do problema: pode produzir UI funcional, mas com um acabamento mais genérico se não receber constraints fortes.
VelocidadeCursorBom suporteIteraçãoImplementaçãoTrade-off: Assim como o Opus, precisa de um harness e de uma direção visual sólida para não virar AI Slop demais.
-
UI complicada
#5 · Gemini 3 Pro
Cursor
Nem sempre produz muito AI Slop, mas suas interfaces tendem a parecer complicadas.
Gemini 3 Pro pode evitar parte do visual genérico, mas em troca costuma propor interfaces mais enroladas do que o necessário. Para boa UI, a simplicidade pesa muito.
CursorMenos genéricoIdeias amplasExploraçãoCapacidade técnicaTrade-off: Eu o vejo deficiente para UI porque complica demais a interface e exige mais correção depois.
-
Rápido com constraints
#6 · Gemini 3.5
Stitch + AI Studio
Rápido quando as instruções estão bem definidas, mas menos forte como critério autônomo de UI.
Gemini 3.5 fica em sexto porque pode se mover rápido no Stitch e no AI Studio, mas precisa de instruções bem precisas. Se o brief fica aberto, a qualidade visual cai rápido.
RápidoStitchAI StudioBriefs fechadosExploraçãoTrade-off: Funciona melhor como executor com constraints do que como modelo principal para decidir uma boa UI.