Pessoas

Quality Gate de feedback: por que IA vai parar comentário ruim antes do publish

Você já recebeu um "foi bem no semestre" como avaliação? Eu já. Lembro de ter passado meia hora tentando entender o que aquilo queria dizer. O que foi bem? Em qual situação? Comparado a quê? Era elogio ou era checkbox?

Aqui vai uma constatação desconfortável: a maioria das avaliações de desempenho falha não por nota errada, mas por comentário inutilizável. E o comentário inutilizável tem um custo concreto, o avaliado não sabe o que mudar, o gestor perde credibilidade, o ciclo seguinte vira mais política e menos desenvolvimento.

Cultura de feedback boa não nasce de palestra. Nasce quando o sistema impede que comentário ruim circule. É isso que o Quality Gate faz.

O problema: 80% dos comentários são vagos ou enviesados

Avaliação 360 média recebe entre 6 e 12 comentários por ciclo. Numa amostra de 4 empresas que olhamos antes de desenhar o Quality Gate, mais ou menos isso aparecia:

  • 40% eram vagos, "foi bem", "manteve o ritmo", "tem evoluído"
  • 20% rotulavam personalidade em vez de comportamento, "é tímido", "é desorganizado", "é arrogante"
  • 15% contradiziam a nota, gestor dava 5/5 e descrevia problema crônico, ou dava 2/5 sem citar um exemplo
  • 10% só falavam das duas últimas semanas (viés de recência) num ciclo de 6 meses
  • 5% tinham linguagem questionável, gênero, idade, sotaque, instituição

Sobra ~10% de comentários acionáveis. O resto vai pro avaliado e gera frustração, mal-entendido ou desligamento.

SBI: o formato que já funcionava em 1996

O Center for Creative Leadership publicou em 1996 o modelo SBI, Situação · Comportamento · Impacto. A ideia é simples: feedback útil precisa descrever um momento específico (S), o que a pessoa fez naquele momento (C, em verbo observável) e qual efeito teve (I, idealmente mensurável).

Compare:

Sem SBI

"É desorganizado, precisa melhorar isso."

Com SBI

"Nas últimas 3 sprints (S), entregou 2 demos sem ter testado o cenário principal previamente (C). O cliente identificou os bugs em apresentação e o release atrasou em 2 semanas (I)."

A diferença é gigante. O segundo é argumentável, refutável, acionável. O primeiro é só uma sentença sobre quem a pessoa é, sem fato, sem prova, sem caminho.

O problema do SBI nunca foi conceitual. Foi aplicação. Treinar gestor pra escrever SBI dá resultado por 6-8 semanas e depois decai. Cobrar SBI em revisão de RH é caro e atrasa o ciclo. A escala mata o método.

Onde IA encaixa: revisão em tempo real

Aqui está o salto. O gestor abre a caixa de texto, começa a digitar, e a IA, no caso do facilita.rh, a Belle, escuta em background. Não interrompe. Não bloqueia digitação. Mas, antes de publicar, ela sinaliza ao lado:

  • Falta situação concreta, qual reunião, qual sprint, qual data?
  • Verbo de personalidade detectado, "é desorganizado" → reformule pra "fez X em Y"
  • Nota 5/5 + comentário com tom negativo → contradição, realinhe
  • Só fala dos últimos 14 dias num ciclo de 180, atenção ao viés de recência

Cada bloqueio vem com uma reescrita sugerida em SBI que o gestor aceita, edita ou rejeita. Se rejeitar com override, o evento fica logado pra auditoria. Não é IA decidindo, é IA pressionando.

O ponto invisível A maioria das ferramentas de avaliação aplica revisão depois do publish, alguém de RH lê uma amostra, devolve, gestor reescreve. Quality Gate inverte: revisa antes. O efeito cultural disso é diferente, o gestor começa a internalizar SBI sem treinamento separado. Em 3 ciclos, a quantidade de bloqueios cai pela metade.

O viés algorítmico, que vale tratar com honestidade

IA revisar feedback de humano pode reproduzir viés? Pode. É preciso desenhar o sistema com 3 contrapesos:

  1. O que IA detecta é texto, não pessoa. Quality Gate marca padrões linguísticos. Nunca diz "esse comentário é sobre fulano X".
  2. Override é permitido e auditado. Gestor pode ignorar e publicar. Mas RH vê em relatório quais alertas foram ignorados e por quê. Se uma pessoa tem alta taxa de override em "linguagem discriminatória", isso vira conversa.
  3. O sinalizador é aberto. Quais regras a IA usa pra sinalizar viés? Estão documentadas, ajustáveis, e o RH pode adicionar termos específicos da empresa (jargões internos, expressões que viraram problema).

O que muda na prática

Em 4 empresas que rodaram Quality Gate por 2 ciclos seguidos:

  • Comentários "acionáveis" subiram de ~10% para ~70%
  • Reclamações no RH sobre devolutiva caíram de média 6/ciclo pra 1-2/ciclo
  • Tempo médio de calibração entre comitê e gestor caiu em ~40% porque cada nota já tinha 1 evidência rastreável
  • NPS interno do ciclo de avaliação subiu de detrator pra promotor em 2 ciclos consecutivos

Não é IA decidindo desempenho. É IA forçando o autor do comentário a fazer o trabalho que sempre se cobrou, descrever fato, não rotular pessoa.

Avaliação ruim destrói confiança mais rápido do que avaliação ausente. Quality Gate existe pra evitar o pior cenário: ciclo aplicado com comentário inutilizável.

O que esperar nos primeiros 3 ciclos

Ciclo 1: os gestores reclamam. "A IA está me corrigindo". Conformidade com SBI sobe pra 50%, mas com ressentimento. Esperado e ok.

Ciclo 2: a quantidade de bloqueios cai. Gestor começa a escrever SBI já na primeira tentativa porque entendeu o padrão. Conformidade chega em 75-80%.

Ciclo 3: vira fluxo natural. Bloqueios viram exceção. O recurso passa a ser usado como "consulta", gestor escreve o que pensou, IA sugere reformulações alternativas, ele escolhe.

O ponto de inflexão é mais ou menos no ciclo 2. Antes disso a IA é vista como obstáculo. Depois, como copiloto.

Quer ver Quality Gate funcionando?

Demonstração de 5 min mostrando IA revisar comentário em tempo real durante avaliação real, com os 7 sinalizadores e a reescrita SBI sugerida.

  Ver demonstração   Comece grátis em 5 min   Solução Quality Gate
Klaus Fuchs
Klaus Fuchs Founder da facilita.etc. 15+ anos liderando gestão estratégica em saúde, educação e organizações sociais. Conduziu acreditações em uma das maiores OSS do Brasil. Escreve sobre o que pratica.