Você já recebeu um "foi bem no semestre" como avaliação? Eu já. Lembro de ter passado meia hora tentando entender o que aquilo queria dizer. O que foi bem? Em qual situação? Comparado a quê? Era elogio ou era checkbox?
Aqui vai uma constatação desconfortável: a maioria das avaliações de desempenho falha não por nota errada, mas por comentário inutilizável. E o comentário inutilizável tem um custo concreto, o avaliado não sabe o que mudar, o gestor perde credibilidade, o ciclo seguinte vira mais política e menos desenvolvimento.
Cultura de feedback boa não nasce de palestra. Nasce quando o sistema impede que comentário ruim circule. É isso que o Quality Gate faz.
O problema: 80% dos comentários são vagos ou enviesados
Avaliação 360 média recebe entre 6 e 12 comentários por ciclo. Numa amostra de 4 empresas que olhamos antes de desenhar o Quality Gate, mais ou menos isso aparecia:
- 40% eram vagos, "foi bem", "manteve o ritmo", "tem evoluído"
- 20% rotulavam personalidade em vez de comportamento, "é tímido", "é desorganizado", "é arrogante"
- 15% contradiziam a nota, gestor dava 5/5 e descrevia problema crônico, ou dava 2/5 sem citar um exemplo
- 10% só falavam das duas últimas semanas (viés de recência) num ciclo de 6 meses
- 5% tinham linguagem questionável, gênero, idade, sotaque, instituição
Sobra ~10% de comentários acionáveis. O resto vai pro avaliado e gera frustração, mal-entendido ou desligamento.
SBI: o formato que já funcionava em 1996
O Center for Creative Leadership publicou em 1996 o modelo SBI, Situação · Comportamento · Impacto. A ideia é simples: feedback útil precisa descrever um momento específico (S), o que a pessoa fez naquele momento (C, em verbo observável) e qual efeito teve (I, idealmente mensurável).
Compare:
"É desorganizado, precisa melhorar isso."
"Nas últimas 3 sprints (S), entregou 2 demos sem ter testado o cenário principal previamente (C). O cliente identificou os bugs em apresentação e o release atrasou em 2 semanas (I)."
A diferença é gigante. O segundo é argumentável, refutável, acionável. O primeiro é só uma sentença sobre quem a pessoa é, sem fato, sem prova, sem caminho.
O problema do SBI nunca foi conceitual. Foi aplicação. Treinar gestor pra escrever SBI dá resultado por 6-8 semanas e depois decai. Cobrar SBI em revisão de RH é caro e atrasa o ciclo. A escala mata o método.
Onde IA encaixa: revisão em tempo real
Aqui está o salto. O gestor abre a caixa de texto, começa a digitar, e a IA, no caso do facilita.rh, a Belle, escuta em background. Não interrompe. Não bloqueia digitação. Mas, antes de publicar, ela sinaliza ao lado:
- Falta situação concreta, qual reunião, qual sprint, qual data?
- Verbo de personalidade detectado, "é desorganizado" → reformule pra "fez X em Y"
- Nota 5/5 + comentário com tom negativo → contradição, realinhe
- Só fala dos últimos 14 dias num ciclo de 180, atenção ao viés de recência
Cada bloqueio vem com uma reescrita sugerida em SBI que o gestor aceita, edita ou rejeita. Se rejeitar com override, o evento fica logado pra auditoria. Não é IA decidindo, é IA pressionando.
O viés algorítmico, que vale tratar com honestidade
IA revisar feedback de humano pode reproduzir viés? Pode. É preciso desenhar o sistema com 3 contrapesos:
- O que IA detecta é texto, não pessoa. Quality Gate marca padrões linguísticos. Nunca diz "esse comentário é sobre fulano X".
- Override é permitido e auditado. Gestor pode ignorar e publicar. Mas RH vê em relatório quais alertas foram ignorados e por quê. Se uma pessoa tem alta taxa de override em "linguagem discriminatória", isso vira conversa.
- O sinalizador é aberto. Quais regras a IA usa pra sinalizar viés? Estão documentadas, ajustáveis, e o RH pode adicionar termos específicos da empresa (jargões internos, expressões que viraram problema).
O que muda na prática
Em 4 empresas que rodaram Quality Gate por 2 ciclos seguidos:
- Comentários "acionáveis" subiram de ~10% para ~70%
- Reclamações no RH sobre devolutiva caíram de média 6/ciclo pra 1-2/ciclo
- Tempo médio de calibração entre comitê e gestor caiu em ~40% porque cada nota já tinha 1 evidência rastreável
- NPS interno do ciclo de avaliação subiu de detrator pra promotor em 2 ciclos consecutivos
Não é IA decidindo desempenho. É IA forçando o autor do comentário a fazer o trabalho que sempre se cobrou, descrever fato, não rotular pessoa.
Avaliação ruim destrói confiança mais rápido do que avaliação ausente. Quality Gate existe pra evitar o pior cenário: ciclo aplicado com comentário inutilizável.
O que esperar nos primeiros 3 ciclos
Ciclo 1: os gestores reclamam. "A IA está me corrigindo". Conformidade com SBI sobe pra 50%, mas com ressentimento. Esperado e ok.
Ciclo 2: a quantidade de bloqueios cai. Gestor começa a escrever SBI já na primeira tentativa porque entendeu o padrão. Conformidade chega em 75-80%.
Ciclo 3: vira fluxo natural. Bloqueios viram exceção. O recurso passa a ser usado como "consulta", gestor escreve o que pensou, IA sugere reformulações alternativas, ele escolhe.
O ponto de inflexão é mais ou menos no ciclo 2. Antes disso a IA é vista como obstáculo. Depois, como copiloto.
Quer ver Quality Gate funcionando?
Demonstração de 5 min mostrando IA revisar comentário em tempo real durante avaliação real, com os 7 sinalizadores e a reescrita SBI sugerida.
Ver demonstração Comece grátis em 5 min Solução Quality Gate