Como medimos qualidade de citação
A IA cita sua marca com dados corretos? A TIDEX verifica 6 atributos de precisão factual para medir qualidade de citação em LLMs.
Qualidade de citação mede se a IA fala a verdade sobre a sua marca
Qualidade de citação avalia a precisão factual das informações que motores de IA apresentam quando mencionam a sua marca. A gente analisa cada resposta que contém a marca e verifica: o nome está correto? A categoria de atuação está certa? Os serviços descritos existem? A localização bate? Há confusão com concorrentes? Cada item recebe um score de acurácia que compõe o sub-score de qualidade. Segundo o Stanford HAI AI Index Report 2024, mesmo os modelos mais avançados apresentam taxas de alucinação factual entre 3% e 15% dependendo do domínio. Quando essa alucinação envolve dados da sua empresa — preços errados, serviços que não existem, confusão com outra marca — o impacto vai direto na confiança do consumidor. A dimensão qualidade existe justamente pra identificar e quantificar esses erros antes que eles causem dano real ao negócio.
Os 6 atributos que verificamos em cada citação
Pra cada menção da marca nas respostas dos motores, a gente verifica seis atributos específicos. Primeiro, identidade: o nome da empresa está correto, sem variações ou confusões. Segundo, categoria: o motor classifica o negócio na categoria certa (restaurante japonês, não "comida asiática"). Terceiro, localização: endereço, cidade e região estão corretos. Quarto, serviços: os produtos ou serviços descritos realmente existem. Quinto, diferenciais: se o motor cita características específicas, elas são verdadeiras. Sexto, ausência de confusão: a marca não está sendo misturada com concorrentes ou empresas homônimas. Cada atributo é verificado contra as 8 fontes de dados do pipeline — SERP, Google Places, Reclame Aqui, redes sociais, sites de review, diretórios setoriais, conteúdo próprio e testes LLMO. A verificação cruzada entre fontes é o que permite identificar não só erros do motor, mas também inconsistências nas próprias fontes da marca.
Como o pipeline detecta alucinações sobre a marca
O GPT, segundo modelo do pipeline, executa os prompts e captura as respostas brutas. Em seguida, o Claude analisa cada resposta comparando com os dados estruturados que o Gemini coletou na primeira etapa. Quando há divergência — o motor diz que a empresa fica em Copacabana mas o Google Places mostra Botafogo — isso é flagrado como erro factual. A gente classifica os erros em três níveis de severidade: leve (variação de nomenclatura que não confunde), moderado (categoria errada ou serviço inexistente) e crítico (confusão com concorrente ou informação que pode gerar prejuízo). Erros críticos têm peso três vezes maior no score de qualidade do que erros leves. Segundo pesquisa da Edelman 2024, 59% dos consumidores evitam marcas sobre as quais encontraram informações contraditórias. No contexto de IA, onde a resposta parece autoritativa, o dano reputacional de uma alucinação é amplificado significativamente.
Qualidade varia entre motores — e isso importa
Um achado consistente nas análises da TIDEX: a qualidade de citação varia muito entre motores pra mesma marca. Uma empresa pode ter qualidade excelente no Gemini, que puxa dados direto do ecossistema Google (Maps, Business Profile, reviews), e qualidade péssima no ChatGPT, que depende mais de dados de treinamento e fontes de texto. Isso acontece porque cada motor tem acesso a fontes diferentes e usa estratégias diferentes pra responder. O Perplexity, por exemplo, cita fontes explicitamente e tende a ser mais preciso em dados factuais recentes. O ChatGPT é mais fluente mas mais propenso a inventar detalhes. A gente reporta o score de qualidade por motor, além do score agregado, pra que a marca saiba exatamente onde precisa atuar. Em muitos casos, o problema não é a marca — é a fonte que o motor está consultando. Corrigir a fonte resolve o problema na raiz.
O impacto real de qualidade baixa no seu negócio
Uma marca com presença alta e qualidade baixa está em situação pior do que uma marca invisível. Ela aparece, mas com informações erradas — e o consumidor não sabe que são erradas. A gente já viu casos de restaurantes perdendo clientes porque o ChatGPT citava um endereço antigo, clínicas recebendo ligações sobre especialidades que não oferecem, e SaaS sendo comparados em categorias erradas. Qualidade baixa (abaixo de 4 na dimensão) acende um alerta vermelho no relatório da TIDEX. O plano de ação gerado pelo Claude prioriza correções de qualidade antes de investir em aumentar presença, porque não faz sentido aparecer mais se as informações estão erradas. A meta é chegar a qualidade 7+ antes de escalar visibilidade. Segundo a BrightEdge, conteúdo com informações verificáveis tem 2.5x mais chance de ser citado em AI Overviews — então qualidade também alimenta presença de forma indireta.