Um modelo de atribuição que encontrou um ponto cego de $216.000 no investimento em marketing

O Dashboard está mentindo para você

Seu dashboard mostra quais canais geram receita. Seu time usa esses números para decidir onde alocar o budget do próximo mês. O processo parece racional — mas o modelo que alimenta esses números está errado.

A maioria das marcas de e-commerce opera com Atribuição Last-Touch, o padrão no Google Analytics e no Shopify. A regra é simples: o canal em que o cliente clicou por último antes de comprar recebe 100% do crédito. Todos os outros pontos de contato da jornada — o anúncio que apresentou a marca, o artigo que construiu o argumento, o e-mail que aqueceu o lead — não recebem nada.

É como dar o troféu de MVP para o jogador que tocou a bola para dentro do gol, ignorando os três que fizeram a jogada inteira — correram pelo campo, criaram o espaço, fizeram o passe decisivo. O gol ainda conta, mas o mérito do placar está errado.

As consequências não são apenas teóricas. Quando o Last-Touch diz que um canal está com desempenho fraco, você imediatamente o corta. Quando diz que está entregando, você escala. Se o modelo utilizado está mentindo, cada uma dessas decisões torna o erro pior.

Para medir exatamente quanto dano isso causa, auditei mais de 35.000 jornadas de clientes multi-touch que geraram $509.237 em receita de um dataset de e-commerce, rodando os mesmos dados em seis modelos de atribuição diferentes para ver onde os números divergiam.

O resultado foi pior do que o esperado: $216.317 — 42,5% da receita total — foram registrados nos canais errados.

Então reconstruí a atribuição do zero.

Ato 1: Os modelos óbvios discordaram entre si

Jornada do cliente Jornada dos clientes nas 3 primeiras etapas do dataset

O primeiro passo foi rodar todos os modelos de atribuição heurística padrão nas mesmas 35.000 jornadas. Esses modelos são baseados em regras — alguém decidiu como o crédito deveria ser distribuído, e a fórmula segue essa decisão mecanicamente.

Modelos heurísticos de atribuição

First-Touch credita 100% da receita ao canal que apresentou o cliente à marca pela primeira vez. É útil para medir awareness — quais canais estão atraindo novas audiências. É inútil para medir o que realmente fecha a venda.

Last-Touch faz o oposto: 100% do crédito para o último clique antes da compra. É o padrão do Google Analytics. Recompensa quem fecha e ignora todo o trabalho feito antes.

Linear divide a receita igualmente por todos os pontos de contato da jornada. Uma jornada de cinco etapas atribui 20% para cada canal. Trata o canal que fechou o negócio de forma idêntica ao canal que criou a consciência pela primeira vez. Útil quando todos os pontos de contato genuinamente importam de forma igual. Terrível quando não importam — o que é a maior parte do tempo.

U-Shape (Posição) dá 40% ao primeiro toque, 40% ao último toque, e divide os 20% restantes por tudo no meio. É um compromisso que reconhece que descoberta e fechamento importam — mas o split 40/20/40 é arbitrário. Alguém escolheu esses pesos; nenhum dado fez isso.

Time Decay pondera os pontos de contato mais recentes com mais peso do que os anteriores. A lógica é intuitiva: um canal que tocou o cliente ontem provavelmente teve mais influência do que um que o tocou três semanas atrás. A taxa de decaimento também é um parâmetro que alguém escolheu — não algo observado pelos dados no comportamento real do cliente.

Comparação de modelos de atribuição heurística

O gráfico acima deixa evidente o problema antes mesmo de qualquer modelo sofisticado. Olhe o TikTok Ads: o Last-Touch atribui apenas $3.839 ao canal — o menor valor de toda a tabela. O First-Touch atribui $25.023. A diferença não é ruído estatístico; é uma divergência de 6x entre dois modelos baseados em regras igualmente simplistas. Quando dois modelos razoáveis chegam a conclusões tão opostas, isso não significa que um deles está certo. Significa que as próprias regras estão impondo histórias que os dados não suportam.

A divergência entre os modelos não era ruído — era um sinal de que as próprias regras estavam impondo uma história que os dados não suportavam.

Modelos baseados em regras refletem pesos pré-estabelecidos. E se os dados tivessem uma história diferente para contar?

Ato 2: Deixando os dados contarem a história

Os dois próximos modelos abandonaram os pesos predefinidos completamente e derivaram o crédito da estrutura das jornadas de clientes observadas.

A Atribuição por Cadeia de Markov trata o dataset como uma rede de transições — um modelo de probabilidade que mapeia o fluxo real de usuários entre canais. Um cliente vai do TikTok para o Google Search, depois para o E-mail e converte — esse caminho se torna um ponto de dado em um grafo probabilístico. Repita isso em 35.000 jornadas, e o grafo codifica como os clientes reais realmente se movem.

Cadeia de Markov

O resultado-chave é o Efeito de Remoção: se eu remover o TikTok Ads da rede completamente, que percentual das conversões totais colapsa? A resposta vem dos dados observados, não de um peso assumido. Canais profundamente integrados em caminhos de sucesso fazem as conversões colapsarem quando são removidos. Canais facilmente contornados mal movem o número. Os dados obtidos são resultado da estrutura das jornadas de clientes.

Os Valores de Shapley partem da teoria dos jogos cooperativos: cada canal é um “jogador” em uma coalizão, e o algoritmo calcula sua contribuição marginal para o resultado compartilhado. Imagine todas as combinações possíveis de canais trabalhando juntos para produzir uma conversão. O Valor de Shapley de um canal é sua contribuição marginal média em todas essas coalizões — o que ele acrescenta quando entra em um grupo que não o tinha. A matemática garante uma propriedade de equidade: nenhum canal é super ou sub-creditado em relação ao que realmente contribuiu. Ao contrário das heurísticas, o Shapley não decide quanto crédito cada canal merece. A matemática deriva isso de cada combinação observada de jornadas de clientes.

Ambos os modelos são computacionalmente mais pesados do que as heurísticas, mas convergem para o mesmo achado estrutural: canais de descoberta — TikTok Ads e Busca Orgânica — são sistematicamente distorcidos pelo Last-Touch. O Efeito de Remoção do Markov mostra que organic_search e paid_search possuem os dois maiores removal effects do dataset — acima de 0,45 cada — enquanto o TikTok, ignorado pelo Last-Touch, apresenta um removal effect de ~0,08, mais que o dobro do que seu crédito proporcional sugeriria. O Last-Touch ignora esses sinais porque só olha para a etapa final.

Efeitos de remoção do Markov

Essa convergência construiu confiança mas nenhum modelo conseguia ver as interações entre canais — se o TikTok prepara os clientes para converter pelo e-mail, ou se uma sequência específica de canais cria efeitos não-lineares invisíveis para a estatística.

Para explicar isso, foi necessário usar técnicas de machine learning.

Ato 3: A máquina encontrou o que a matemática não viu

Treinei um modelo XGBoost — um algoritmo de machine learning que constrói árvores de decisão para encontrar padrões não-lineares — em todas as jornadas convertidas do dataset. O objetivo não era prever a conversão; era entender quais combinações de canais a impulsionam. O XGBoost não assume um peso para o TikTok ou um peso para o E-mail. Ele lê 35.000 jornadas e aprende quais sequências, quais combinações e quais ordenações efetivamente levaram à receita.

Para transformar esses padrões aprendidos em atribuição por canal, apliquei SHAP — uma técnica que torna as decisões do modelo de ML interpretáveis, atribuindo crédito de receita por canal por usuário. Para cada jornada convertida, o SHAP pergunta: quanto cada canal contribuiu para essa conversão específica? Somando tudo, esses dados mostram o impacto de cada canal, permitindo que a empresa tome decisões estratégicas práticas.

Valores de Shapley por canal

O resultado principal: um Erro de Atribuição de 42,5%. Dos $509.237 de receita, $216.317 foram registrados nos canais errados — crédito tomado de canais que realmente constroem intenção e entregue a canais que aparecem no momento certo sem tê-la criado.

O que sustenta esta conclusão?

Email: +318% vs. Last-Touch. Este é o achado mais dramático de toda a análise. O Last-Touch credita $47.216 ao E-mail. O modelo de ML credita $197.573 — uma diferença de $150.357. Por quê essa distância tão brutal? O Last-Touch captura o E-mail quando ele aparece como último clique, mas ignora o caso em que ele atua como canal de fechamento após uma cadeia longa de touchpoints. O modelo de ML detectou um padrão não-linear: E-mail enviado para alguém que já encontrou a marca pela Busca Orgânica ou pelo TikTok gera um lift desproporcional. E-mail frio converte mal. E-mail enviado no momento certo, para uma audiência já aquecida, fecha ciclos. O Last-Touch só enxerga o segundo caso — e ainda assim distorce a magnitude.

TikTok Ads: +440% vs. Last-Touch. O Last-Touch credita apenas $3.839 ao TikTok — o menor valor de todos os canais, equivalente a 0,75% da receita total. O ML credita $20.743. Os clientes raramente convertem na primeira visita vinda de um anúncio do TikTok. Eles descobrem a marca, saem e retornam dias depois por busca direta ou orgânica — onde o Last-Touch dá todo o crédito. O modelo viu a cadeia completa. O TikTok não está falhando em fechar negócios; ele é a razão pela qual os negócios começaram.

Display Ads: +161% vs. Last-Touch. Este é o resultado mais contraintuitivo — e talvez o mais importante para rever premissas. O Last-Touch credita $30.402 ao Display. O ML credita $79.459. Isso inverte a narrativa convencional de que “Display é super-creditado”. O que os dados sugerem é diferente: o Display atua como canal de presença ao longo de jornadas complexas, aparecendo em múltiplos pontos antes da conversão. O Last-Touch captura apenas o último desses pontos e, quando o Display não é o último clique, ignora toda a sua presença anterior. A Análise de Sobrevivência (Ato 4) vai calibrar melhor esse papel — porque capturar presença não é o mesmo que acelerar a decisão.

Facebook Ads: -65% e Instagram Ads: -60% vs. Last-Touch. Juntos, esses dois canais recebem $130.354 pelo Last-Touch. O ML atribui apenas $48.448 — uma diferença de $81.906 de crédito indevido. O padrão é consistente: ambos os canais alcançam usuários nas horas finais antes de uma compra que já ia acontecer. O Last-Touch os premia com crédito total por estarem presentes. O modelo viu o que realmente aconteceu — esses canais não estavam criando intenção, estavam aparecendo na frente dela.

Organic Search: -70% vs. Last-Touch. Este é o achado mais difícil de digerir para qualquer gestor que investiu em SEO. O Last-Touch credita $83.751 à Busca Orgânica — o segundo maior valor. O ML credita apenas $25.371. A explicação não é que SEO não funciona; é que o Last-Touch super-credita SEO porque muitas jornadas terminam em uma busca orgânica pelo nome da marca — uma busca que o cliente faria de qualquer forma, independente de qualquer outro canal. O Markov confirma: o removal effect do organic_search é alto porque ele está presente em muitas jornadas, não necessariamente porque é o canal que as inicia ou as acelera.

Comparativo entre os modelos Atribuição de receita entre modelos. A diferença entre Last-Touch (cinza) e ML/XGBoost (vermelho) representa orçamento mal alocado.

O custo concreto de não fazer nada

O gráfico abaixo traduz a divergência em linguagem de negócio direta: quanto de receita está sendo re-roteirizado quando você substitui o Last-Touch pelo ML.

O custo de não fazer nada

Os números não pedem interpretação — eles se explicam:

E-mail: $150.357 sub-creditado. O canal mais eficaz do mix estava recebendo menos de um quarto do crédito que merecia.
Display: $49.057 sub-creditado. Presente em jornadas complexas, invisível para o Last-Touch quando não fecha o ciclo.
TikTok Ads: $16.903 sub-creditado. Quase cinco vezes mais impacto real do que o dashboard mostrava.
Organic Search: -$58.379 super-creditado. Crédito em excesso pelo aproveitamento de intenção já criada por outros canais.
Paid Search: -$49.543 super-creditado. O mesmo padrão: presente no final da jornada, mas não necessariamente o motor dela.
Facebook Ads: -$45.488 super-creditado. Retargeting colhendo crédito por conversões que já estavam encaminhadas.

O índice de desalocação responde quais canais estão sub ou super-creditados — e em quanto. Mas para um negócio que roda com períodos de payback de CAC, há uma segunda pergunta que os modelos de atribuição não conseguem responder: quando os clientes realmente convertem?

Ato 4: Saber “quando” é tão importante quanto saber “se”

O machine learning padrão trata um comprador que converte em 2 dias de forma idêntica a um que converte em 20 dias. Ambos são rotulados como “convertidos”. Ambos contam igualmente. Para um negócio que roda com períodos de payback de CAC, essa é uma abstração custosa — um canal que fecha clientes de forma confiável em 48 horas tem um perfil de fluxo de caixa fundamentalmente diferente de um que semeia demanda que se paga três semanas depois.

Para responder à pergunta de timing, apliquei uma camada analítica separada: Análise de Sobrevivência — uma técnica da biologia clínica que modela o tempo até um evento, originalmente usada para prever a sobrevivência de pacientes, aqui adaptada para prever o tempo até a conversão.

A mudança-chave de enquadramento está na pergunta que ela faz:

Modelos de atribuição perguntam: esse usuário vai converter?
A Análise de Sobrevivência pergunta: com que velocidade esse canal vai empurrá-lo para a conversão?

Um detalhe metodológico faz isso funcionar corretamente: dados censurados à direita. Usuários que ainda não converteram não são falhas — o ML padrão os descarta como não-conversores e enviesa todos os estimadores de timing para baixo; a Análise de Sobrevivência os mantém no dataset corretamente.

O resultado são as Razões de Risco (Hazard Ratios) — um multiplicador que expressa o efeito de cada canal na velocidade de conversão em relação a uma linha de base. Uma razão de 1,14 significa 14% mais rápido que a linha de base. Uma razão abaixo de 1,0 significa que o canal está sistematicamente estendendo o tempo até a conversão.

Os canais se dividem em dois grupos distintos

Aceleradores são canais com Razões de Risco acima de 1,0 — eles comprimem o caminho até a compra. O E-mail é o exemplo mais claro: uma Razão de Risco de 1,14 significa que clientes tocados pelo E-mail convertem 14% mais rápido que a linha de base. Isso é consistente com o achado do XGBoost — o E-mail não é apenas influente em termos de receita atribuída, é urgente. Quando dispara em um lead já aquecido, fecha o ciclo rapidamente. Paid Search (HR ~1,07) e Organic Search (HR ~1,06) também aceleram a conversão — o que adiciona uma camada de nuance ao achado de super-creditação do Ato 3: esses canais são de fato eficazes em fechar jornadas, mas o Last-Touch os credita por jornadas inteiras que eles apenas finalizaram.

Desaceleradores são canais com Razões de Risco abaixo de 1,0. O Display Ads é o caso mais revelador quando combinado com o Ato 3. O ML mostrou que o Display está sub-creditado em termos de receita atribuída — ele aparece em mais jornadas do que o Last-Touch reconhece. Mas a Análise de Sobrevivência mostra que ele é o único canal com HR abaixo de 1,0, estendendo sistematicamente o tempo até a conversão. Esses dois achados juntos constroem um retrato preciso: o Display tem presença real nas jornadas, mas funciona como canal de reaquecimento lento — amplifica a consideração sem criar urgência. Investir mais nele porque o ML o sub-creditou seria um erro; o canal certo é investir mais nele com as expectativas corretas sobre o que ele faz.

Razões de Risco de Cox por canal de marketing

A implicação de negócio é direta. Se você precisa de caixa esta semana — se está gerenciando uma janela apertada de payback de CAC — aposte pesado nos Aceleradores. Canais com Razões de Risco altas comprimem o tempo entre o gasto e a receita. Se o objetivo é construir pipeline para o próximo trimestre, invista em canais de descoberta com Razões de Risco mais baixas. O papel do TikTok é apresentar a marca a audiências que vão converter eventualmente; forçá-lo a competir por velocidade de fechamento é não entender o que ele faz.

A Análise de Sobrevivência não substitui a camada de atribuição — ela a estende. O Ato 3 respondeu quanto crédito cada canal merece. O Ato 4 responde quando esse crédito chega. Juntas, as duas camadas oferecem uma visão completa da economia dos canais: tanto a magnitude quanto o timing dos retornos.

Pare de adivinhar. Comece a calcular.

Os $216.317 de desalocação que esta análise encontrou não são uma anomalia pontual. Esse valor se acumula em cada ciclo de orçamento que usa o Last-Touch como fonte de verdade. Com base nesta análise, temos três ensinamentos para aplicar:

Realoque o orçamento dos canais super-creditados para os sub-creditados. Facebook Ads e Instagram Ads estão coletando juntos $81.906 em crédito por intenção que não criaram. Organic Search e Paid Search absorvem mais $107.922 de crédito por fechar jornadas que outros canais construíram. O orçamento que flui para eles está saindo diretamente do E-mail e do TikTok — os canais que realmente criam e amplificam essa intenção. Corrigir a atribuição corrige a alocação.

Use a Análise de Sobrevivência para adaptar o mix de canais ao timing de fluxo de caixa. Se o negócio está em um ciclo curto de payback de CAC — gerenciando runway, batendo uma meta trimestral — pondere o mix para os Aceleradores. E-mail com Hazard Ratio de 1,14 fecha mais rápido. Se o objetivo é pipeline para o próximo trimestre, invista em gasto de descoberta que semeia demanda mesmo que não feche esta semana.

Trate o E-mail como multiplicador, não como canal independente. O modelo XGBoost descobriu que o valor do E-mail é quase inteiramente condicional à exposição prévia à marca. E-mail frio converte mal. E-mail enviado para uma audiência que já encontrou a marca pelo TikTok ou pela Busca Orgânica dispara um lift não-linear — e os dados mostram que esse lift vale $150.357 a mais do que o Last-Touch enxergava. A estratégia certa não é mais listas frias — é combinar o investimento em E-mail com gasto de descoberta de topo de funil para que o efeito multiplicador tenha algo a amplificar.

O pipeline completo — Cadeias de Markov, Valores de Shapley, XGBoost e Análise de Sobrevivência está disponível aqui: Repositório no GitHub

Quando a gente escontra dados que nos permitem avaliar com clareza, paramos de adivinhar e começamos a investir corretamente. O retorno sobre o investimento em marketing é a consequência direta deste tipo de decisão estratégica com base em dados.

O Dashboard está mentindo para você#

Ato 1: Os modelos óbvios discordaram entre si#

Ato 2: Deixando os dados contarem a história#

Ato 3: A máquina encontrou o que a matemática não viu#

O que sustenta esta conclusão?#

O custo concreto de não fazer nada#

Ato 4: Saber “quando” é tão importante quanto saber “se”#

Os canais se dividem em dois grupos distintos#

Pare de adivinhar. Comece a calcular.#