• Bem-vindo!

    Comecei a blogar em dezembro de 2008 e no início de 2010 lancei a versão atual, resultado de congressos, aulas, workshops e inúmeros projetos realizados nos últimos anos sobre o que o mercado chama de "analytics".

    Aproveite!

  • Hits

    • 57,540 hits
  • categoria

  • posts mês a mês

Investigando a dependência entre variáveis não métricas

Uma das mais recorrentes situações que os profissionais de negócios propõem é verificar quais fatores explicam determinado comportamento do cliente. Buscar e encontrar relações de dependência entre variáveis é um dos temas mais interessantes no universo de métodos quantitativos e normalmente viram cases. Descobrir dependência entre consumo de fraldas e cervejas num supermercado (o mais famoso caso) faz com que o gestor possa realizar promoções eficientes; descobrir dependência entre tempo de relacionamento e lucratividade faz com o gestor crie programas de retenção e relacionamento diferenciados; descobrir relação de dependência entre vendas e investimentos em comunicação permite os gestores de comunicação provar o retorno dos investimentos em mídia; descobrir dependência entre nota de recomendação da marca ao amigo e fidelidade a marca faz com um indicador vire um business e seu criador fique rico e famoso.No universo imenso das relações de dependência dentro das empresas, as que mais seduzem os profissionais são aquelas que envolvem duas variáveis: são diretas, objetivas e todo mundo entende.

Existem basicamente duas ferramentas de análise para verificar a existência de relação de dependência entre duas variáveis:

– análise de correlação linear (para variáveis numéricas)

– teste do Qui-Quadrado (para variáveis nominais e ordinais)

Atenção leitor: o tipo da variável é determinante para escolher o tipo de análise.

Já me perguntaram como é que se calcula a correlação linear para verificar a dependência entre duas variáveis nominais. Digo que não é possível. Para verificar a dependência entre duas variáveis nominais usa-se o teste Qui-Quadrado. Mas como tem gente teimosa neste mundo, a criatividade entra em ação. Exemplos:

“Se for sexo masculino substituo por  10 e se for feminino substituo por 20”;

“Quando aparece faixa etária a gente faz assim. Se for entre 20 e 30 a gente usa 25 (ponto médio); se for acima de 70 anos consideramos 71 anos.”

“Fazemos a mesma coisa com a faixa de renda e se for acima de R$ 10.000,00 a gente troca por R$ 15.000,00 para dar uma margem…”

Voltando ao tema. O coeficiente chi-quadrado ou chi-quadrado, representado por (χ2) é um valor da dispersão para duas variáveis de escala nominal. Ele nos diz em que medida os valores observados se desviam do valor esperado, caso as duas variáveis fossem independentes. Quanto maior o valor do coeficiente chi-quadrado mais significante é a relação entre as duas variáveis analisadas.

Essa “calculeira” toda pode ser feita em softwares especialistas e também no excel.

No excel procure pelas funções TESTE.QUI e INV.QUI, p-valor do teste e valor chi-quadrado respectivamente.

Criei uma planilha já parametrizada para executar algumas configurações de estudos.

Case exemplo

A figura abaixo apresenta um case onde a questão principal da pesquisa era identificar quais variáveis estariam relacionadas com o ticket médio de uma loja de brinquedos. Após vários testes, encontramos a principal variável do estudo: a faixa etária. Os valores de Qui-Quadrado (11,1) e Teste Qui-Quadrado (0,026) garantem que as variáveis faixa etária e ticket médio são dependentes ao nível de 0,05% de significância.

Teste qui-quadrado

Este ponto não é fim da análise como muitos pensam, é o começo. Explico: Descobrir que dentre uma lista de variáveis, aquela com maior associação com o ticket médio já é uma descoberta importante, sobretudo em empresas carregadas de paradigmas que nunca foram testados com profundidade. Ao descobrir que a faixa etária é a principal variável em termos de associação com o ticket médio, “descemos” a análise para as categorias. Aqui decobrimos que quanto maior a faixa etária maior a incidência de ticket médio “acima de R$50,00”.  “E daí?” – sempre me perguntam.  Bom se a faixa etária é a principal variável para o ticket médio e, se quanto maior a idade maior o ticket médio, suas lojas devem se preparar para atender os consumidores mais velhos, pois na sua loja eles trazem mais dinheiro que as outras faixas etárias. Sua loja está preparada para recebê-los? Seus atendentes tem treinamento específico? Os displays possuem letras visíveis? Existem facilitadores de acesso?

Parece simples…mas quem faz?

Para maiores detalhes procure bibliografia específica

(se você quiser receber uma planilha pré-formatada para teste de dependência basta enviar um email para rogerio.carpi@datalogos.com.br)

Anúncios

Entendo mas….e daí?

Essa foi a pergunta de uma aluna do curso da ABEMD a quem dedico este post.

Fizemos uma enquete rápida sobre o nível de satisfação da turma em relação aos serviços prestados pela empresas de telefonia celular. A pergunta era simples: Entre 1 e 10, qual é o seu nível de satisfação com os serviços prestados. Após uma rápida tabulação chegamos a uma média de 6,9 com desvio padrão 1,2. Esse desvio padrão comparado com a média produz um coeficiente de variação de 17% (1,2 / 6,9 * 100). Resumindo: o índice de satisfação está relativamente bom perto de outras enquetes realizadas e o desvio padrão está baixo mostrando que o grupo está homogêneo em relação ao nível de satisfação. Tudo simples até aqui.

Ai veio a pergunta: “- Entendo mas…e daí?”

Respondo de duas formas.

Isso não é relevante, sobretudo se você não tem cultura analítica para tomar decisões. Esses indicadores (média e desvio padrão) serão colocados num powerpoint e cairão no esquecimento rapidinho.

Por outro lado sim, é muito relevante. Pode até ser estratégico. Se você tem cultura analítica e, supomos, tem a gestão e a verba aprovada para fazer um ataque a concorrência irá entender que atacar um concorrente com nível elevado de satisfação (6,9) e ainda por si com alta homogeneidade (1,2) não é uma boa ideia.

Para finalizar criei um modelo metodológico bem parecido com aqueles dos livros de administração de marketing baseado nos níveis de média de satisfação e do desvio padrão sobre dados de satisfação de um concorrente.

Na figura abaixo temos quadrantes que implicam em estratégias diferentes. E você, como usa suas estatísticas mais simples? É um número no powerpoint ou é uma estratégia?

Image

A nova indústria da espionagem explora o consumo

Pessoal, compartilho com vocês a reportagem da Exame de 28/04/2012.

http://exame.abril.com.br/revista-exame/edicoes/1015/noticias/a-nova-industria-da-espionagem?page=3&slug_name=a-nova-industria-da-espionagem

Cada vez mais empresas usam equipes de estatísticos para descobrir as necessidades e os desejos de seus clientes com base na análise matemática de hábitos de compra

São Paulo – A rede americana de supermercados Target, uma gigante com faturamento de 70 bilhões de dólares e 1 800 lojas nos Estados Unidos, tornou-se uma das maiores varejistas do país ao aplicar com sucesso a receita de variedade de produtos a preços baixos.

A logística afiada e a enorme capacidade de espremer seus fornecedores são, no entanto, apenas a parte mais visível da estratégia da empresa. É em sua sede, em Minneapolis, no estado de Minnesota, longe dos olhos de seus milhões de consumidores, que a Target mantém sua grande arma na briga com a concorrência.

Lá, uma equipe de estatísticos trabalha na análise do banco de dados da empresa com uma missão: entender o que cada cliente compra e, principalmente, prever o que poderá comprar. É com base nos achados desse grupo de técnicos que a empresa monta sua estratégia de marketing.

O nível de sofisticação é tamanho que a Target é capaz de identificar, por exemplo, quais de suas clientes estão grávidas — e até quando darão à luz — sem que elas tenham divulgado nenhuma informação a respeito.

A equipe em Minneapolis identificou 25 itens que indicam a gravidez e um alerta aparece no sistema sempre que uma cliente passa a comprar os produtos da lista, que inclui algodão, sabonetes sem cheiro e vitaminas como zinco e magnésio.

Vários estudos de mercado apontam que pessoas que passam por mudanças importantes na vida, como casamento, divórcio, mudança de casa ou expectativa de ter um filho, estão mais propensas a se ligar a uma só loja para fazer compras, em vez de peregrinarem por vários estabelecimentos.

Segundo a análise de seus estatísticos, a Target descobriu que o melhor momento para abordar as grávidas, influenciadas por alterações hormonais, emocionais e também por questões práticas, é a partir do segundo trimestre de gestação.

Depois que as futuras mamães são identificadas, o departamento de marketing da rede passa a bombardeá-las com promoções e correspondências para atraí-las e, se possível, retê-las por anos.

A sofisticada estratégia da Target tem como embrião a regra mais preciosa, e antiga, das relações comerciais. Nada mais fundamental para um bom negócio do que saber o que o cliente quer. Também é desejável saber o que o consumidor ainda nem desconfia que quer, mas vai querer um dia se for abordado da forma correta.

Durante décadas, isso foi praticamente impossível. A busca por informações sobre as preferências dos consumidores fiou-se em métodos analógicos de pesquisa, como aplicação de questionários e entrevistas de satisfação nas lojas. Não mais. A invenção de ferramentas para interpretar as vontades dos clientes, como os cruzamentos de dados da Target, está revolucionando o marketing das empresas.

Softwares poderosos aliados a programas de fidelidade permitem a coleta de muito mais informação sobre os clientes. E o mais importante: permitem que as empresas saibam o que fazer com ela. Chamado de garimpo de dados, ou data mining, o método está se popularizando velozmente e criando uma nova indústria.

Gigantes como IBM, Oracle, SAP e Microsoft já investiram mais de 15 bilhões de dólares na aquisição de empresas especializadas em análise e gerenciamento de dados para oferecer o serviço a redes varejistas, indústrias dos mais variados setores e cadeias de restaurantes.

De acordo com a consultoria IDC, esse é um mercado que deve alcançar um faturamento anual de 17 bilhões de dólares dentro de três anos. “Não há limites para o que esses bancos de dados podem dizer sobre os desejos dos consumidores. É hoje a chave para a estratégia de mar­keting de todas as empresas”, afirma o publicitário dinamarquês Martin Linds­trom, autor dos livros Brand­washed e A Lógica do Consumo.

Muitos consumidores não fazem ideia de que todo esse processo começa por uma ação deles mesmos. São os próprios clientes que fornecem livremente a maioria das informações usadas pelas empresas. Isso acontece, por exemplo, no uso de cartões-fidelidade e de cupons, nos acessos aos sites de comércio e até nos simples registros das compras.

A rede americana de cafeterias Starbucks criou um aplicativo de celular para conhecer melhor seus consumidores. O cliente registra cada compra e, ao completar 15, ganha da Starbucks uma bebida.

As informações fornecidas levam a empresa a saber quais os produtos favoritos de cada consumidor e em que período do dia ele frequenta determinada loja. De posse dessas informações, a Starbucks cria promoções para incentivar os clientes a visitar mais suas unidades.

No Brasil não é diferente. A rede de supermercados Pão de Açúcar reúne dados de consumidores por meio do programa de recompensa Mais, criado em 2000 e que hoje possui mais de 2,6 milhões de clientes cadastrados. Desde o fim de 2010, em parceria com a consultoria Dunnhumby, especializada em coleta e análise de dados, a rede varejista estuda as informações do Mais.

A equipe consegue identificar, por exemplo, quando um cliente deixa de incluir em seu carrinho um produto que costumava comprar. Ou se ele diminuiu sua frequência de compras. Diante disso, a empresa pode falar diretamente com aquela pessoa e enviar promoções por e-mail ou por mala direta para atraí-la.

“O sistema nos permite saber até o que o cliente não gostaria de nos dizer. E isso é muito poderoso”, diz Cristina Serra, diretora de marketing do Pão de Açúcar. As descobertas feitas pela empresa também são vendidas para 19 fornecedores, entre eles Unilever, Proc­ter&Gamble e Colgate.

Nesse jogo de espionagem, as empresas que estão na internet levam alguma vantagem. Cada passo dado por quem navega por um site de compras é facilmente rastreado.

A Diapers.com, braço para o mercado de produtos para bebês da gigante americana do varejo digital Amazon, desenvolveu um sistema capaz de calcular quanto cada novo cliente vai gastar na empresa ao longo de sua vida com base na análise de quais e quantos produtos foram adquiridos no site e de informações como  endereço, sexo e idade.

Com o resultado em mãos, a varejista decide quanto deve investir para direcionar anúncios para cada cliente. Já a gaúcha Renner, que tem presença tanto na internet quanto em lojas físicas, firmou no início do ano passado uma parceria com a Oracle para melhorar o uso de seu banco de dados, cruzando informações de compras feitas nas lojas com comentários sobre moda em sites como Twitter e Facebook.

A Renner espera que, em breve, as informações coletadas no sistema possam ajudá-la a definir que tipo de roupa e tecido deve entrar nas próximas coleções.

Mesmo sem revelar números, as empresas admitem que têm no garimpo de dados dos clientes um ótimo caminho para aumentar seus lucros. A prática, contudo, já é alvo de críticas. Há clientes que consideram que sua privacidade é violada por essas estratégias comerciais e isso pode levá-los a abandonar as empresas — ou até partir para processos judiciais.

Nos Estados Unidos, companhias como McDonald’s, Target, Walmart e Victoria’s Secret já foram processadas por consumidores que se sentiram desrespeitados. Apesar de muito eficientes, tudo indica que os modelos matemáticos desenvolvidos pelas empresas ainda não são capazes de antecipar a propensão de determinados clientes a buscar seus direitos nos tribunais.

Qual técnica de análise multivariada usar?

Essa pergunta é uma das mais frequentes.

Não há uma receita pronta. Não é raro trocar de estratégia durante um projeto. O uso mesclado de técnicas multivariados quase sempre trás resultados excelentes.

Mas é possível ter uma idéia do que vai funcionar dependendo do tipo de problema mercadológico a ser resolvido.

Abaixo uma tabela com uma lista de técnicas para diversos problemas mercadológicos.

Se preferir pode acessar o slide pelo slideshare: http://www.slideshare.net/rogeriocarpi/vinculando-objetivos-com-tcnicas


Linha do tempo da estatística

Diagrama das técnicas multivariadas

O livro Multivariate Data Analysis, a ótima obra sobre técnicas multivariadas, apresenta uma diagrama mostrando a ligação entre os tipos de relacionamento e formatação das variáveis com as diversas técnicas multivariadas.

É um bom guia para ajudar na escolha da técnica mais adequada em cada situação.

Preparei uma versão em powerpoint que disponibilizo para vocês.

Dados IBGE 2010 – SINOPSE POR SETORES

o IBGE acaba de disponibilizar um aplicativo para visualização de dados demográficos por setores e municípios.

http://www.censo2010.ibge.gov.br/sinopseporsetores/