21 de Junho de 2009

Click Fraud: um dia típico de ataque

8 da manhã. Você chega ao escritório, acessa o Google Analytics e verifica que seu site teve centenas de acessos nessa manhã, 90% a mais do que a média. O seu tráfego vem crescendo abruptamente. Feliz da vida, pensa que o Google finalmente colocou o seu site em 1. lugar nos resultados naturais.

Olha a origem do tráfego, e descobre que 449 acessos vieram do Adwords. Por um momento você gela - será que você mexeu acidentalmente no orçamento diário? Ficou pobre?

Acessa o Google Adwords: 11 cliques. "Ufa", você suspira.


Você resolve acessar pelo Analytics o perfil de tráfego do dia anterior e descobre algo estranho - o tráfego da madrugada é muito mais intenso do que durante o dia, o que não faz o menor sentido, pelo perfil do seu cliente. Além disso, o tráfego parece constante demais para esse horário - 19 cliques / hora por várias horas seguidas.


Tempo de permanência média no site via Analytics? 0:00 - zero minutos, zero segundos para algumas das palavras, justamente as que geraram mais acessos ao site. Mais de 400 acessos com zero segundos? Algo soa mal...


"Fui vítima de click fraud!" Desconfiado, você acessa o relatório de cliques inválidos do Adwords, e descobre que o Google computou 96% de cliques inválidos, isto é, cliques que o Google considerou como de origem fraudulenta e não os debitará de seu saldo.

Parabéns ao Adwords! Ao menos você fica mais tranquilo, já que a ferramenta de detecção de fraude está funcionando. Mas fica a pulga atrás da orelha - e aqueles 14 cliques, foram de fato de clientes ou "passaram" pelo filtro do Google? Claramente você está sendo vítima de um ataque, click fraud em todo o seu explendor. Você fica emocionado - já tinha ouvido falar, mas nunca tinha visto um de forma tão clara, e logo em sua conta. Você então deduz / imagina que:
  1. um concorrente desleal quer queimar o seu orçamento de madrugada, e enfraquecer o seu posicionamento durante o dia;
  2. O concorrente montou um programa para realizar buscas e gerar cliques automaticamente no Adwords, pois é difícil imaginar que ele fique acordado a noite toda e clicando de uma forma tão constante em seus anúncios;
  3. O concorrente não quer que você descubra que ele está fazendo isso, e evita ativar o robozinho durante o dia. Se você tivesse uma ferramenta online que mostra instantaneamente quem está acessando o seu site, descobriria rapidamente algo de esquisito, com gente entrando e saindo imediatamente de seu site o tempo todo.
Através de uma ferramenta no servidor, você descobre que a grande maioria dos acessos vindos do Adwords vem de computadores com o Cookie limpinho. "Isso explica porque o Google Analytics computou todas as visitas como sendo novas", deduz. Você então chega à conclusão que o programinha do seu concorrente realiza uma busca, armazena as URLs com o gclid do Adwords, limpa o cookie do PC ou distribui a URL a outros computadores em rede antes de acessar a sua página através da URL armazenada, procurando com isso enganar o Google. Ele repete então o processo ininterruptamente até as 8 da manhã, com um espaçamento entre o processo (para não chamar muito a atenção? De você ou do Google? Você fica em dúvida).

Você resolve então identificar o safado do concorrente que faz isso. Armazena os IPs de acesso ao servidor, e descobre que cada acesso vem de um IP diferente. Ou o PC do concorrente troca de IP o tempo todo, ou você está lidando com uma rede de computadores, ou o concorrente usa um proxy que troca constantemente de endereço. A maioria vem de 187.26.X.X. Dá para filtrar? Depois de pesquisar por centenas de IPs, você descobre que nem sempre os endereços pertencem ao mesmo range de IPs. "Droga, não vou conseguir filtrar o safado pelo IP", você pensa. IP lookup? Parece que a maioria dos IPs pertencem à Claro, logo deduz que seu desafeto arrumou um 3G para fazer a jogadinha dele. Ah, e todos os acessos vêm de sua cidade, pelos dados do Analytics.

Procura engajar o Google em sua luta contra o psicopata do seu concorrente. Descobre que, caso acredite que alguns cliques tenham passado pelo filtro de cliques inválidos do Google, deve reportar o fato através do link http://www.google.com.br/adwords/adtrafficquality/contact.html. Ok que o google identificou muitos cliques inválidos, mas será que identificou todos? Dá para provar? Será que o insano do concorrente não está fazendo testes e descobrirá em breve como dobrar o sistema de detecção de cliques inválidos?

Você se indaga se o Google também descarta "impressões inválidas" de forma a não prejudicar o CTR do anuncio, já que você percebe um CTR absurdamente abaixo do normal para a média que está acostumado, mesmo para outros grupos de anúncio da mesma conta, o que, você pensa, afeta negativamente o índice de qualidade do anúncio.


Seus amigos morrem de medo de ver seus concorrentes clicando em seus anúncios e acabar com o orçamento, e vários deles nem anunciam por esse temor. Geralmente você não se preocupa com isso, e até brinca com eles que isso é benéfico, pois um CTR alto ajuda no índice de qualidade. Mas com cliques a custo estratosférico e um ataque um pouco mais elaborado como este, você teme que de fato possa estar sendo prejudicado. Afinal, em alguns dias atípicos você tem um grande número de cliques e o telefone não toca. Recomenda então aos amigos para ficar sempre de olho nos dados do Analytics e compará-los ao Adwords.

Vai para casa depois de um dia excitante e ao mesmo tempo estressante. Toma um Carmenere chileno, fica pensando em como pegar o safado amanhã. Bola em sua cabeça uma série de alterações na campanha, pensa em desenvolver outros programinhas para tentar bloquear o crápula. E tem a certeza de que o seu concorrente fará a mesma coisa...

ZZZZZZZZZZ......

19 de Março de 2009

Mudando a regra no meio do jogo...

Mais uma de justiça... Recebi outro dia uma solicitação desesperada que me deixou preocupado com o efeito que o Google (o mesmo vale para os demais search engines) pode ter na vida de uma pessoa. Como mencionei anteriormente, o Google passou a ler documentos scaneados PDF e indexar seu conteúdo. Pois bem, uma série de Ofícios de execução penal como os do site da Procuradoria Federal dos Direitos do Cidadão que se encontravam online para consulta passaram para o índice do Google. Louvada seja a transparência que a justiça alcançou com essa ação, causou também o seguinte caso:

Na década de 90,uma jovem havia sido levada à Europa para trabalhar como camareira, que acabou por ser outro daqueles casos de prostituição forçada, escrava sexual. Só conseguiu sair de lá fugindo, segundo o processo judicial. O seu nome consta como réu / vítima em um processo iniciado alguns anos depois. Esse documento scaneado encontra-se online para pesquisa, e agora seu texto foi indexado pelo Google. Uma busca pelo nome dessa pessoa traz exatamente esse documento judicial em primeiro lugar, mostrando o caso de prostituição em que essa pessoa se envolveu 10 anos atrás.

A favor do Google, conta o fato de que o documento está online, com acesso a todos. Mas quem vincularia tão facilmente o nome dessa pessoa a um caso de 10 anos atrás não fosse pelo Google? Provavelmente, quando o documento foi posto online, não havia a preocupação com a indexação de seu conteúdo. Esse processo arrasta-se desde 2002 - se essa pessoa sequer imaginasse que seu nome poderia vir a ser associado a prostituição por qualquer um que pesquisasse por seu nome em 2009, jamais teria se envolvido no processo. Imaginem o efeito que isso pode ter daqui para a frente - qualquer réu / vítima de processos delicados como o acima vai pensar 1000 vezes antes de mover um processo, com medo de ter de carregar isso para o resto da vida, tendo seu nome associado a fraudes, prostituição ou coisas piores no Google.

É prática comum pesquisar pelo nome de pessoas na internet, tanto para empregos quanto relacionamentos. Imaginem se essa pessoa chegou a casar e o marido descobre o acontecido anos depois, ou se a pessoa é demitida de seu trabalho pelo fato dessa notícia ter vindo à tona, ou mesmo o constrangimento que ela pode vir a sofrer entre sua rede de relacionamentos.

Como empresa de SEO, podemos montar uma estratégia para empurrar para baixo esse resultado, mas não removê-lo por completo, até por ser um documento de um site forte da justiça federal. O que mais me preocupa neste caso é o fato das regras terem sido mudadas no meio do jogo, e poder deixar vulnerável uma infinidade de outros casos iguais a este, com o passado voltando-se com tudo contra a pessoa...

15 de Março de 2009

SEO X advogados

Esta semana recebi uma pergunta curiosa: "É contra a lei ter um link apontando para um site?" Com uma grande experiência no mercado de tecnologia, esse meu amigo tem um site com serviços que presta e informações úteis, como um diretório de Fabricantes de Equipamentos de Comunicações em Rede.

(nota: depois da publicação deste post, o proprietário do site acabou por remover qualquer referência a fabricantes da página em questão)

Não é que um advogado resolveu encrencar com essa pessoa, e mandou-lhe uma série de notificações, de onde extraí o trecho mais curioso da última (tirei o nome da empresa):

"...
Com relação a página "acervo/fabricantes" constatamos que o nome xxxxx ainda está relacionado nos links lá existentes, os quais dão acesso ao site da empresa xxxxx, induzindo que existe entre as empresas xxxxx e YYYYYYYYY relações de parceria.
...
Era o que nos cumpria esclarecer, reiterando que se a notificação não for plenamente atendida, V.Sas. incorrerão nas sanções cabíveis à espécie.
"

Ah, vai... Entrem na página e avaliem se existe alguma sugestão, por menor que seja, de uma "parceria" com alguma das empresas mencionadas. E o que serão essas "sanções cabíveis à espécie", não dá para ser mais específico? Será que uma página de diretório de fabricantes caracteriza alguma infração? E se esse advogado se empolga e começa a remover todo o tipo de links que apontam para o site dessa empresa?

Se eu fosse esse advogado, mudaria um pouco o texto para algo como:

"Com relação a página "acervo/fabricantes" constatamos que o link direcionado para o site xxxx não apresenta a informação "lider tibetana em pabx" em seu anchor text, não destacando a posição de liderança neste país tão oprimido pela gigante China. Era o que nos cumpria esclarecer, reiterando que se a notificação não for plenamente atendida, V.Sas. incorrerão nas sanções cabíveis à espécie."

Every link is a good link...




4 de Janeiro de 2009

O Google (Adwords) põe as garras de fora

Sempre me impressionou a leveza como o Google levava o seu negócio Adwords. Não sei há quanto tempo esse texto existe, mas só esta semana reparei numa mudança de postura nos e-mails enviados pelo Google a anunciantes com problemas de pagamento no cartão de crédito, com um texto um pouco mais forte:

"Entramos em contato com você recentemente a respeito de um saldo vencido para sua conta do AdWords XXXXXXXXX. O saldo pendente é a quantia de BRL XXXX.XX para esta fatura, com um saldo pendente geral de BRL XXXX.XX na conta. Se não recebermos o pagamento integral em quinze dias, encaminharemos sua conta para nossa agência de cobranças externas."

Em época de crise, até o Google parece estar disposto a colocar clientes "no pau" para receber pagamentos atrasados. :-)

15 de Novembro de 2008

Aspas na pesquisa em uma palavra?

A idéia da utilização de aspas em uma pesquisa é fazer com que o Google encontre termos aonde as palavras entre aspas encontrem-se adjacentes e naquela ordem, fornecendo resultados mais específicos. A princípio, não faz o menor sentido fazer pesquisas com palavras individuais entre aspas, mas isso não é bem verdade.

Em minha entrevista com o Pedro Dias, do Google, conversei com ele sobre o fato do Google cada vez mais ampliar os resultados de buscas para sinônimos, variações, abreviações, stemming. Na maioria dos casos isso pode ajudar o usuário a achar mais facilmente o que procura, mas em outros pode encher a tela de resultados que não queremos. Uma das formas que costumo usar para refinar ainda mais as buscas e evitar esses "palpites" do Google é usar aspas em uma única palavra.

Por exemplo, para o Google (e para todos nós), cão e cachorro são sinônimos. O Google pode exibir em sua tela de resultados resultados tanto para um termo quanto para o outro, independente da palavra buscada. Se por acaso estivermos fazendo uma pesquisa para ocorrências da palavra-chave CACHORRO, os resultados podem vir contaminados por ocorrências da palavra CÃO ou outras variações, traduções, abreviações, plurais. Para filtrar esse tipo de busca, faça a busca com a palavra "CACHORRO" entre aspas. comida "cachorro" não deverá trazer por exemplo ocorrência de sites falando de comida para CACHORROS, CÃES, CÃO, etc. O exemplo foi bem tosco e nada prático, mas esse tipo de pesquisa pode ser bem útil em muito casos, quando você sentir que o Google está se metendo um pouco demais na tua pesquisa :-). Se você estiver na cidade de Poá-SP atrás de um Boteco, digite por exemplo bares em poa para ver os resultados :-)

Nota: Como o Pedro frisou nos comentários, o mesmo resultado pode ser obtido digitando-se + na frente da palavra que não queremos que sofra "palpites" do Google.

31 de Outubro de 2008

Google agora lê imagens em PDF

O Google já lê e indexa arquivos em PDF há um bom tempo, mas ontem anunciaram em seu blog oficial que agora conseguem ler - e indexar - o conteúdo de texto scaneado em PDFs. Enquanto antes o Google somente conseguia indexar o conteúdo de arquivos em PDF que estivessem em formato de texto, agora consegue fazer OCR (Optical Character Recognition) nos documentos, isto é, interpretar o texto em imagem e transformá-lo em um documento texto, como .doc ou .html.

Disso para começar a interpretar texto em imagens GIF / JPG é um passo, e isso pode se tornar mais um fator relevante em um trabalho de SEO, pois é mais texto para ser levado em consideração pelo Google em seu algoritmo. Sem contar que pode ser a saída da obscuridão total para aqueles sites feitos todos em imagens por webdesigners sem o menor conhecimento de SEO, que ainda são freqüentemente encontrados na internet. No post do Google, eles citam o seguinte exemplo. Notem que a opção "View as HTML" permite ver como o Google interpretou o texto.

13 de Outubro de 2008

Display Ad Builder - banners mais faceis para todos


O Google está para lançar o Display Ad Builder, que pode ser traduzido por ferramenta de criação de anúncios de imagem (banners) para sua rede de conteúdo. Veja aqui um rápido tutorial sobre a ferramenta, que ainda não está disponível no Brasil, ou ao menos na minha interface Adwords. O Display Ad Builder, a meu ver, pode dar uma boa mexida no mercado de banners online em sua rede de conteúdo.

Enquanto fazer um anúncio de texto é um processo rápido que não requer grandes conhecimentos, fazer um banner requer alguém com experiência em Photoshop ou similar, encarecendo custo e dificultando o acesso a muitos anunciantes. Com isso, o custo de veiculação dos banners é relativamente baixo, comparado à visibilidade que pode dar aos anunciantes.

Com a nova ferramenta, o Google disponibilizará uma ferramenta online para a criação de banners diretamente acessada pela interface web do Adwords. Quem ganha com isso? Todos os pequenos anunciantes que se arriscarem a entrar na rede de conteúdo (eu pessoalmente só entro lé em poucos e selecionados casos), e obviamente o Google, que verá a sua receita subir com o aumento dos valores dos cliques para banners, natural conseqüência do aumento de anunciantes.
Em época de crise, qualquer dolar a mais ajuda no bottom line :-)