5 mitos sobre Big Data

Samuel Arbesman, matemático e cientista de redes, professor da Ewing Marion Kauffman Foundation e autor do livro The Half-Life of Facts, publicou na semana passada um artigo no Washington Post sobre o que é e o que não é Big Data. Segundo o prof. Arbesman, o tema inicia com a promessa do uso de grandes quantidades de informação para nos ajudar a entender melhor o mundo, mas termina com hiperboles. E ele gostaria de esvaziar um pouco a bola dos que discutem o assunto sem muita profundidade, mostrando 5 mitos que perpassam a discussão:
 

1 - “Big Data” tem uma definição clara. O termo, lembra o professor, está em circulação pelo menos desde a década de 1990, quando acredita-se ter originado no Vale do Silício. A IBM oferece uma definição aparentemente simples: Big data é caracterizada por quatro Vs: volume, variedade, velocidade e veracidade. Mas o termo é jogado pra lá e pra cá em tantos contextos - ciência, marketing, política, esportes - que o seu significado tornou-se vago e ambíguo. Ninguém discute que classificar por relevância todas as página da Internet ou pesquisar os registros de todos os telefones dos clientes da Verizon nos EUA qualificam-se como aplicações de “Big Data”. Mas será que implica na necessidade de envolver mais informações do que pode ser processado por um único computador doméstico? Se for assim, análises de marketing não se qualificam, nem a maioria do trabalho feito pelo Facebook. O fato é que há muita confusão e os especialistas da indústria e os cientistas muitas vezes acabam falando apenas uns para os outros.
 

2 - “Big Data” é novo. É verdade, lembra também o professor, que atualmente podemos extrair grandes quantidades de dados – textuais, sociais, científicos e de outros – usando algoritmos complexos e de energia do computador. As ciências utilizam grandes volumes de dados há bastante tempo. No início dos anos 1600, Johannes Kepler usou o conjunto de dados astronômico detalhado de Tycho Brahe para elucidar certas leis do movimento planetário. Pergunte aos estatísticos, e eles vão dizer que analisam grandes volumes de dados há séculos. Para eles, “big data” não passa de uma versão mais sexy da boa e velha estatística, com algumas novas ferramentas que nos permitem pensar mais amplamente sobre o que os dados podem ser e como gerá-los.
 

3 - “Big Data” é revolucionário. Se você está buscando mais publicidade, tudo bem, admite o professor, então “big data” é revolucionário. No geral, porém, é provável que tenha um impacto modesto e gradual em nossas vidas. Quando um fenômeno ou um efeito é grande, normalmente não precisa de grandes quantidades de dados para reconhecê-lo (e a ciência tem se concentrado tradicionalmente sobre esses grandes efeitos). Quando as coisas são mais sutis, um grande volume de dados ajuda. Ele pode nos levar a pequenas peças de conhecimento: como adaptar um produto ou como tratar uma doença um pouco melhor. Se essas peças podem ajudar muita gente, o efeito pode ser grande. Mas revolucionário para um indivíduo? Provavelmente não.
 

4 - Mais é melhor. No campo científico, algumas análises alucinantes de grandes dados estão sendo feitas. E,  no mundo dos negócios, as empresas estão sendo orientadas a "abraçar Big Data antes de seus concorrentes." Mas, alerta o professor, dispor de grandes volumes de dados não é automaticamente melhor. Na verdade, pode ser uma bagunça. A menos que os pesquisadores e analistas consigam reduzir o número de variáveis e tornar os dados mais gerenciáveis, o que teremos é quantidade sem qualidade.
 

5 - Big Data significa o fim das teorias científicas. Chris Anderson argumentou em um ensaio publicado na Wired em 2008, que grandes volumes de dados tornarão o método científico obsoleto: jogue dados suficientes em uma avançada “learning machine”, e todas as correlações e relacionamentos vão simplesmente aparecer. Vamos entender tudo.
 

Mas você não pode simplesmente ir pescar correlações e esperar que elas expliquem o mundo, comenta o professor Arbesman. Se não tiver cuidado, você vai acabar com correlações espúrias. Ainda mais importante: para lidar com o "por que" das coisas, ainda precisamos de ideias, hipóteses e teorias. Se você não tem boas perguntas, os seus resultados podem ser bobos e sem sentido. 


ver todas as Noticias
   Compartilhe
rss twitter facebook linkdin
Indique a um amigo

2015 © Copyright - ABEMD
Associação Brasileira de Marketing Direto
Av. São Luis, 50 - 13.º andar - cj: 132"B"
CEP: 01046-926 - São Paulo - SP - Brasil Tel.: 55 11 3129-3001- Fax: 55 11 3129-4300