-
Big Data
O emprego da tecnologia Big Data permite transformar quantidades massivas de dados em conhecimento, oferecendo às empresas a possibilidade de extrair, através dos dados que geram, informações valiosas sobre seus clientes, produtos e serviços, lhes permitindo antecipar-se às tendencias de mercado. Essas tecnologias oferecem a base para produtos analíticos avançados como Bidoop Layer, capazes de realizar análises complexas sobre grandes quantidades de dados, independente de sua natureza ou estrutura.
Desafios
As principais limitações associadas ao tratamento e análise de grandes volumes de dados encontram-se reunidas no denominado “Modelo dos 3 V's”, já apontado em 2001 por Dough Laney, Industry Analyst & Information Innovation Agenda Manager en Garner. De acordo com este modelo, são considerados como principais desafios do Big Data os siguientes atributos:
Velocidade: O incremento na velocidade do processamento de informação permitiu enfrentar o desafio de transformar grandes fluxos de informação em conhecimento em tempo real, respondendo de forma mais rápida às necessidades específicas de cada negócio.
Variedade: A multiplicação das fontes geradoras de informação (emails, redes sociais, imagens, vídeos, logs, etc.) implicou em um aumento na complexidade de análise de dados.
Volume: Na medida em que o volume de dados processados pelas companhias cresce exponencialmente, tornou-se imprescindível desenvolver modelos analíticos capazes de detectar correlações entre dados de diversas fontes de Informação.
Os novos modelos contemplam outros fatores a levar em consideração, como o alto índice de variabilidade dos dados, a necessidade de comprovar sua veracidade, assim como a importância de que sejam visualizáveis através de quadros de controle dinâmicos que facilitem a realização de relatórios e a toma de decisões de negócio.
-
Hadoop
Apache Hadoop é uma plataforma Open Source indicada para o armazenamento e processamento de dados em grande escala. Se caracteriza por sua flexibilidade para armazenar qualquer tipo de informação, por sua capacidade para processar dados complexos e por seu caráter econômico, por não requerer licença de uso.
Hadoop está inspirado nas tecnologias Map&Reduce e Google File System (GFS), implantadas originalmente por Google. Com esta ferramenta algumas companhias mais representativas do mundo conseguiram otimizar a eficiência e qualidade da sua informação aumentando seus benefícios. Amazon, Yahoo, Telefónica e LinkedIn são alguns exemplos.