Dados: matéria prima da nova revolução industrial ?
Dados é uma matéria-prima vital da economia da informação, assim como o carvão e o minério de ferro na Revolução Industrial, conforme afirmava uma notícia no New York Times. O mundo dos negócios está apenas começando a aprender a processar tudo.
Segundo o jornal, a quantidade de dados de negócios dobra a cada 1,2 anos, e a próxima etapa vai ser explorar os dados em escala na Internet para descobrir novos negócios e prever mudanças de comportamento do consumidor e do mercado.
Projetos Open Source surgiram também nesta área, o projeto Hadoop teve suas raízes nas empresas da Web, tendo sido conduzido pela Yahoo, e muitas empresas já estão se acostumando rapidamente a ele também, conforme afirmou James Markarian, Vice-presidente executivo da empresa, mas o problema é que as lojas de TI das empresas não podem ter alguns tipos de perícia caseira, isto é amadora.
Hadoop é uma plataforma de software livre, sendo um projeto da fundação Apache que vai sendo construído em Java por uma comunidade de colaboradores.
É um software de computação distribuída voltada para clusters e processamento de grandes massas de dados, sendo inicialmente inspirado pelo MapReduce e GoogleFS (GFS). A Yahoo! foi a maior colaboradora do projeto, utilizando-o intensivamente no seu modelo de negócio.
A informática já tem a capacidade de carregar e recuperar dados de clusters, assim o que Hadoop faz não é necessariamente diferente do que uma série de fornecedores de data warehousing já estão fazendo mas é provável que outros fornecedores que estão preocupados com a horizontalização e integração de dados seguirão este modelo, que além de software livre (que integra a comunidade de desenvolvedores) olha além da ferramenta, para padronização de suas atividades em uma pilha de tecnologias.
Talvez não seja matéria prima, mas apenas insumo ou talvez ainda seja algo para tornar a humanidade mais “re-ligada”.