A relação entre dados abertos e Big Data. O que é? Onde vive? Como se reproduz?

Imagem retirada de www.medium.com (Open Data Handbook, 2018)

Você já ouviu falar de dados abertos? Se você é um entusiasta em data science, provavelmente essa expressão não deve ser tão incomum assim.

Mas afinal, o que são esses dados abertos e de onde eles vêm?

O conceito de dados abertos originou-se com a crença de que a grande quantidade de informações coletadas constantemente pelas entidades governamentais deveriam ser disponibilizadas para todos os cidadãos.

Assim, no final dos anos 2000s, governos e suas entidades começaram a disponibilizar o acesso a esses recursos para um maior número de usuários. A primeira política governamental em Dados Abertos surgiu em 2009.

Dados são considerados "abertos" se qualquer pessoa pode acessar livremente, utilizar, reutilizar e redistribui-los para qualquer fim sem nenhuma restrição. Apesar de uma grande quantidade de dados serem publicados nos websites governamentais, a maioria desses dados são disponibilizados para serem lidos de forma individual, e não utilizados para outros propósitos. Contudo, para ser considerado "aberto", esse dado deve ser reutilizável, ou seja, deve ser possível realizar o download desses documentos em formatos abertos e os usuários têm o direito legal de reutilizá-los.

Quando os dados são amplamente disponibilizados e de fácil utilização, seus benefícios podem ser significativos. Eles podem ajudar os governos na administração de serviços públicos, estimular oportunidades econômicas, incentivar a inovação, melhorar a segurança pública e diminuir a pobreza! E pela própria definição, os dados abertos são excelentes para análise em Big Data.

Agora ficou fácil de entender, não? Então para fixar o conhecimento vamos a uma revisão básica sobre os dados abertos.

P: O que são?
R: São informações coletadas pelo governo e entidades governamentais sobre a sua população.

P: Onde vivem?
R: Em iniciativas governamentais de democratização do acesso à informação pública. 😁

P: Como se reproduzem?
R: Nós mesmos como membro de uma sociedade "alimentamos" o ciclo dos dados aberto, fornecendo informações através dos mais variados órgãos públicos governamentais.


...

Fonte: Open Data in 60 seconds. The World Bank. Disponível em: <http://opendatatoolkit.worldbank.org/en/open-data-in-60-seconds.html>

Comentários