Cebrap

Repensando a distribuição democrática de dados

Potencial benéfico dos dados pode estar ameaçado pela sua própria infraestrutura
Yasodara Córdova
Flávio Marques Prol
Pixabay
Aa Aa

A ideia de que “dados são o novo petróleo” tem se tornado senso comum. Qi Lu, um dos vice-presidentes da Microsoft, mencionou a ideia no segundo dia da conferência de desenvolvedores da empresa no ano passado para falar do seu potencial valor de negócios. A Intel sugere que dados serão o combustível dos “carros do futuro”. Políticos também têm discutido a ideia. O ativista Alemão do Partido Verde Europeu, Malte Spitz, por exemplo, em seu livro, alerta para a quantidade de dados que as teles coletam. Spitz também estabelece uma correlação entre atividades comerciais de dados com a exploração do petróleo.

Esse paralelo faz sentido, uma vez que o mercado do petróleo se consolidou em um oligopólio mundial, altamente concentrado em poucas famílias e países, ao permitir que grandes empresas, várias delas estatais, detivessem o monopólio de exploração, o que aumentou o custo de entrada no mercado de algumas centenas de milhares para bilhões de dólares, o que parece estar acontecendo com a exploração comercial dos dados. Neste contexto, a ideia de que “dados são o novo petróleo” permite discutirmos transformações na produção e disseminação de dados e como poderíamos tentar desenhar mecanismos para distribuí-los e preservá-los quando for o caso,  de modo mais democrático.

O debate sobre a infraestrutura de dados tem potencial de ser tão relevante como a discussão sobre privacidade dos dados das pessoas e de suas atividades na era digital. Este potencial pode ser realizado caso se perceba que a produção e disseminação de dados se transformou radicalmente com inovações tecnológicas recentes. Neste contexto, riscos e oportunidades se multiplicam. Por um lado, as inovações têm permitido a concentração de bases de dados enormes em atores globais com forte poder de mercado. Por outro, elas abrem espaço para imaginarmos, construirmos e gerirmos dados abertos e transparentes. Além disso, a gestão da produção e distribuição de dados democrática pode contribuir para o conhecimento aberto e para o compartilhamento, o que pode assegurar melhores práticas para a ciência aberta.

Várias tecnologias produzem, acessam e coletam dados com facilidade que seria inimaginável poucas décadas atrás. Para se ter uma ideia, segundo algumas estimativas de 2015, mais de 90% dos dados do mundo teriam sido produzidos entre 2013 e 2015. Além disso, estima-se que por dia os seres humanos produzem 2,5 quintilhões de bytes de dados (o que significa 2,5 seguidos de dezoito zeros).

A Web, a rede de servidores conectados pelo protocolo HTTP que organiza parte dos conteúdos da Internet, é um emaranhado de links e metadados que, além de interagir diretamente com as usuárias, oferece dados em formatos legíveis por máquinas e possibilita a construção de APIs (Application Programming Interface), além de outras técnicas para facilitar o fluxo de dados. Essas APIs facilitam a interoperabilidade de dados, permitindo operações com dados sem a intervenção direta de humanos. É por meio de APIs que redes sociais como o Facebook e o Instagram oferecem “conexões” para que outras empresas tenham acesso aos dados que elas mesmas coletam, possibilitando cruzamentos e a construção de outros softwares. Um exemplo é o Next Analytics, que oferece dados do Twitter. Além disso, uma vez que os dados da Web são públicos, é possível sua utilização por terceiros. Mesmo quando dados da Web são restritos por alguma licença, eles podem ser consumidos e tratados de acordo com parâmetros definidos por quem baixar as bases de dados à revelia do que estiver definido em licenças restritivas. O linkedin, por exemplo, detém a propriedade sobre os dados que coleta dos usuários. Ainda assim,  existe tecnologia capaz de baixar dados do Linkedin, à revelia da licença.

Outra forma bastante disseminada de produção e disseminação de dados é via aplicativos de celular. Como se sabe, o uso do telefone pessoal é massivo. Desde 2012, por exemplo, o Brasil tem mais celulares ativos do que habitantes. Via de regra, os aplicativos de celular coletam dados que vão desde dados do meio ambiente (é o caso do pokemon Go, por exemplo) até dados sobre o sono (caso de despertadores). O uso do celular em si – independentemente de aplicativos – pode ser poderosa ferramenta de produção de dados. Alguns tipos de dados demográficos por exemplo, como idade das pessoas, sexo, entre outras características, antes restritos à institutos de pesquisa, acabam sendo coletados com mais precisão com a utilização de dispositivos desse tipo.

Fora do campo dos dados pessoais, existem outros exemplos. Os satélites, antes exclusividade de exércitos e governos, agora se multiplicam por iniciativas privadas, coletando dados por imagens precisas. Essas imagens permitem que se definam, por exemplo, volumes de rios, quantidade de queimadas realizadas, estado de rodovias, a quantidade e localização de gado em pasto, entre milhões de outros dados.

Outro exemplo é a Internet das coisas, que tem se tornado mais acessível e potencializa a coleta de dados, principalmente em ambientes urbanos. É o caso do Nest, termostato inteligente vendido pela Google, que permite o gerenciamento inteligente de temperaturas dentro de ambientes fechados, através de Inteligência Artificial e dados, que fluem na Internet.

Todas essas tecnologias têm sido utilizadas para mapear uma infinidade de dados sobre preferências, compras e visualizações de pessoas; ruas e rodovias; obter imagens sobre florestas; fazendas; rios; recursos naturais etc. Temos observado a proliferação de algumas empresas de tecnologia que produzem enormes bases de dados e que podem manter para si análises realizadas sobre elas, ou oferecer apenas janelas com visões restritas sobre a interpretação destes dados. O oferecimento de visualizações que não estão acompanhadas de dados brutos é um exemplo disso.

Como é fácil de perceber, essas inovações abrem um grande potencial de produção e acesso a esses dados. Esta produção pode facilitar e beneficiar significativamente a vida de cidadãs. A criação de aplicativos que fazem uso desses dados, como os aplicativos que ajudam motoristas a fugir das vias com mais trânsito, entre tantos outros, é somente um dos exemplos possíveis de serem pensados.

O potencial benéfico dos dados, contudo, pode estar ameaçado pela sua própria infraestrutura, o que estamos chamando de seus mecanismos de produção ou coleta, armazenamento e disseminação. Hoje, esses dados estão sendo produzidos, armazenados e distribuídos geralmente por empresas globais sem qualquer tipo de prestação de contas específica – nacional ou global; formal ou informal.

Um dos motivos pelos quais isso acontece é por conta de um arranjo que ainda não foi mobilizado para regular essa produção e disseminação de dados de modo específico. Em outras palavras, continuamos “aplicando” (quando muito) regras do século XIX e XX sobre propriedade, propriedade intelectual, contratos e concorrência para regular uma atividade humana que é inédita. Para voltar à analogia do petróleo, talvez o que esteja acontecendo hoje com os dados seja semelhante ao uso de regras de propriedade e contrato do século XVII para regular a produção e comercialização do petróleo no início e em meados do século XIX, quando leis específicas sobre regulação do petróleo começaram a surgir.

Duas situações hipotéticas e simplificadas podem facilitar o que queremos dizer por esse arranjo que tem regulado a produção, o armazenamento e a disseminação de dados. Por exemplo, é comum se pensar que se uma empresa tem dinheiro para investir em um satélite que é dela, e se ela é capaz de lançá-lo, é “direito” dela produzir dados, armazená-los e explorá-los como quiser. Um arranjo como esse, como se percebe, depende de um conjunto de instituições jurídicas que estão funcionando: regras de propriedade sobre o satélite (ou contratuais – caso outra empresa seja proprietária do satélite) que determina que a empresa pode fazer o que quiser com ele, inclusive colocá-lo no “espaço”; regras que permitem que uma vez que é o satélite que está produzindo esses dados, eles são de propriedade da empresa que é proprietária do satélite (ou da empresa que contratou o seu uso); regras de contratos que permitem que esses dados sejam comercializados, sem qualquer tipo de controle sobre seu uso.

Outro exemplo simplificado desse arranjo é a assinatura dos famosos termos de uso, que todas assinam quando estão acessando algumas páginas na web e que em tese autorizam essas empresas a coletar, armazenar e disseminar dados. Novamente, várias regras sobre propriedade e contrato se aplicam aqui: temos a ideia de que o termo de uso é equivalente a um contrato; de que um contrato assinado deve ser válido; de que o comércio pode ser realizado diretamente pela empresa “proprietária” dos dados produzidos a partir dos termos de uso e terceiros sem qualquer tipo de prestação de contas, entre outros.

Apesar da simplicidade dos exemplos, eles mostram como um arranjo sobre a infraestrutura de dados trata – ainda que não propositalmente – de temas centrais. É possível organizar esses temas como perguntas: quem são as pessoas e as instituições que podem fazer essa coleta? Quais são os limites da coleta? Os dados são considerados propriedade? Há um regime de permissão/concessão de acesso a esses dados? Caso a coleta e tratamento de dados seja realizada por empresa particular, esta deve abrir os dados para o Estado ou para algum arranjo público? As empresas que exploram esses dados têm que pagar algum tipo de taxa para o governo por sua exploração? As bases são de conhecimento público? Ou são propriedade privada? O governo ou algum tipo de arranjo público pode ou deve fornecer a infraestrutura para que estes dados sejam acessíveis por outras? No que se refere à nacionalidade das empresas que quiserem fazer a coleta, empresas nacionais devem ter preferência ou subsídio?

A ideia de que “dados são o novo petróleo”, nesse contexto, pode fazer com que possamos discutir com mais clareza e transparência como queremos regular um dos recursos mais importantes para a economia do futuro – que parece, neste caso, já ter chegado. Caso seja possível nos inspirarmos na energia que mobilizou vários projetos populares e nacionais sobre o petróleo nos século XIX e XX, talvez possamos até mesmo revitalizar aquela oportunidade perdida para lutarmos por uma sociedade na qual todos os recursos relevantes sejam realmente nossos, das pessoas que em última instância os produzem e os utilizam.

Yasodara Córdova - Fellow do Berkman Klein Center na Universidade de Harvard

Flávio Marques Prol - Pesquisador do Núcleo de Direito e Democracia do Centro Brasileiro de Análise e Planejamento e Doutorando em Direito pela Faculdade de Direito da USP.

Os artigos publicados pelo JOTA não refletem necessariamente a opinião do site. Os textos buscam estimular o debate sobre temas importantes para o País, sempre prestigiando a pluralidade de ideias.

Aa Aa
COMENTÁRIOS

Comentários