Dando continuidade à discussão sobre Big Data, o Lab404 prossegue com a leitura do livro de Viktor Schönberger e Keneth Cukier. No oitavo capítulo, “Riscos”, começa-se a mostrar outro lado do Big Data, amenizando um pouco o discurso predominantemente positivo dos capítulos anteriores e apontando alguns problemas e preocupações ao se trabalhar com um grande volume de dados.
Este capítulo, então, é dividido em três partes, indicando justamente alguns possíveis riscos em relação ao uso de Big Data: privacidade, previsões e ditadura do Big Data.
A questão da privacidade – e, em consequência, da vigilância e segurança – é bastante pertinente a partir da crescente ampliação na utilização e digitalização de diversos tipos de dados. Segundo os autores, a partir do aumento da quantidade de dados e da capacidade de processá-los, surgem também novos riscos para a privacidade. Na verdade, o problema está nos novos usos dos dados proporcionados pelo Big Data. O valor de uma informação não se mantém em apenas um uso primário, fazendo surgir também usos secundários não planejados quando o dado é coletado.
Surgem, então, alguns problemas. Não é possível pedir autorização a cada indivíduo em todo tipo de dado coletado, assim como não é coerente pedir autorizações prévias para todo tipo de coleta. O exemplo da previsão de gripe pelo Google, citado em outros capítulos, não existiria caso fosse necessário contatar cada indivíduo isoladamente.
Dentre as discussões em relação à privacidade na web, a questão do anonimato é colocada em evidência. Com diversos tipos de dados disponíveis na web, manter-se anônimo é uma tarefa difícil. Para os autores, a partir de uma quantidade suficiente de dados, um anonimato perfeito é impossível.
Um caso curioso é observado na Alemanha. Depois de protestos em relação ao Google Street View, permitiu-se a alemães que estivessem incomodados com a visualização de suas casas que pudessem borrá-las. Tentando manter maior privacidade e anonimato, o efeito foi inverso: como poucas eram as casas borradas, elas acabavam gerando mais atenção.
Ou seja, algumas das estratégias comumente utilizadas para manter a privacidade – como a permissão individual, o anonimato e a permissão de excluir dados privados – acabam por não funcionar de forma eficiente em um mundo de Big Data. O controle, inclusive, em relação aos diversos dados pessoais coletados diariamente por empresas e governos, por exemplo, é muito baixo. A agência nacional de segurança dos EUA, por exemplo, intercepta quase 2 milhões de e-mails diariamente. É uma vigilância generalizada que, como vemos atualmente, gera diversos problemas diplomáticos para os Estados Unidos.
A vigilância, a partir do Big Data, sofre mudanças. Os dados não são coletados para vigiar todos a todo momento, mas para processar um grande número de informações e, quando há algo suspeito, investigar isoladamente algum indivíduo ou grupo.
As câmeras de vigilância, ao trabalhar com dados em forma de imagens, talvez sejam um exemplo dessa necessidade de uma vigilância em Big Data. Em diversas cidades do mundo, há utilização desse tipo de câmera, desde elevadores em prédios residenciais a praças públicas. De fato, há um forte caráter de vigilância panóptica, bem ao estilo trabalhado por Foucault. No entanto, não se resume a uma ação de vigia generalizada, mas também da necessidade de gerar cada vez mais dados. Como curiosidade irônica, Schönberger e Cukier relatam na introdução deste capítulo que, em 2007, existiam mais de 30 câmeras de vigilância em torno do apartamento em que George Orwell escreveu 1984. O Reuno Unido, inclusive, é um exemplo extremo do uso da “CCTV surveillance”. Por ser um tema de interesse do Lab404, em outro artigo neste site discutimos, a partir da Teoria Ator-Rede e de um trabalho fotográfico, a utilização massiva das câmeras de vigilância em Londres.
Esta discussão nos leva ao próximo “risco” em relação ao uso de Big Data: probabilidade e punição. Trata-se do uso de grande quantidade de dados para prever crimes.
Apesar de se assemelhar com ficções como Minority Report, o uso de tecnologia e Big Data para prever crimes é realidade em certos departamentos de polícia. Segundo os autores, algumas nos EUA já utilizam esse tipo de estratégia para prever quais ruas, bairros, grupos ou pessoas são mais prováveis para crimes e, assim, intensificam a fiscalização policial.
CCTV, Big Data, previsões de crimes, sistemas inteligentes, controle… São conceitos que, muitas vezes, são utilizados de forma combinada e potencializam a vigilância. Extrapolando os exemplos do livro, colocamos abaixo um excelente documentário que trabalha justamente com tais perspectivas, mostrando as potencialidades – e, muitas vezes, falhas – dos sistemas de segurança.
Um dos grandes perigos para as previsões com base em Big Data, de acordo com os autores, é a possibilidade de julgamentos prévios, antes de crimes acontecerem. Eles reiteram: Big Data não funciona para causalidade; ele é baseado, na verdade, em correlações.
Por fim, o terceiro principal risco apontado neste capítulo é a ideia de “ditadura dos dados”. Tende-se, muitas vezes, a se deixar levar pelos resultados apontados por eles, permitindo nos “governar”. Apesar das inúmeras vantagens do Big Data, deve-se relativizar um pouco a importância e fidelidade colocada nos dados, permitindo algumas limitações em sua utilização.
Expostos os riscos, o próximo capítulo é dedicado em como controlá-los. Será trabalhado na próxima semana.