BT

Novidades O InfoQ vem desenvolvendo uma série de novas funcionalidades para melhorar sua experiência com o site. Confira!

LinkedIn é obrigado a liberar a extração de dados de perfis públicos

| por Shelby Switzer Seguir 0 Seguidores , traduzido por Daniel Torrico Seguir 0 Seguidores em 03 out 2017. Tempo estimado de leitura: 4 minutos |

Um juiz federal dos Estados Unidos decretou que a plataforma LinkedIn da Microsoft não pode bloquear a execução de processos automatizados de terceiros para extrair dados de perfis públicos. A decisão, publicada no dia 14 de Agosto, foi tomada por conta de um processo criado pela startup hiQ Labs contra o LinkedIn, após o LinkedIn emitir uma ação judicial para prevenir a startup de coletar seus dados.

A startup HIQ Labs coleta informações publicamente disponíveis de usuários do LinkedIn para ajudar empresas a determinar quais empregados são mais propensos a deixar seus empregos. Esse tipo de coleta de dados viola a proibição contra software de coleta de dados do LinkedIn, e em 23 de Maio de 2017, o LinkedIn enviou uma carta para a hiQ Labs exigindo que a empresa parasse suas atividade de coleta de dados, e ameaçou a tomar medidas alegando Fraude Informática e Ato de Abuso (CFAA). A HiQ Labs processou o LinkedIn, acusando a empresa de comportamento anticompetitivo e de violar o direito de liberdade da empresa de acessar as informações públicas disponíveis. O advogado da startup disse que a hiQ Labs provavelmente iria à falência sem acesso à sua principal fonte de dados. Em sua decisão, o juiz Edward Chen criticou especificamente a "ampla interpretação" do CFAA, que, "se adotado, pode impactar profundamente o acesso livre à Internet, um resultado que pode não ter sido a intenção do Congresso quando promulgou o CFAA cerca de três décadas atrás". O LinkedIn irá recorrer da decisão.

A ordem federal tem implicações sérias para propriedade e privacidade de dados, incluindo a quantidade de controle que as empresas de mídia social têm sobre a informação que seus usuários tornam pública. O argumento da hiQ Labs, de que a limitação de acesso aos dados públicos imposto pelo LinkedIn viola a Primeira Ementa, é construído numa recente decisão da Suprema Corte que equipara os sites de mídia social às praças públicas modernas. Assim como o debate em um tópico do Hacker News enfatiza, ainda não é certo se os usuários de mídias sociais enxergam o ato de postar dados publicamente em mídias sociais como sendo a mesma coisa que publicar esses dados em praças públicas.

Uma perspectiva inesperada sobre a privacidade de dados neste caso da corte é que o LinkedIn argumentou que eles queriam proteger não necessariamente os dados em si, mas o acesso às mudanças nestes dados. O LinkedIn permite que usuários façam seus perfis públicos enquanto, ao mesmo tempo, optam em não compartilhar certas mudanças em seus perfis.

Todavia, a hiQ Labs é capaz de detectar mudanças através de sua extração em massa e usar essas descobertas para alertar empregadores de potenciais atritos com empregados. Enquanto muitos usuários podem entender as implicações de alto nível de publicar seus perfis publicamente, a maioria dos usuários pode nem sempre considerar quais informações esses dados podem produzir - e como isso pode ser usado - quando empresas desconhecidas estão continuamente monitorando atualizações.

David Berlind, editor chefe da "Programmable Web", recentemente escreveu sobre as implicações da decisão para a economia da API. Ele argumenta que o valor dos dados do LinkedIn não é somente os dados em si, mas o modelo de dados por trás dele, e que permitir que bots façam uso dessa organização de dados sem limites enfraquece todo o valor de um produto como o LinkedIn. Além disso, ele argumenta que a decisão força empresas a permitir que processos automatizados contornem suas APIs publicadas, prevenindo uma empresa de "escalar e entender a conexão entre seus dados e o valor que eles estão gerando".

Enquanto o LinkedIn realmente publica APIs, parece que muitos desenvolvedores não as acharam úteis para suas necessidades devido a já conhecida evidência da extração de dados do LinkedIn no mundo da programação. Bibliotecas para coleta de dados Open Source estão disponíveis no GitHub, desenvolvedores conversam sobre este tópico no Stack Exchange e no Quora, e empresas de coleta de dados fornecem tutoriais sobre como coletar dados do LinkedIn. Em 2016, uma empresa pertencente à Microsoft iniciou um processo contra 100 bots não nomeados para coleta de dados, mesmo que nesse caso tenha envolvido bots que buscaram acesso à dados de perfis não-públicos através de contas de usuário falsas. Notavelmente, o LinkedIn está confortável com a coleta por provedores de serviços mais conhecidos e "confiáveis", como motores de busca.

Avalie esse artigo

Relevância
Estilo/Redação

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

Dê sua opinião

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão
Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

Dê sua opinião

Faça seu login para melhorar sua experiência com o InfoQ e ter acesso a funcionalidades exclusivas


Esqueci minha senha

Follow

Siga seus tópicos e editores favoritos

Acompanhe e seja notificados sobre as mais importantes novidades do mundo do desenvolvimento de software.

Like

Mais interação, mais personalização

Crie seu próprio feed de novidades escolhendo os tópicos e pessoas que você gostaria de acompanhar.

Notifications

Fique por dentro das novidades!

Configure as notificações e acompanhe as novidades relacionada a tópicos, conteúdos e pessoas de seu interesse

BT