Na quinta-feira, o Reddit está lançando uma nova política destinada a equilibrar seu desejo de licenciar seu conteúdo para grandes empresas de tecnologia, como Googlee protegendo a privacidade dos usuários. A recém-anunciada “Política de Conteúdo Público” agora se juntará à política de privacidade e à política de conteúdo existentes do Reddit para orientar como os dados do Reddit estão sendo acessados ​​e usados ​​por entidades comerciais e outros parceiros. Relacionado a isso, a empresa também anunciou um subreddit dedicado a pesquisadores que trabalham com dados do Reddit.

O anúncio ocorre logo após a estreia do Reddit no mercado de ações, que vê a empresa se posicionando para aumentar a receita não apenas dos anúncios executados em sua plataforma e do uso de API pelos desenvolvedores, mas também de seu corpus de dados. A empresa, em seu prospecto de IPO, disse que já havia faturado US$ 203 milhões por meio de acordos de licenciamento de dados e espera que esse número aumente com o tempo.

Embora o Reddit não tenha historicamente bloqueado o acesso aos seus dados para fins de treinamento de IA, ele mudou seu curso no ano passado. O CEO do Reddit, Steve Huffman, disse ao The New York Times que não fazia sentido para o Reddit continuar a dar “todo esse valor a algumas das maiores empresas do mundo de graça”, sinalizando o plano da empresa de passar para o licenciamento de dados. espaço.

Com esses esforços em andamento, a nova Política de Conteúdo Público bloqueará o acesso aos dados do Reddit sem acordo. (O Reddit diz que não está adicionando novas restrições, apenas divulgando a política que está em vigor internamente há algum tempo.)

“Infelizmente, vemos cada vez mais entidades comerciais usando acesso não autorizado ou abusando do acesso autorizado para coletar dados públicos em massa, incluindo conteúdo público do Reddit”, Reddit escreve em seu blog. “Pior ainda, essas entidades percebem que não têm limitações no uso desses dados e o fazem sem levar em conta os direitos ou a privacidade do usuário, ignorando solicitações legais, de segurança e de remoção de usuários razoáveis. Embora continuemos nossos esforços para bloquear atores mal-intencionados conhecidos, precisamos fazer mais para restringir o acesso ao conteúdo público do Reddit em grande escala a atores confiáveis ​​que concordaram em cumprir nossas políticas. Mas também precisamos continuar a garantir que usuários, mods, pesquisadores e outros atores não comerciais e de boa fé tenham acesso.”

Em outras palavras, o acesso aos dados do Reddit para pesquisa e outros esforços não comerciais continuará, mas as entidades que quiserem usar os dados do Reddit para outros fins – inclusive para treinamento em IA – terão que pagar. Em um gráfico compartilhado no blog, o Reddit deixa isso claro, dizendo que as empresas interessadas em usar os dados do Reddit para “potenciar, aumentar ou aprimorar seu produto para quaisquer fins comerciais” exigem um contrato.

Créditos da imagem: Reddit

Enquanto isso, os anunciantes são direcionados a uma API de anúncios para gerenciar campanhas e acompanhar seu desempenho.

Como a empresa é essencialmente um grande site indexável por mecanismos de busca, esta nova política visa bloquear o conteúdo do Reddit de qualquer coleção não autorizada, ao mesmo tempo que respeita os direitos dos usuários.

Por exemplo, o Reddit diz que seus parceiros terão que enviar as decisões dos usuários para excluir seu conteúdo. Portanto, se os usuários não quiserem que suas postagens pessoais se tornem alimento para futuros mecanismos de IA, eles deverão poder optar por não participar. Os parceiros também estão impedidos pela nova política de usar o conteúdo do Reddit para identificar indivíduos ou suas informações pessoais, inclusive para direcionamento de anúncios. Os parceiros também não podem usar o conteúdo do Reddit para enviar spam ou assediar seus usuários ou para realizar “verificações de antecedentes, reconhecimento facial, vigilância governamental ou ajudar as autoridades a realizar qualquer uma das ações acima”.

A política restringe adicionalmente o acesso à mídia adulta e esclarece que o Reddit não venderá informações pessoais de seus usuários. A empresa também observa que nunca licenciará conteúdo não público, como mensagens privadas ou informações de contas não públicas, como e-mails de usuários ou histórico de navegação, entre outras coisas.

Para ajudar os pesquisadores que desejam usar os dados do Reddit para fins não comerciais, a empresa criou um novo subreddit, r/reddit4pesquisadores. A empresa diz que está fazendo parceria com OpenMined também desenvolver um programa para orientar e aumentar a colaboração de pesquisadores com o Reddit.

Fuente