A IA está aprendendo com o que você disse no Reddit, Stack Overflow ou Facebook. Você concorda com isso?

July 4, 2024

Publique um comentário no Reddit, responda a perguntas de codificação no Stack Overflow, edite uma entrada da Wikipédia ou compartilhe uma foto de bebê no seu feed público do Facebook ou Instagram e você também estará ajudando a treinar a próxima geração de inteligência artificial.

Nem todo mundo concorda com isso — especialmente porque os mesmos fóruns online onde eles passaram anos contribuindo estão cada vez mais inundados com comentários gerados por IA imitando o que humanos reais diriam.

Alguns usuários de longa data tentaram apagar suas contribuições passadas ou reescrevê-las em rabiscos, mas os protestos não tiveram muito efeito. Um punhado de governos — incluindo o regulador de privacidade do Brasil na terça-feira — também tentaram intervir.

“Uma parcela mais significativa da população simplesmente se sente desamparada”, disse a moderadora voluntária do Reddit Sarah Gilbert, que também estuda comunidades online na Universidade Cornell. “Não há para onde ir, exceto ficar completamente offline ou não contribuir de maneiras que tragam valor para eles e valor para os outros.”

As plataformas estão respondendo — com resultados mistos. Veja o Stack Overflow, o popular hub para dicas de programação de computadores. Primeiro, ele baniu respostas escritas pelo ChatGPT devido a erros frequentes, mas agora está fazendo parcerias com desenvolvedores de chatbots de IA e puniu alguns de seus próprios usuários que tentaram apagar suas contribuições anteriores em protesto.

É uma das várias plataformas de mídia social que enfrentam a cautela dos usuários — e revoltas ocasionais — enquanto tentam se adaptar às mudanças trazidas pela IA generativa.

O desenvolvedor de software Andy Rotering, de Bloomington, Minnesota, usa o Stack Overflow diariamente há 15 anos e disse que se preocupa que a empresa “possa estar inadvertidamente prejudicando seu maior recurso” — a comunidade de colaboradores que doaram tempo para ajudar outros programadores.

“Manter os colaboradores incentivados a fornecer comentários deve ser primordial”, disse ele.

O CEO do Stack Overflow, Prashanth Chandrasekar, disse que a empresa está tentando equilibrar a crescente demanda por assistência de codificação gerada por chatbots instantâneos com o desejo de uma “base de conhecimento” comunitária onde as pessoas ainda queiram postar e “serem reconhecidas” pelo que contribuíram.

“Avance cinco anos — haverá todo tipo de conteúdo gerado por máquina na web”, ele disse em uma entrevista. “Haverá muito poucos lugares onde haverá pensamento humano verdadeiramente autêntico e original. E nós somos um desses lugares.”

Chandrasekar descreve prontamente os desafios do Stack Overflow como um dos “estudos de caso” que ele aprendeu na Harvard Business School, sobre como uma empresa sobrevive — ou não — após uma mudança tecnológica disruptiva.

Por mais de uma década, os usuários geralmente chegavam ao Stack Overflow depois de digitar uma pergunta de codificação no Google e, então, encontravam a resposta, copiavam e colavam. As respostas que eles tinham mais probabilidade de ver vinham de voluntários que acumularam pontos medindo sua credibilidade — o que, em alguns casos, poderia ajudá-los a conseguir um emprego.

Agora, os programadores podem simplesmente perguntar a um chatbot de IA — alguns dos quais já são treinados em tudo o que já foi postado no Stack Overflow — e ele pode dar uma resposta instantaneamente.

A estreia do ChatGPT no final de 2022 ameaçou tirar o Stack Overflow do mercado. Então Chandrasekar criou uma equipe especial de 40 pessoas na empresa para apressar o lançamento de seu próprio chatbot de IA especializado, chamado Overflow AI. Então, a empresa fez acordos com o Google e o fabricante do ChatGPT, OpenAI, permitindo que os desenvolvedores de IA explorassem o arquivo de perguntas e respostas do Stack Overflow para melhorar ainda mais seus modelos de linguagem de IA.

Esse tipo de estratégia faz sentido, mas pode ter chegado tarde demais, disse Maria Roche, professora assistente na Harvard Business School. “Estou surpresa que o Stack Overflow não tenha trabalhado nisso antes”, disse ela.

Quando alguns usuários do Stack Overflow tentaram excluir seus comentários anteriores após o anúncio da parceria com a Open AI, a empresa respondeu suspendendo suas contas devido aos termos que tornam todas as contribuições “perpétua e irrevogavelmente licenciadas para o Stack Overflow”.

“Nós rapidamente abordamos o problema e dissemos: ‘Olha, isso não é um comportamento aceitável’”, disse Chandrasekar, descrevendo os manifestantes como uma pequena minoria entre as “poucas centenas” dos 100 milhões de usuários da plataforma.

A autoridade nacional de proteção de dados do Brasil tomou medidas na terça-feira para proibir a gigante de mídia social Meta Platforms de treinar seus modelos de IA nas postagens do Facebook e Instagram de brasileiros. Ela estabeleceu uma multa diária de 50.000 reais ($ 8.820) por não conformidade.

A Meta, em uma declaração, chamou isso de “um passo para trás na inovação” e disse que tem sido mais transparente do que muitas contrapartes da indústria que fazem treinamento de IA semelhante em conteúdo público, e que suas práticas estão em conformidade com as leis brasileiras.

A Meta também encontrou resistência na Europa, onde recentemente colocou em espera seus planos de começar a alimentar postagens públicas de pessoas em sistemas de treinamento de IA — o que deveria ter começado na semana passada. Nos EUA, onde não há nenhuma lei nacional protegendo a privacidade online, esse treinamento provavelmente já está acontecendo.

“A grande maioria das pessoas simplesmente não tem ideia de que seus dados estão sendo usados”, disse Gilbert.

O Reddit adotou uma abordagem diferente — fazendo parcerias com desenvolvedores de IA como OpenAI e Google, ao mesmo tempo em que deixou claro que o conteúdo não pode ser obtido em massa sem a aprovação da plataforma por entidades comerciais “sem consideração pelos direitos ou privacidade do usuário”. Os acordos ajudaram o Reddit a obter o dinheiro necessário para estrear em Wall Street em março, com investidores elevando o valor da empresa para perto de US$ 9 bilhões segundos após ela começar a ser negociada na Bolsa de Valores de Nova York.

O Reddit não tentou punir usuários que protestaram — nem poderia fazê-lo facilmente, dado o quanto moderadores voluntários têm a dizer sobre o que acontece em seus fóruns especializados, conhecidos como subreddits. Mas o que preocupa Gilbert, que ajuda a moderar o subreddit “AskHistorians”, é o fluxo crescente de comentários gerados por IA que os moderadores devem decidir se permitem ou proíbem.

“As pessoas vêm ao Reddit porque querem falar com pessoas, não querem falar com bots”, disse Gilbert. “Há aplicativos onde eles podem falar com bots se quiserem. Mas, historicamente, o Reddit tem sido para se conectar com humanos.”

Ela disse que é irônico que o conteúdo gerado por IA que ameaça o Reddit tenha sido originado dos comentários de milhões de Redditors humanos, e “há um risco real de que isso possa acabar expulsando as pessoas”.

——

A escritora da Associated Press, Eléonore Hughes, do Rio de Janeiro, contribuiu para esta reportagem.

——

A Associated Press e a OpenAI têm um acordo de licenciamento e tecnologia que permite à OpenAI acesso a parte dos arquivos de texto da AP.

Fuente

A IA está aprendendo com o que você disse no Reddit, Stack Overflow ou Facebook. Você concorda com isso?

LEAVE A REPLY Cancel reply

Recent Post

Avanço da Roma Antiga enquanto cientistas resolvem o mistério de Spartacus

Negociação de DeMar DeRozan: o papel de De’Aaron Fox ajuda os...

Espinho, a praia onde as artes se cruzam | Todo o...

Ministro Sênior de Papua Nova Guiné Preso por Agredir Mulher na...

Festa de aniversário de MS Dhoni! Thala corta bolo com Salman...