Como Werner Vogels, CTO da Amazon – um homem que vale incontáveis ​​milhões, que durante a pandemia de COVID-19 comprou completamente o pequeno Airbnb no centro de Amsterdã onde morava – passa seus dias? Ao que parece: criando aplicativos de resumo de reuniões com tecnologia de IA. Vai saber.

Em um publicar esta semana, no blog pessoal de Vogels, ele detalha o Distill, um aplicativo de código aberto que ele construiu com sua equipe “OCTO” (Escritório do CTO) para transcrever e resumir suas teleconferências. O Distill faz uma gravação de áudio de uma reunião (em formatos como MP3, FLAC e WAV), analisa-a e gera um resumo junto com uma lista de tarefas pendentes. Opcionalmente, ele pode divulgar esse resumo e lista para plataformas como o Slack por meio de integrações personalizadas.

Um exemplo de resumo do resumidor de reuniões Distill da Vogel, desenvolvido pela tecnologia Amazon.
Créditos da imagem: Destilar

Como seria de esperar de um aplicativo do CTO da Amazon, a Distill depende visivelmente de produtos e serviços pagos da Amazon para fazer o trabalho computacional pesado. AWS Transcribe realiza a transcrição do Distill; O Amazon S3 fornece armazenamento para os arquivos de áudio da reunião; e Bedrock, o conjunto de desenvolvimento de IA generativo da Amazon, cuida da sumarização.

Mas por que criar um resumidor de reuniões quando existem inúmeras ferramentas que atenderiam ao propósito? Bem, devo imaginar que Vogels pensou, por que não? Ele tem muitos recursos à sua disposição e tempo livre aparentemente suficiente para projetos de programação amadores. De acordo com o blog, ele já está tentando portar a base de código do Distill do Python para o Rust. (Ser o CTO é um bom trabalho, se você conseguir.)

Uma coisa única sobre o Distill é que ele permite selecionar qual modelo de IA realizará o resumo da reunião. Por padrão, é o Sonnet, um modelo de médio porte da família Claude 3 da Anthropic. (A grande participação da Amazon na Anthropic pode ter tido algo a ver com essa decisão de design.) Mas qualquer modelo hospedado em Bedrock funcionará, como o Llama 3 da Meta e os modelos das startups de IA Mistral, AI21 Labs e Cohere.

Vogels não promete que Distill não cometerá erros.

“Lembre-se, a IA não é perfeita”, escreve ele. “Alguns dos resumos que recebemos… contêm erros que precisam de ajuste manual. Mas tudo bem, porque ainda acelera nossos processos. É simplesmente um lembrete de que ainda devemos ter discernimento e estar envolvidos no processo. O pensamento crítico é tão importante agora como sempre foi.”

Eu diria que ter que estar “envolvido” em resumir meio que anula o objetivo de um resumidor automático. Você também pode contratar um estenógrafo. Mas você nunca verá Vogels falando mal da tecnologia que seu empregador está vendendo. E aposto que é por isso que ele ainda é CTO.

Fuente