Home Notícias Mistral lança Codestral, seu primeiro modelo generativo de IA para código

Mistral lança Codestral, seu primeiro modelo generativo de IA para código

35
0

Mistral, a startup francesa de IA apoiada pela Microsoft e avaliada em US$ 6 bilhões, lançado seu primeiro modelo generativo de IA para codificação, denominado Codestral.

Como outros modelos de geração de código, o Codestral foi projetado para ajudar os desenvolvedores a escrever e interagir com o código. Foi treinado em mais de 80 linguagens de programação, incluindo Python, Java, C++ e JavaScript, explica Mistral em uma postagem no blog. Codestral pode completar funções de codificação, escrever testes e “preencher” código parcial, bem como responder perguntas sobre uma base de código em inglês.

Mistral descreve o modelo como “aberto”, mas isso está em debate. A licença da startup proíbe o uso do Codestral e de seus outputs para qualquer atividades comerciais. Há uma exclusão para “desenvolvimento”, mas mesmo isso tem ressalvas: a licença proíbe explicitamente “qualquer uso interno por funcionários no contexto das atividades comerciais da empresa”.

A razão pode ser que a Codestral foi treinada parcialmente em conteúdo protegido por direitos autorais. Mistral não confirmou nem negou isso na postagem do blog, mas não seria surpreendente; há evidência que os conjuntos de dados de treinamento anteriores da startup continham dados protegidos por direitos autorais.

Codestral pode não valer a pena, em qualquer caso. Com 22 bilhões de parâmetros, o modelo requer um PC robusto para funcionar. (Os parâmetros definem essencialmente a habilidade de um modelo de IA em um problema, como analisar e gerar texto.) E embora supere a concorrência de acordo com alguns benchmarks (que, como sabemos, não são confiáveis), dificilmente é uma explosão.

Créditos da imagem: Mistral

Embora impraticável para a maioria dos desenvolvedores e incremental em termos de melhorias de desempenho, Codestral certamente alimentará o debate sobre a sabedoria de confiar em modelos de geração de código como assistentes de programação.

Os desenvolvedores certamente estão adotando ferramentas generativas de IA para pelo menos algumas tarefas de codificação. Em um estouro de pilha enquete desde junho de 2023, 44% dos desenvolvedores disseram que usam ferramentas de IA em seu processo de desenvolvimento agora, enquanto 26% planejam fazer isso em breve. No entanto, essas ferramentas têm falhas óbvias.

Uma análise de mais de 150 milhões de linhas de código comprometidas com repositórios de projetos nos últimos anos pela GitClear descobriu que as ferramentas generativas de desenvolvimento de IA estão resultando em código mais errado sendo empurrado para bases de código. Em outros lugares, pesquisadores de segurança alertaram que tais ferramentas podem amplificar bugs e problemas de segurança existentes em projetos de software; mais da metade das respostas que o ChatGPT da OpenAI dá às questões de programação estão erradas, de acordo com um estudo de Purdue.

Isso não impedirá empresas como a Mistral e outras de tentarem rentabilizar (e ganhar reconhecimento) os seus modelos. Esta manhã, a Mistral lançou uma versão hospedada do Codestral em sua plataforma de IA conversacional Le Chat, bem como em sua API paga. Mistral diz que também trabalhou para incorporar Codestral em estruturas de aplicativos e ambientes de desenvolvimento como LlamaIndex, LangChain, Continue.dev e Tabnine.

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here