X.ai, startup de IA de Elon Musk, revelou seu mais recente modelo de IA generativa, Grok-1.5. Definido para potencializar o chatbot Grok da rede social X em um futuro não muito distante (“nos próximos dias”, escreve X.ai em um postagem no blog), Grok-1.5 parece ser uma atualização mensurável em relação ao seu antecessor, Grok-1 – pelo menos a julgar pelos resultados de benchmark e especificações que X publicou.

Grok-1.5 se beneficia de “raciocínio aprimorado”, de acordo com X.ai, especialmente quando se trata de codificação e tarefas relacionadas à matemática. O modelo mais que dobra a pontuação do Grok-1 em um popular benchmark de matemática, MATH, e pontua mais de dez pontos percentuais melhor no teste HumanEval de geração de linguagem de programação e habilidades de resolução de problemas.

É claro que é difícil prever como esses resultados se traduzirão no uso real. Como escrevemos recentemente, os benchmarks de IA comumente usados, que medem coisas tão esotéricas quanto o desempenho em questões de exames de química de pós-graduação, fazem um péssimo trabalho ao capturar como a pessoa média interage com os modelos hoje.

Uma melhoria que deve levar a ganhos observáveis ​​é a quantidade de contexto que o Grok-1.5 pode absorver em comparação com o Grok-1.

Grok-1.5 tem um contexto de 128.000 tokens – “tokens” referindo-se a pedaços de texto bruto (por exemplo, a palavra “fantástico” dividida em “fan”, “tas” e “tic”). Contexto, ou janela de contexto, refere-se aos dados de entrada (neste caso, texto) que um modelo considera antes de gerar a saída (mais texto). Modelos com janelas de contexto pequenas tendem a esquecer o conteúdo até mesmo de conversas muito recentes, enquanto modelos com contextos maiores evitam essa armadilha — e, como benefício adicional, compreendem melhor o fluxo de dados que absorvem.

“[Grok-1.5 can] utilizar informações de documentos substancialmente mais longos”, escreve X.ai na postagem do blog mencionada. “Além disso, o modelo pode lidar com prompts mais longos e complexos, ao mesmo tempo que mantém sua capacidade de seguir instruções à medida que sua janela de contexto se expande.”

O que historicamente diferencia os modelos Grok de X.ai de outros modelos generativos de IA é que eles respondem a perguntas sobre tópicos que normalmente estão fora dos limites de outros modelos, como conspirações e ideias políticas mais controversas. Os modelos também respondem a perguntas com “um traço rebelde”, como Musk descreveu, e com linguagem abertamente rude, se solicitado.

Não está claro quais mudanças, se houver, o Grok-1.5 traz nessas áreas. X.ai não faz alusão a isso na postagem do blog.

Grok-1.5 estará disponível em breve para os primeiros testadores do X, diz X.ai, acompanhado de “vários novos recursos”. Musk já havia sugerido resumir tópicos e respostas e sugerir conteúdo para postagens; veremos se eles chegam em breve.

O anúncio do Grok-1.5 ocorre após o X.ai abrir o código-fonte do Grok-1, embora sem o código necessário para ajustá-lo ou treiná-lo ainda mais. Mais recentemente, Musk disse que mais usuários do X – especificamente aqueles que pagam pelo plano Premium de US$ 8 por mês do X – teriam acesso ao Grok, o chatbot, que anteriormente estava disponível apenas para clientes X Premium+ (que pagam US$ 16 por mês).

Fuente