A xAI, empresa que Elon Musk criou para disputar espaço com a OpenAI em aplicações de inteligência artificial (IA), anunciou que o chatbot Grok terá suporte para “entradas multimodais”. Isso significa que, além de texto, o usuário poderá enviar imagens de vários tipos à ferramenta para que ela gere conteúdo.
Inteligência artificial generativa
Hoje, o Grok segue a mesma dinâmica de funcionamento do ChatGPT e de outras ferramentas de IA generativa baseadas em texto: o uso de prompts. Em outras palavras: entre no chat, digite uma pergunta ou uma instrução e espere o resultado ser apresentado.
Em abril, a xAI revelado pela primeira vez que o Grok teria suporte a “modelos multimodais em vários domínios” a partir da versão 1.5 da tecnologia. Mas não houve mais detalhes a respeito desde então.
Não no blog da empresa. Mas, o Beira observa que, na documentação para desenvolvedores, há um script feito em Python que mostra como o kit de desenvolvimento de software da xAI pode ser usado para gerar conteúdo com base em um arquivo de imagem.
Esse é um recurso interessante porque abre várias possibilidades de uso. Por exemplo, o usuário poderia enviar para o Grok uma foto e pedir para a ferramenta elaborar um texto específico com base nos objetos existentes ali.
Para quando?
Não está claro quando o Grok terá suporte oficial a entradas multimodais, mas é de se esperar que isso aconteça em breve, afinal, a ferramenta precisa evoluir rápido para ter um nível de funcionalidade próximo ao do ChatGPT.
Não estranhe se você tiver ouvido falar pouco ou nada sobre o Grok. A ferramenta foi anunciada pela turma de Elon Musk em novembro de 2023, portanto, é relativamente nova.
Além disso, o acesso ao chatbot requer uma assinatura Premium ou Premium+ do X/Twitter. Esses planos custam R$ 42 e R$ 84 mensais no Brasil, respectivamente.