Mishaal Rahman / Autoridade Android
Os assistentes de voz são serviços úteis que permitem verificar a previsão do tempo, definir um alarme, tocar música ou procurar algo totalmente com as mãos livres. O Android dá a você a liberdade de escolher entre vários assistentes de voz, incluindo Google Assistant, Amazon Alexa e, se você tiver um telefone Samsung, Bixby. No entanto, embora o Android permita que qualquer aplicativo se torne o aplicativo assistente padrão, ele não permite apenas que qualquer aplicativo responda a palavras como “Ei Google” em segundo plano. Isso ocorre principalmente por motivos de privacidade, já que seu telefone precisa ouvir constantemente o áudio através do microfone para captar a palavra de ativação designada. Um novo recurso do Android 15 chamado “ativação por voz” poderia resolver esse problema por meio do uso de uma tecnologia de “detecção adaptativa” que preserva a privacidade.
Mishaal Rahman / Autoridade Android
Uma captura de tela da página de aplicativos padrão do Android para definir o aplicativo de assistente digital padrão.
Ao explorar o Android 14 QPR2 beta, descobrimos uma página oculta para aplicativos de ativação por voz (mostrada abaixo). Esta página aparece em Configurações > Aplicativos > Acesso especial a aplicativos e permite designar quais aplicativos concederão a nova permissão de ativação por voz. De acordo com a descrição da permissão, a ativação por voz “ativa aplicativos aprovados, viva-voz, por meio de comando de voz. A detecção adaptativa integrada garante que os dados permaneçam privados apenas para você.”
Mishaal Rahman / Autoridade Android
Atualmente, nenhum aplicativo solicita permissão de ativação por voz, então tivemos que criar um aplicativo simples para solicitá-la e produzir a captura de tela acima.
No final da descrição há um link que oferece “mais sobre sensoriamento adaptativo protegido”, mas o link leva a uma página de suporte do Google que ainda não está ativa. Portanto, não temos certeza de como o sensoriamento adaptativo protegido manterá a privacidade dos seus dados de voz. É possível que esse recurso seja executado no Private Compute Core (PCC) do Android, que consiste no aplicativo do sistema Android System Intelligence para todo o processamento de dados offline, além de Private Compute Services para todas as atividades que exigem acesso à rede. Dessa forma, os aplicativos que solicitam permissão de ativação por voz não precisariam processar nenhum dado do microfone; o PCC captaria a(s) palavra(s) de ativação e ativaria o aplicativo em questão. Esta é principalmente a nossa especulação, no entanto.
Indo mais fundo no código do sistema operacional, encontramos uma menção a uma mensagem de log vinculando essa nova permissão e API à detecção de hotword. Este log informa que o serviço de detecção de hotword será encerrado sempre que a permissão de ativação por voz for revogada de um aplicativo. Não temos certeza se esse recurso de ativação por voz permitirá que os aplicativos sejam ativados com palavras de ativação personalizadas ou apenas com palavras predefinidas, mas pelo menos parece haver uma ligação entre as palavras de ativação e esse novo recurso.
O mais interessante desse recurso é que a nova permissão de ativação por voz pode ser mantida por aplicativos de terceiros. A permissão subjacente, RECEIVE_SANDBOX_TRIGGER_AUDIO
, tem um nível de proteção de “appop|privileged|signature”. O nível de proteção “appop” significa que a permissão não pode ser concedida quando o aplicativo é instalado ou por meio de uma caixa de diálogo de permissão em tempo de execução, mas pode ser concedida se o usuário navegar para o Android. Acesso especial ao aplicativo página, conforme mostrado acima.
Nas versões anteriores do Android, era possível que aplicativos de terceiros fossem ativados quando as palavras de ativação “OK Google” ou “Hey Google” fossem detectadas. No entanto, o Google removeu esse recurso no Android 12 e até fez backport de um patch para o Android 10-11, alegando ser uma vulnerabilidade de segurança. A API atual e a permissão usada para capturar e responder a palavras de ativação permanecem acessíveis apenas para aplicativos do sistema, mas essa nova permissão de ativação por voz não é tão restrita no momento. No entanto, isso pode mudar antes que o recurso de ativação por voz seja lançado.
Mais detalhes são escassos sobre esse próximo recurso, pois ele ainda está em desenvolvimento e provavelmente será lançado com o Android 15. Se o Google acabar abrindo esse recurso de ativação por voz para aplicativos de terceiros, então talvez ele possa ser usado por aplicativos como ChatGPT para acorde pela voz. O aplicativo ChatGPT está se preparando para adicionar suporte para ser definido como o aplicativo assistente padrão, mas mesmo como assistente padrão, você não seria capaz de usar o ChatGPT totalmente com as mãos livres como faz com o Google Assistant. O recurso de ativação por voz do Android 15 pode tornar isso possível.
Amazon Alexa poderia ser outro beneficiário desse recurso, se funcionar como descrevemos. Atualmente, o aplicativo só responde à palavra de ativação “Alexa” enquanto está aberto. Alguns telefones “Alexa Built-in” suportavam a ativação do Alexa em qualquer tela, mas esse programa teve vida curta, pois exigia que o suporte do Alexa wake word fosse integrado especificamente pelo fabricante do dispositivo. Hoje, o Google Assistant e o Bixby nos telefones Samsung são os únicos assistentes virtuais no Android que oferecem suporte à ativação por voz com viva-voz, mas esse recurso do Android 15 pode trazer essa capacidade para mais serviços.