Pesquisadores da Carnegie Mellon University desenvolveram um sistema para interagir com alto-falantes inteligentes e outros dispositivos assistidos por voz sem o uso de wake words.
O sistema, que depende de aprendizado de máquina, pode ser a base para uma alternativa segura aos assistentes domésticos sempre ativos.
As novas descobertas foram publicadas em um artigo de pesquisa por uma equipe de pesquisa de quatro pessoas, que também forneceu um vídeo explicando como o novo modelo poderia funcionar.
A pesquisa se concentra no Direção da Voz, uma técnica que determina a posição e o ângulo de onde vem a fala. Isso difere dos dispositivos inteligentes de hoje, que tendem a se concentrar apenas na posição de origem de um som.
A abordagem atual também depende de uma palavra de ativação específica, e é por isso que alterar a palavra de ativação de Alexa para outra só dá a você mais uma ou duas opções.
Quando uma pessoa fala, sua voz cria ecos pela sala, que chegam a um alto-falante inteligente em momentos diferentes. Ao analisar o tempo, o volume e o espectro de frequência do som que cada eco refletido faz, o novo sistema pode prever se um usuário está falando na direção do objeto inteligente ou de costas para ele.
Juntamente com o artigo de pesquisa, a equipe também forneceu um Link GitHub ao conjunto de dados usado para treinar a rede neural. As 11.520 frases únicas no conjunto de dados foram suficientes para treinar um alto-falante inteligente a prever o ângulo que o usuário estava enfrentando com uma precisão de 90 graus.
Os cálculos necessários para determinar a direção são leves o suficiente para serem feitos no dispositivo localmente, sem conectar a um servidor remoto. A equipe de pesquisa por trás das novas descobertas espera que essa abordagem permita interações mais fluidas com dispositivos inteligentes e ofereça mais privacidade aos usuários do que alternativas baseadas em nuvem.
Não há um cronograma de quando essa tecnologia pode aparecer para uso público, mas a base existe para abolir a necessidade de wake words eventualmente. Quando você não precisa mais chamar um alto-falante inteligente pelo nome, ele realmente precisa de um? Talvez Alexa saiba a resposta.
Embora essa pesquisa abra novas possibilidades empolgantes para interagir com dispositivos inteligentes, não é provável que substitua totalmente as palavras de ativação. Afinal, uma das principais vantagens dos alto-falantes inteligentes é que você pode interagir com eles apenas pela voz enquanto realiza outras tarefas.
Talvez prometa um futuro em que vários dispositivos inteligentes possam ser usados no mesmo espaço. Em vez de despertar todos os dispositivos inteligentes ao alcance da voz, você poderia pedir a um único dispositivo para fornecer o boletim meteorológico em silêncio.
Fonte: https://www.makeuseof.com/alexa-thing-of-the-past/