4 minutos de leitura

Ainda pouco populares no Brasil, as interfaces de voz ganham cada vez mais força mundo afora. Empresas como Google, Amazon e Apple têm essa tecnologia como principal estratégia em seus projetos. As VUIs (Voice User Interface) promovem a interação do usuário com o sistema, sem a necessidade de tocar ou olhar para o aparelho. Ou seja, é possível usar um dispositivo sem focar a atenção nele. 

Em relação ao mercado, as VUI não param de crescer. A estimativa é que o volume de mercado global em reconhecimento de voz atingirá o montante de $31,82 bilhões de dólares em 2025. 

As interfaces de voz podem ser a partir de assistentes virtuais em uma interface gráfica, ou mesmo como uma opção de falar no lugar da digitação no teclado. Já existem produtos em que somente são aceitos os comando de voz como maneira de interagir. Independente do objetivo, a maneira como as VUI são desenvolvidas é completamente diferente do projeto em interfaces gráficas.

Impactos da VUI no UXDesign

Como farão os  designers para integrar comandos de voz à experiência do usuário da web?  Uma das grandes dificuldades em projetar experiências do usuário em plataformas é manter a coerência entre elementos visuais e comandos de voz. Ou seja: como ajustar a interação entre o que o usuário vê e o que ele pede à plataforma através de sua voz.

Garantir esse fluxo de navegação, integrando comandos de voz, exige antecipação. Ao projetar a plataforma, é preciso considerar todas as perguntas que os usuários podem fazer e também quando as fariam. Tudo no intuito de construir uma navegação agradável e manter a experiência do usuário positiva.

Dá pra imaginar de quantas maneiras se pode fazer uma pergunta?  Cada pessoa pode ter uma forma diferente de questionar a mesma coisa. Como é possível atender a todas essas possibilidades somente com uma resposta?  

Portanto, um primeiro desafio para os UX Designers é imaginar as possíveis conversas entre a máquina e o usuário. Isso inclui as perguntas, respostas, comportamento e “personalidade” dessa máquina. Todo esse plano precisa ser estruturado, como se fosse um fluxo de navegação de site. Só que no formato da interface de voz, não há tanto recurso visual para implementar a experiência do usuário.

O aprendizado de máquina (Machine Learning) permite que as plataformas aprendam com os hábitos do mesmo usuário. Mas um maior engajamento pode ser um fator que dificulte essa consolidação. Tudo porque a complexidade das interações de voz dificultam a navegabilidade, piorando a percepção do usuário nessa tecnologia. Então, como achar essa solução? 

Os caminhos da boa prática em VUI

A verdade é que essa tendência promete mudar a realidade na internet como a conhecemos hoje. A ideia é que a tecnologia permita uma experiência mais inclusiva e diferente daquilo que a grande maioria dos usuários está acostumado. Para isso, algumas práticas no desenvolvimento da interface de voz pode contribuir para facilitar esse novo “encantamento”.

  • Linguagem – Acessível e conhecida dos usuários. Aqui, o design precisa ser simples, que facilite essa interação, como uma forma casual de troca de informações.
  • Integração – Sistemas integrados, como a internet das coisas apontam para grandes oportunidades na aplicação das interfaces de voz. Um exemplo bem conhecido são as smart-homes, que podem se tornar ainda mais inteligentes com a utilização da interface de voz.
  • Menos interação – Dá para sentir isso acontecendo hoje pelo simples fato de que recebemos áudios via WhatsApp que poderiam ser textos de pouquíssimas palavras. Esse input de informação, indica a aceitação e acessibilidade das interfaces de voz. Ou seja, o usuário já considera uma alternativa rotineira a voz como ferramenta.
  • Inclusão – Como suporte para quem não consegue ler,  seja por problemas de visão reduzida ou por analfabetismo, a VUI pode ser uma transformado ferramenta de inclusão. Trazer a tecnologia para todos é mais um ponto que conta para a interface de voz.

Além disso, hoje é mais fácil ter acesso ao conhecimento a partir de campos de aprendizado como o reconhecimento automático de fala (em inglês, automatic speech recognition), compreensão da linguagem natural (natural language understanding), conversão de texto para fala (text to speech) e o inverso, de fala para texto (speech to text).

O futuro das VUI parece se constrói numa trilha repleta de possibilidades e desafios. Resta ver até que ponto os desenvolvedores podem garantir o acerto de todas as funcionalidades desta tecnologia, sem deixar de de lado a maneira como os UX Designers podem criar melhores ideias, reduzindo as falhas na relação da interface com as pessoas. 

Há muita coisa ainda pela frente. Mas nesse sentido, caminhamos com uma grande velocidade , possibilitando uma variedade de cenários onde a VUI pode ser implementada. Pode parecer até presunção, mas pela maneira como segue o fluxo, pode ser a VUI uma das principais responsáveis pela próxima revolução tecnológica.