Com tanta euforia em torno da IA generativa, poderíamos pensar que a maioria das pessoas está usando chatbots todos os dias para obter respostas, escrever e-mails e criar novidades. Porém, na verdade, a maioria das pessoas nem sequer usou o chatbot mais popular, segundo o Pew Research Center, que disse, no início deste ano, que apenas cerca de um quarto dos americanos havia experimentado o ChatGPT da OpenAI.
Agora, dentre tantas inovações que estão sendo lançadas para atrair mais usuários, criadores de IA, como Meta, OpenAI, ElevenLabs e Microsoft, anunciaram novas adições de voz as suas plataformas. Eles estão apostando que os usuários ficarão mais interessados em seus chatbots se eles responderem com uma voz famosa, notável ou distinta, como a Siri da Apple ou a Alexa da Amazon.
A Meta anunciou que licenciou vozes para seu chatbot Meta AI dos atores Awkwafina, Dame Judi Dench, John Cena, Keegan Michael Key e Kristen Bell para responder perguntas, “explicar algo sobre o qual você está curioso” ou contar uma piada. “A voz será uma forma muito mais natural de interagir com IA do que o texto”, disse o CEO da Meta, Mark Zuckerberg.
A ElevenLabs, uma plataforma com recursos para transformar texto em áudio (incluindo clonar a própria voz do usuário com base em uma pequena amostra), adicionou a voz do autor New Age Deepak Chopra à lista de vozes icônicas em seu Reader App gratuito. Chopra junta-se a uma lista de “estrelas lendárias” adicionadas em julho, incluindo Judy Garland, James Dean, Burt Reynolds e Sir Laurence Olivier, cujas vozes são usadas para ler livros, artigos, PDFs e outros textos em voz alta. O aplicativo oferece centenas de vozes, em 32 idiomas.
E depois de suspender temporariamente suas vozes de IA em maio, quando a atriz Scarlett Johansson acusou a empresa de copiar seus tons distintivos para uma de suas personalidades de áudio, a OpenAI anunciou uma atualização que adiciona cinco novas vozes (totalizando nove) com sotaques aprimorados. Elas fazem parte do recurso Modo de Voz Avançado, disponível para assinantes do ChatGPT Plus e Team
A Microsoft expandiu as capacidades de IA do Copilot com novos recursos, incluindo a habilidade de ler o conteúdo da tela, fornecer interações por voz e oferecer um raciocínio mais profundo através de uma funcionalidade chamada “Think Deeper”. Além disso, a funcionalidade de voz permite que os usuários interajam em conversas mais naturais, até mesmo interrompendo as respostas.
Enquanto isto, a Amazon não ficou parada e prepara o lançamento da sua nova versão da Alexa para oferecer uma interação mais natural com o usuário.
Fonte: CNET / TechCrunch