RADAR
Radar
Busca
Tópicos
Timeline

Amazon Nova Sonic: novo modelo de IA promete interações por voz mais naturais e inteligentes

08/06/2025 | Inteligência Artifical

A Amazon anunciou recentemente o lançamento do Nova Sonic, um novo Foundation Model (Modelo Fundamental) de inteligência artificial que integra compreensão e geração de fala em uma única arquitetura. A proposta é oferecer experiências de voz mais naturais, fluidas e humanas em aplicações conversacionais.

Uma evolução na IA de voz

Nos últimos anos, a Amazon tem investido fortemente em tecnologias baseadas em voz, desde a assistente pessoal Alexa até os serviços AWS como Lex, Polly e Connect. Com o Nova Sonic, a empresa dá um novo passo ao enfrentar um desafio importante no campo da IA conversacional: capturar a complexidade e a nuance da fala humana.

Conversas humanas envolvem muito mais do que apenas palavras. Elementos como tom, ritmo, pausas e estilo de fala transmitem significados sutis que os modelos tradicionais de IA muitas vezes ignoram. É justamente nesse ponto que o Nova Sonic busca inovar.

Um modelo unificado

Enquanto abordagens convencionais combinam diferentes sistemas – como reconhecimento de fala (speech-to-text), modelos de linguagem e sintetizadores de voz (text-to-speech) – o Nova Sonic unifica essas funções em um só modelo. Essa integração reduz a complexidade do desenvolvimento e melhora a coerência entre o que é dito e como é dito.

Segundo a Amazon, o modelo consegue adaptar suas respostas considerando o contexto acústico da conversa. Isso significa, por exemplo, que o tom do agente pode mudar de acordo com a emoção percebida na fala do usuário, tornando a interação mais empática e realista.

Casos de uso: de turismo a atendimento corporativo

Dois exemplos apresentados pela Amazon ilustram o potencial da nova tecnologia:

  • Assistente virtual de viagem: durante uma conversa sobre uma viagem ao Havaí, o agente de IA detecta uma mudança no tom do usuário – de empolgação para preocupação com os custos – e ajusta sua resposta de forma mais tranquilizadora, oferecendo informações relevantes sobre preços.
  • Assistente empresarial: em um ambiente corporativo, o Nova Sonic pode atuar como um assistente inteligente que acessa relatórios internos, fornece respostas precisas com base em dados da empresa e conduz o diálogo com fluidez, sem exigir comandos explícitos a cada nova interação.

Além disso, o modelo gera transcrições da fala do usuário, permitindo que os desenvolvedores integrem essas informações a APIs e ferramentas externas para criar agentes mais eficientes e contextualizados.

O vídeo a seguir é uma demonstração da aplicação do modelo de IA para o caso de um call center de uma empresa de telefonia celular. Interessante observar não só como a conversa da plataforma com o cliente flui de forma mais natural, mas, também, como é feita a análise em tempo real da fala. Note que na tela do aplicativo há um quadro “Insights” que vai mostrando as intenções e sentimentos do cliente. Estas informações podem ser utilizadas pelo sistema para gerenciar os rumos do atendimento.

Disponibilidade e acesso

O Nova Sonic está disponível por meio de uma nova API no Amazon Bedrock, a plataforma da AWS que reúne diferentes modelos fundamentais. Desenvolvedores também podem explorar os recursos do Amazon Nova acessando o site nova.amazon.com e utilizando o Nova Act SDK, que permite criar agentes com capacidade de ação direta em navegadores web. Mais informações sobre o Nova Sonic podem ser obtidas aqui.

Fonte: Amazon

Posts Relacionados

Marketplace de Projetos

Aqui, você encontrará um portfólio de projetos comerciais publicados pelos veículos da indústria do conteúdo de áudio. Este é o marketplace de oportunidades para as marcas criarem parcerias em eventos, datas comemorativas, programas especiais e de linha.