RADAR
Radar
Busca
Tópicos
Timeline

Novo modo avançado do ChatGPT é um super assistente de voz

12/08/2024 | Inteligência Artifical, Smart Speakers

O novo modo avançado de voz do ChatGPT da OpenAI está sendo disponibilizado para alguns assinantes do ChatGPT Plus. Apresentado no evento de lançamento do GPT-4o em maio, foi criticado por soar como Scarlett Johansson e adiado por segurança.

Durante o evento, uma das principais críticas ao novo modo foi o quanto a voz no palco, apelidada de “Sky,” soava como Johansson, que interpretou uma personalidade de IA no filme Her. Embora a voz já estivesse no ChatGPT antes da demonstração da OpenAI, a empresa a retirou pouco antes de Johansson revelar que havia enviado cartas à OpenAI perguntando como a voz foi criada. A porta-voz da OpenAI, Taya Christianson, disse que o novo modo do ChatGPT usará apenas quatro vozes predefinidas feitas com atores de voz, acrescentando: “Fizemos com que o ChatGPT não pudesse imitar as vozes de outras pessoas, tanto indivíduos quanto figuras públicas, e bloqueará saídas que diferem de uma dessas vozes predefinidas.”

O modo avançado estava programado para ser lançado em alfa no final de junho, mas a OpenAI adiou o lançamento por um mês para “atingir nosso padrão para lançamento.” Como parte desse atraso, a empresa disse que estava “melhorando a capacidade do modelo de detectar e recusar certos conteúdos”. Christianson disse que a empresa testou as capacidades do modelo de voz com mais de 100 red teamers externos (pessoas que tentam atacar tecnologias para encontrar falhas). A empresa tem enfrentado muitos questionamentos sobre suas políticas de segurança recentemente, então essa pausa pode ter sido a escolha certa. A OpenAI também “adicionou novos filtros que reconhecerão e bloquearão certas solicitações para gerar música ou outros áudios protegidos por direitos autorais,” disse Christianson.

O novo modo deve estar disponível para todos os usuários do ChatGPT Plus em meados deste segundo semestre.

Enquanto isso, vários clipes já foram postados na internet demonstrando as novas capacidades do ChatGPT de cantar, imitar sotaques, corrigir a pronúncia de idiomas e narrar histórias. O modo avançado é um super assistente de voz com características de conversação quase humanas onde o chatbot pode “expressar emoções”, até mesmo rindo ou chorando.

Em um destes vídeos o ChatGPT está cantando em diferentes estilos, produzindo uma versão blues de “Happy Birthday” e, de forma divertida, tentando imitar como animais, como sapos e gatos, soariam cantando a mesma música. Mas, nesta interação, o mais interessante é a forma natural como flui a conversação.

Modo avançado de voz do ChatGPT

Fonte: The Verge

Posts Relacionados

Marketplace de Projetos

Aqui, você encontrará um portfólio de projetos comerciais publicados pelos veículos da indústria do conteúdo de áudio. Este é o marketplace de oportunidades para as marcas criarem parcerias em eventos, datas comemorativas, programas especiais e de linha.