A inteligência artificial tem transformado diversos setores e a área de áudio e música não é exceção. Um exemplo inovador é o Fugatto, um modelo avançado criado pela Nvidia, que promete mudar a forma como sons e músicas são gerados e transformados. Projetado para atender a uma ampla variedade de necessidades criativas, o Fugatto é capaz de criar sons completamente novos e personalizáveis, combinando tecnologia de ponta com uma abordagem intuitiva e flexível.
O que é o Fugatto
O Fugatto é um modelo de IA voltado para a síntese e transformação de áudio. Ele é treinado para entender instruções em texto e, opcionalmente, processar entradas de áudio. Isso permite que ele gere sons inéditos ou modifique áudios existentes com grande precisão. Por exemplo, o modelo pode criar sons abstratos, como um “saxofone latindo” ou um “coro de ambulâncias”, ou realizar tarefas práticas, como isolar a voz em uma música ou adicionar novos instrumentos a uma gravação. Veja exemplos de aplicação no vídeo de demonstração a seguir.
Ao contrário de modelos anteriores que se limitavam a uma área específica, o Fugatto combina várias funcionalidades em uma única solução poderosa. Isso é possível graças a dois avanços tecnológicos principais:
- Base de dados personalizada: A Nvidia treinou o Fugatto com um enorme volume de dados de áudio (cerca de 50 milhões de horas) e desenvolveu um conjunto de dados especial que conecta sons a descrições em linguagem natural. Isso permite que o modelo entenda as relações entre palavras e sons, ampliando suas capacidades criativas.
- ComposableART: Essa técnica avançada permite que o Fugatto combine ou ajuste instruções de maneira flexível. Por exemplo, ele pode adicionar emoção ou sotaques a vozes geradas, criar sons que não estavam nos dados de treinamento ou compor elementos diferentes de áudio para criar algo totalmente novo.
Benefícios para a indústria criativa
O Fugatto oferece diversas vantagens para executivos e profissionais de setores criativos, como:
- Produtividade para músicos e produtores: Com ele, é possível criar e modificar faixas musicais em questão de minutos, reduzindo o tempo e os custos de produção.
- Novas possibilidades criativas: A capacidade de gerar “sons emergentes” – fenômenos sonoros que não existem na música tradicional – abre um mundo de inovações para produções de cinema, jogos e entretenimento.
- Personalização avançada: Graças ao ComposableART, as empresas podem criar áudios que atendem exatamente às suas necessidades, desde sons para campanhas publicitárias até trilhas sonoras exclusivas.
O futuro da geração de sons
Embora o Fugatto ainda não esteja disponível para o público, a Nvidia já oferece demonstrações que mostram o enorme potencial do modelo. Esses exemplos incluem sons inéditos, como um “violoncelo gritando”, que ilustram a capacidade do Fugatto de transcender as limitações da geração de áudio convencional.
“Com o Fugatto, estamos apenas começando a explorar o impacto que a IA pode ter na criação de sons e músicas. Este modelo representa não apenas uma ferramenta poderosa, mas também uma nova forma de expressão artística e inovação. Para empresas e criativos que buscam se destacar em um mercado cada vez mais competitivo, o Fugatto promete ser um divisor de águas.” diz a Nvidia.
Mais detalhes do Fugatto podem ser vistos aqui.
Fonte: Nvidia / ExtremeTech