O NotebookLM da Google foi desenvolvido para ajudar o usuário a entender informações complexas. Quando ele carrega suas fontes, o NotebookLM instantaneamente “se torna um especialista”, fundamentando suas respostas no material fornecido, com citações e trechos relevantes.
Em meados deste ano o NotebookLM se expandiu globalmente e passou a usar as capacidades multimodais do Gemini 1.5 para oferecer novos recursos, como suporte ao Google Slides e URLs da web, melhores formas de verificar fatos e a capacidade de criar guias de estudo, documentos informativos e muito mais instantaneamente.
Agora em setembro a Google lançou o Audio Overview (Resumo em Áudio), uma nova maneira de transformar os documentos em discussões em áudio envolventes. Com apenas um clique, dois anfitriões de IA iniciam uma conversa animada baseada nos documentos usados como fontes. Os apresentadores resumem o material, fazem conexões entre tópicos e trocam ideias de forma interativa em uma dinâmica semelhante a um podcast.
O áudio pode ser baixado para ser ouvido em qualquer lugar ou mesmo servir de base para a produção de um podcast. Plataformas de produção como a Wondercraft já estão integradas com o NotebookLM.
O recurso ainda é experimental e apresenta algumas limitações conhecidas. Por exemplo, para conteúdos grandes, pode levar alguns minutos para gerar o Resumo em Áudio. Além disso, no momento, os anfitriões de IA falam apenas em inglês, às vezes introduzem imprecisões e ainda não é possível interrompê-los.
Veja no vídeo a seguir uma demonstração de um Resumo em Áudio onde a única fonte de informação fornecida foi o endereço URL “zydigital.com.br”. O vídeo mostra apenas os primeiros segundos do áudio produzido que tem, no total, cerca de 14 minutos.
Agora, foi a vez da Meta lançar o seu NotebookLlama, um projeto que usa os seus próprios modelos Llama para grande parte do processamento. Assim como o NotebookLM, ele pode gerar resumos em estilo de podcast de arquivos de texto enviados para ele.
Primeiro, o NotebookLlama cria uma transcrição de um arquivo — por exemplo, um PDF de um artigo de notícias ou post de blog. Em seguida, ele cria o script de um podcast a partir do texto transcrito. Depois, “adiciona mais dramatização” e envia o novo texto para modelos abertos de conversão de texto para fala.
Os resultados ainda não soam tão bem quanto os do NotebookLM. Nos exemplos do NotebookLlama, as vozes ainda são um pouco robóticas. Porém, isto poderá ser superado com facilidade.
O aplicativo do NotebookLM pode ser acessado neste link. O NotebookLlama ainda não possui uma interface de aplicativo, mas a sua documentação pode ser vista aqui.
Fonte: Google / TechCrunch