En verano de 2023, Google anunció la llegada de NotebookLM, una evolución del bloc de notas tradicional en el que la IA cobraba especial protagonismo. Hace poco que está disponible en español —nuestros compañeros de Xataka Android lo probaron—, pero es que ahora llega una novedad llamativa. Una que hace que este bloc de notas nos hable en formato podcast.
Llega la «Audio Overview». En Google anunciaron ayer la llegada de una nueva característica llamada «Audio Overview» (algo así como «Resumen de Audio»). Según los responsables de este desarrollo, con ella es posible convertir documentos, presentaciones o diagramas en singulares podcasts de audio con un solo click. Es una forma singular de revisar y entender documentos que hemos subido a la app, y que nos ofrece sus resúmenes no en forma de texto, sino en una converesación en formato podcast con voces sintetizadas por AI.
Un podcast sintético. Cuando añades documentos a un nuevo bloc de notas, el sistema da la opción de convertirlas en una especie de podcast. En el audio resultante intervienen dos voces sintetizadas —una masculina, otra femenina— que van dialogando y que precisamente se encargan de resumir los documentos para que su comprensión sea más sencilla y entrenida.
Lo he probado y es alucinante. Precisamente utilicé NotebookLM y su nueva Audio Overview para obtener un podcast que me explicara de qué va Audio Overview. Lo alimenté con ficheros txt en los que copié el anuncio oficial de Google y tres noticias de diversas fuentes (The Verge, PCMag y TechCrunch) al respecto. Tras añadir los textos, pinché en «Notebook guide» (parte inferior derecha de la interfaz) y en unos 3 o 4 minutos se generó el resumen de audio, que dura 9:23. El resumen en formato podcast es fantástico, entretenido e instructivo, y además no inventa cosas ni comete errores porque la información utilizada es la que hemos seleccionado nosotros. Solo si esa información inventa o tiene errores, estos pueden acabar en ese podcast final, claro.
¿Voces demasiado humanas? Al oir alguno de los podcasts generados como resultado —tenéis un ejemplo en el anuncio oficial— se puede comprobar cómo las voces sintetizadas que intervienen hablan de forma muy humana. Se interrumpen, usan metáforas, van contestando a lo que dice el otro con cosas como «Right» («Exacto») o «Yes» («Sí») y adoptan tonos de voz que son de todo menos monótonos, precisamente para hacer más interesante el resultado. La característica, eso sí, es experimental y está disponible solo generando audios en idioma inglés, pero aun así su ejecución es alucinante, aunque obviamente puede estar expuesta a errores si no entiende términos o acrónimos usados en los documentos, por ejemplo.
Un futuro probable para los podcasts. Esta herramienta apunta a una posible evolución de los podcasts en los que ya ni siquiera tengamos que grabarlos. Teniendo en cuenta que ya hay herramientas capaces de sintetizar nuestra voz, podríamos usar NotebookLM y su Audio Overview con esa voz clonada precisamente para no tener que locutar el podcast directamente. Es algo que de hecho se puede hacer hoy mismo: podemos transcribir el podcast resultante y luego sintentizarlo de nuevo con la voz clonada con alguno de los servicios que lo logran. Parece razonable pensar que no tardarán en existir herramientas que permitan algo así, lo que insistimos, ofrece una alternativa llamativa —e inquietante— en el mundo de los podcasts generados por IA.