Meta anunció el lanzamiento de su herramienta de Inteligencia Artificial (IA) “Voicebox”, el cual funcionará como un ChatGPT para la generación de voz. Podrá convertir textos a audios en distintos idiomas y podrá editar grabaciones para eliminar ruidos de fondo.
Meta lanzó “Voicebox” por la tarde del 16 de junio, una IA de generación de voz que podrá editor audios, muestrear y estilizar, producir audios de alta calidad y eliminar ruido de fondo como ruido exterior. Será multilingüe, ya que producirá audios en seis idiomas.
La IA “Voicebox” de Meta la podrán usar personas con discapacidad
“Voicebox” dará voces a asistentes virtuales, e incluso de personajes que no tienen que ver con jugadores del metaverso. Permitirá a personas con discapacidad visual escichar mensajes escritos y promete brindar a creadores de contenido pistas de audio para sus videos.
Meta reveló lo siguiente sobre “Voicebox”:
“Voicebox” es un importante paso adelante en nuestra investigación generativa de IA, y esperamos continuar nuestra exploración en el espacio del audio y ver cómo otros investigadores se basan en nuestro trabajo”.
Meta detalló que al igual que otras herramientas de IA Generativa, “Voicebox” solo puede crear audios de salida de alta calidad desde cero, modificar muestras, pero en lugar de imágenes o videos, producirá audio de alta calidad. Es decir, podrá modiciar cualquier parte de una muestra determinada, no solo la parte final de un clip.
Además, Meta promete que “Voicebox” superaría a todas las IA en su tipo, por su facilidad de “aprendizaje de contexto”, lo que se traduce en mejores tasas de error por palabra, similitud de audio mejorada y rendimientos 20 veces más rápidos.
Meta presume que con “Voicebox” comienza una “nueva era” de la IA
Meta AI puntualizó algunos aspectos de su IA de voz:
“Este trabajo representa un importante paso adelante en este campo de investigación. Al igual que otros trabajos para imágenes + texto, creemos que la generalización y la escalabilidad de Voicebox podrían marcar el comienzo de una nueva era de IA generativa para el habla; estamos entusiasmados de seguir impulsándolo”.
Asimismo, “Voicebox” permitirá una variedad de tareas como:
- Síntesis de texto a voz en contexto.
- Edición de voz y reducción de ruido.
- Transferencia de estilo entre idiomas.
- Muestreo diverso al habla.
El lanzamiento llega cuando Meta está en pérdidas desde hace meses. En el primer trimestre del año ganó 24% menos, aunado a que tuvo que abandonar el metaverso y verse obligado a abrazar la IA. No solo eso, la empresa se vio opacada por el reciente lanzamiento de las Apple Vision Pro, las nuevas gafas de Realidad Aumentada de Apple.
Descargo de responsabilidad
Descargo de responsabilidad: en cumplimiento de las pautas de Trust Project, BeInCrypto se compromete a brindar informes imparciales y transparentes. Este artículo de noticias tiene como objetivo proporcionar información precisa y oportuna. Sin embargo, se recomienda a los lectores que verifiquen los hechos de forma independiente y consulten con un profesional antes de tomar cualquier decisión basada en este contenido.