De acuerdo con una publicación en su web de IA, Microsoft presentó MAI-Voice-1 y MAI-1-preview. El primero de ellos es un modelo de generación de voz «altamente expresivo y natural» capaz de generar un minuto de audio en menos de 1 segundo. Según la empresa, la IA está optimizada para funcionar en una sola GPU y es altamente eficiente, por lo que ya se integró en los resúmenes de noticias de Copilot Daily y Podcasts.
MAI-Voice-1 ofrece audio de alta fidelidad con entonación natural y expresiva. Microsoft señala que esta IA puede utilizarse para narrar historias o generar meditaciones guiadas, así como también para desarrollar un asistente virtual con conversación en tiempo real.
MAI-1-preview es el primer modelo basado en texto de Microsoft que se utilizará para impulsar las próximas versiones de Copilot. La compañía señaló que MAI-1-preview se entrenó con aproximadamente 15.000 GPU NVIDIA H-100 utilizando la arquitectura Mixture-of-Experts (MoE).
Fuente: hipertextual.com
Deja una respuesta