Stability AI, la misma startup que puso patas arriba el mundo de la generación de imágenes con Stable Diffusion, acaba de soltar otra bomba: Stable Audio Open Small, un modelo de generación de audio que corre en un smartphone sin conexión a internet. Sí, en serio. Y en menos de 8 segundos.
Pero antes de que empieces a componer la BSO de tu juego indie desde el metro, hay letra pequeña. Mucha.
¿Qué es Stable Audio Open Small y por qué importa?
-
Tamaño del modelo: 341 millones de parámetros (relativamente pequeño para IA).
-
Velocidad: genera hasta 11 segundos de audio en menos de 8 segundos.
-
Requisitos: optimizado para CPUs ARM, es decir, la mayoría de móviles actuales.
-
Casos de uso: efectos sonoros, loops instrumentales, clips cortos. No esperes que te cante Adele.
Y lo mejor: funciona sin nube. A diferencia de Suno o Udio, que dependen de servidores y por tanto requieren conexión (y confianza en que no estés cediendo tus datos a cambio de unos beats).
Todo legal, todo free... hasta que ganas dinero
A diferencia de sus competidores, Stability asegura que su modelo se ha entrenado solo con contenido libre de derechos, sacado de Free Music Archive y Freesound. Esto reduce el riesgo de demandas por infracción de copyright. Lo cual, en estos tiempos, es casi milagroso.
Peeeero... si tu negocio factura más de 1 millón al año, olvídate del uso gratuito. Tendrás que pasar por caja y negociar una licencia empresarial. Stability se reserva el derecho de monetizar el modelo, y tú el derecho a quejarte en Reddit.
Limitaciones que no puedes ignorar (aunque suenen bien)
-
Sin voces realistas ni canciones completas. Esto no es una IA cantante, ni de lejos.
-
Solo entiende inglés. Si tu prompt es en español, generará... basura.
-
Bias occidental. Como casi todo en IA, si pides cumbia o joropo, probablemente recibas country mal mezclado.
Así que, aunque el modelo es compacto y rápido, su utilidad es limitada por diseño. Ideal para maquetas rápidas, efectos sonoros y demos. No para lanzar tu primer hit.
Stability AI: ¿resurrección o último acorde?
Este lanzamiento viene después de meses turbulentos para Stability. Tras la caída en desgracia de su fundador, Emad Mostaque, la empresa:
-
Perdió a parte de su equipo.
-
Rompió acuerdos clave (como uno con Canva).
-
Fue rescatada por inversores como Eric Schmidt y Sean Parker.
-
Y, para redondear el drama, James Cameron (sí, el de Titanic) se unió a su junta directiva.
Ahora, con nuevo CEO, están apostando fuerte por modelos más pequeños, más rápidos, más legales. En otras palabras: menos espectacularidad y más sostenibilidad.
Lo que nadie te cuenta sobre esto
-
El modelo es open-ish. Sí, se puede usar, pero con límites que recuerdan más a una “demo avanzada” que a un verdadero open source.
-
La música generada no es música usable profesionalmente. Los loops están bien, pero no compiten con producción humana, al menos no todavía.
-
Stability necesita este win. Está desesperada por probar que puede lanzar algo útil tras el caos que fue Stable Diffusion XL.
-
Esto es una guerra de percepción. Mientras Suno y Udio van a lo grande (y al margen legal), Stability quiere ser el niño bueno de la IA creativa. Veremos si eso paga las facturas.
Conclusión clara (y sin autotune):
Stable Audio Open Small no va a cambiar la industria musical. Pero sí podría cambiar cómo experimentas con audio en tu móvil. Pequeño, rápido, legal y, por ahora, gratis. El futuro de la música generativa empieza con 11 segundos y una advertencia legal.

0 Comentarios