Xiaomi, como muchos otros actores de la industria tecnológica, está profundamente interesado en desarrollar más y mejor todo lo relativo a la inteligencia artificial. La firma ya cuenta con el asistente Xiao AI para su propio país, pero las IA de Xiaomi se inmiscuyen en todos los territorios que el fabricante toca. Y no hablamos únicamente de la mejora fotográfica de los móviles, sino también de la conducción autónoma de sus coches eléctricos.
En este último terreno es donde entra Dasheng, un LLM desarrolado por Xiaomi que ya lleva más de un año presentado y que ahora ha dado un paso importantísimo. El modelo se encarga de procesar sonidos y nuestra propia voz para así entendernos en distintas situaciones. Ahora, Xiaomi lo ha convertido en un modelo de código abierto con MiDashengLM-7B, y el propio modelo ya se ha encargado de batir 22 récords en el terreno del reconocimiento de audio multimodal.
Xiaomi, revolucionando el reconocimiento de audio con IA
El MiDashengLM-7B que ha liberado Xiaomi como modelo de código abierto consta de dos partes fundamentales. Por un lado, cuenta con el codificador de audio con IA Dasheng, que ya te contamos que lleva algún tiempo en el mercado. Por otro lado, y aquí está la clave, incorpora el descodificador Qwen2.5-Omni-7B Thinker. Así, Xiaomi arma una nueva estrategia en el reconocimiento universal (mediante entrenamiento previo) de todo tipo de señales auditivas. Y esto es muy innovador.
Desde que se lanzó, Xiaomi ha encontrado ya más de 30 aplicaciones prácticas para su LLM Dasheng. La firma lo ha llevado a sus coches pero también a su ecosistema de productos para el hogar inteligente. Por ejemplo, Dasheng se encarga ya de monitorizar los altavoces de la marca para así detectar sonidos anómalos, algo que también hace en smartphones. En el mundo del motor, Dasheng es el que se encarga de blindar el modo centinela del Xiaomi YU7, por ejemplo, detectando y evitando intrusiones.
Cuenta Xiaomi que para entrenar MiDashengLM sólo ha utilizado conjuntos de audio disponibles de forma pública, y además ha liberado su modelo bajo la licencia Apache 2.0. Esto permite que MiDashengLM se utilice tanto con fines comerciales como académicos. Xiaomi espera poder potenciar así aún más su modelo de reconocimiento de sonidos y lenguaje para continuar desarrollando su propio ecosistema.
Vía | ITHome
En Mundo Xiaomi | La guerra ha acabado y ha ganado Xiaomi. Meta, entrega tus armas y gafas de inteligencia artificial
–
La noticia
Así está revolucionando Xiaomi el análisis de sonidos y voces con su modelo MiDashengLM-7B de código abierto
fue publicada originalmente en
Mundo Xiaomi
por
Samuel Fernández
.