Nari Labs a développé Dia-1.6B, un modèle d'IA compact et open-source conçu pour révolutionner la synthèse vocale émotionnelle. Malgré sa petite taille (1,6 milliard de paramètres), le modèle prétend surpasser les leaders de l'industrie comme ElevenLabs et Sesame. La capacité de Dia à imiter les nuances émotionnelles, y compris le rire, la toux et même un cri convaincant, le distingue de ses concurrents qui échouent souvent dans l'expression naturelle des émotions. Fonctionnant efficacement en temps réel sur un seul GPU, il relève des défis persistants tels que la granularité émotionnelle et l'effet "uncanny valley", où les voix synthétiques semblent réalistes mais manquent d'émotion authentique. La publication du modèle suscite l'intérêt des communautés de l'IA et met en lumière les progrès réalisés dans le domaine de la communication homme-machine.