Facebook Research a développé et publié un codec audio neuronal avec un taux de compression élevé et une qualité HiFi.
github.com/facebookresearch/encodec.Le codec fonctionne en temps réel sur un processeur et atteint un taux de compression de 1,5 kbps pour la musique et de 0,9 kbps pour la parole avec une bande passante audio de 12 kHz. Il s’appuie sur des travaux antérieurs connus de longue date et sur une architecture dite CNN (Convolutional Neural Network). Les réseaux de neurones sont utilisés pour les assistants vocaux et l’amélioration de la parole, mais ont trouvé peu d’utilisation dans la radio amateur.
Étant donné qu’une grande partie (82%) du trafic Internet provient de la transmission audio et vidéo, il existe un grand intérêt à développer des codecs efficaces, c’est-à-dire à forte compression. Avec FreeDV, il existe une méthode de transmission vocale numérique pour HF, mais elle n’utilise pas encore de codecs neuronaux. Les codecs neuronaux open source peuvent améliorer considérablement la qualité de la voix et l’utilisation des fréquences sur toutes les bandes Afu à l’avenir et offrir un large champ d’auto-construction numérique.
Pour démontrer et évaluer la qualité vocale de l’EnCodec, le Dr. Matthias Jung, DL9MJ, a créé des fichiers audio avec différents facteurs de compression.
https://dl9mj.de/encodec/ EnCodec atteint un facteur de compression allant jusqu’à 700 par rapport au fichier WAV d’origine, alors qu’un fichier MP3 standard n’a qu’un facteur 2. Les informations actuelles sont également disponibles dans le chat DARC à
https://matrix.to/#/#nachrichtentechnik:darc.de Un groupe HAM sur le thème ‘l’IA dans la radio amateur’ est en préparation.
Auteur : Dr. Axel Richter, DM1AR / Photo : DL9MJ
Info de la Source * ICI