Différence entre le chargement de librosa et la lecture de scipy.io.wavfile

De la docstring de librosa.core.load :

Chargez un fichier audio sous forme de série chronologique à virgule flottante.

L'audio sera automatiquement rééchantillonné au taux donné (par défaut sr=22050).

Pour conserver le taux d'échantillonnage natif du fichier, utilisez sr=None.

scipy.io.wavfile.read ne rééchantillonne pas automatiquement les données et les échantillons ne sont pas convertis en virgule flottante s'il s'agit d'entiers dans le fichier.

librosa.core.load prend en charge les fichiers audio 24 bits et les taux d'échantillonnage de 96 kHz. Pour cette raison, la conversion en flottant et le rééchantillonnage par défaut peuvent être considérablement plus lents que scipy.io.wavfile.read dans de nombreux cas.

Il convient également de mentionner que librosa.load() normalise les données (pour que tous les points de données soient compris entre 1 et -1), alors que wavfile.read() pas.