Python >> Python opplæring >  >> Python

Python Konverter lyd ALAW til PCM-format:En komplett veiledning – Python-opplæring

Når vi bygger stemmegjenkjenningsmodell, bør vi konvertere lydfilen i alaw-format til pcm-format. I denne opplæringen vil vi introdusere deg hvordan du konverterer.

Se lyddataformat

For å sjekke hva som er dataformatet til lydfilen din, kan du bruke ffprobe-applikasjonen. Her er en veiledning:

Se lydsamplingsfrekvens, dataformat PCM eller ALAW ved hjelp av ffprobe – Python-veiledning

Hvordan konverterer jeg lyd alaw til pcm?

Vi kan bruke python lydfilbibliotek.

Det er noen trinn for å konvertere.

Trinn 1:les lyddata

Vi kan bruke librosa til å lese. Her er et eksempel:

import librosa
import soundfile as sf

v3 = r'F:\2351349.V3'
audio, sr = librosa.load(v3, sr= c.SAMPLE_RATE, mono=True)

Trinn 2:lagre lyddata til pcm

Her er PCM_16, PCM_32, du kan velge en du vil lagre.

sf.write('stereo_file.wav', audio, sr, 'PCM_16')

Deretter vil vi konvertere alaw 2351349.V3 til pcm 16 stereo_file.wav

Trinn 3:du bruker koden nedenfor for å sjekke hvilke formater som støttes av lydfil

print(sf.available_subtypes('WAV'))

Kjør denne koden, vil du se:

{'PCM_16': 'Signed 16 bit PCM', 'PCM_24': 'Signed 24 bit PCM', 'PCM_32': 'Signed 32 bit PCM', 'PCM_U8': 'Unsigned 8 bit PCM', 'FLOAT': '32 bit float', 'DOUBLE': '64 bit float', 'ULAW': 'U-Law', 'ALAW': 'A-Law', 'IMA_ADPCM': 'IMA ADPCM', 'MS_ADPCM': 'Microsoft ADPCM', 'GSM610': 'GSM 6.10', 'G721_32': '32kbs G721 ADPCM'}