音频技术之声音是如何保存为数字信号的，附pydub代码举例

声音是通过将声音的波形转换成数字信号来进行保存的。这个过程被称为模数转换（Analog-to-Digital Conversion，简称ADC）。模数转换器将连续的声音波形信号在时间上进行离散化，然后将每个离散时间点的振幅转换为对应的数字值。

下面是大致的数字化过程：

1. 采样（Sampling）：声音信号在时间上进行连续采样，通常使用一个固定的采样率（样本频率）来进行采样。采样率决定了每秒钟采集多少个样本，常见的采样率有44.1kHz（CD音质）、48kHz（视频音频）等。

2. 量化（Quantization）：采样后的声音信号振幅被量化为离散的数值。通过将振幅值映射到一定数量的离散级别，并用相应的数字值表示每个级别。量化级别的数量由采样精度决定，常见的采样精度有8位、16位、24位等。

3. 编码（Encoding）：将量化后的离散数值转换成二进制形式，以便于计算机进行处理和存储。常见的编码方式有脉冲编码调制（PCM）和压缩编码，如MP3、AAC等。

4. 分析: 对量化后的数字信号进行进一步的分析。这可能包括声音特征提取，如基频、共振峰等，以及声音信号处理技术，如语音识别、语音合成等。

通过这些步骤，声音信号被转换成了数字信号，可以被计算机进行处理、存储和传输。在播放时，数字信号会经过数字到模拟转换（Digital-to-Analog Conversion，简称DAC）来恢复成模拟的声音波形，然后通过扬声器等装置进行声音的放大和播放。

当将声音保存为数字信号时，通常会使用音频编码库或工具来处理。下面是一个使用Python语言和`pydub`库的简单示例代码，演示了将声音文件转换为数字信号的过程：

```python

from pydub import AudioSegment

# 读取声音文件

audio = AudioSegment.from_file("input.wav")

# 获取声音的采样率和采样宽度

sample_rate = audio.frame_rate

sample_width = audio.sample_width

# 将声音转换为原始数据

raw_data = audio.raw_data

# 打印采样率和采样宽度

print("Sample Rate:", sample_rate)

print("Sample Width:", sample_width)

# 打印前10个采样值

for i in range(10):

sample_value = int.from_bytes(raw_data[i * sample_width:(i + 1) * sample_width], byteorder='little', signed=True)

print("Sample", i+1, ":", sample_value)

```

这个示例代码使用`pydub`库来读取声音文件，并获取声音的采样率和采样宽度。然后，它将声音转换为原始数据，即一系列字节流。通过使用`int.from_bytes`函数，我们可以将每个采样的字节流转换为相应的整数值。最后，示例代码打印了前10个采样值，以展示声音被保存为数字信号的效果。

实际的声音处理和保存过程可能需要更复杂的处理和编码步骤，具体取决于所使用的音频编码标准和库。

新潮看世界

分享最新动漫资讯，剧透，剧情分析，海贼王，龙珠，鬼灭之刃，斗罗大陆，斗破苍穹～～

公众号

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。