Python实现音频添加数字水印的示例详解

更新时间：2025年04月02日 09:05:09 作者：mosquito_lover1

数字水印技术可以将隐藏信息嵌入到音频文件中而不明显影响音频质量,下面小编将介绍几种在Python中实现音频数字水印的方法,希望对大家有所帮助

方法一：LSB (最低有效位) 水印

import numpy as np
from scipy.io import wavfile
def embed_watermark_lsb(audio_path, watermark, output_path):
    # 读取音频文件
    sample_rate, audio_data = wavfile.read(audio_path)    
    # 确保是立体声，如果是单声道则转换为立体声
    if len(audio_data.shape) == 1:
        audio_data = np.column_stack((audio_data, audio_data))   
    # 将水印转换为二进制
    watermark_bin = ''.join(format(ord(c), '08b') for c in watermark)
    watermark_bin += '00000000' # 添加结束标记   
    # 检查水印是否适合音频
    if len(watermark_bin) > audio_data.size:
        raise ValueError("水印太大，无法嵌入到音频中")  
    # 嵌入水印到最低有效位
    watermark_index = 0
    for i in range(len(audio_data)):
        for j in range(len(audio_data[i])):
            if watermark_index < len(watermark_bin):
                # 替换最低有效位
                audio_data[i][j] = (audio_data[i][j] & 0xFE) | int(watermark_bin[watermark_index])
                watermark_index += 1
            else:
                break   
    # 保存带水印的音频
    wavfile.write(output_path, sample_rate, audio_data)
def extract_watermark_lsb(audio_path, watermark_length):
    # 读取音频文件
    sample_rate, audio_data = wavfile.read(audio_path)    
    # 提取最低有效位
    watermark_bits = []
    for i in range(len(audio_data)):
        for j in range(len(audio_data[i])):
            watermark_bits.append(str(audio_data[i][j] & 1))   
    # 将比特转换为字节
    watermark = ''
    for i in range(0, len(watermark_bits), 8):
        byte = ''.join(watermark_bits[i:i+8])
        if byte == '00000000': # 遇到结束标记
            break
        watermark += chr(int(byte, 2))   
    return watermark[:watermark_length]
# 使用示例
embed_watermark_lsb('original.wav', '秘密消息', 'watermarked.wav')
extracted = extract_watermark_lsb('watermarked.wav', 4)
print("提取的水印:", extracted)

方法二：频域水印 (DCT变换)

import numpy as np
from scipy.fftpack import dct, idct
from scipy.io import wavfile
def embed_watermark_dct(audio_path, watermark, output_path, alpha=0.01):
    # 读取音频
    sample_rate, audio_data = wavfile.read(audio_path)  
    # 如果是立体声，只使用一个声道
    if len(audio_data.shape) > 1:
        audio_data = audio_data[:, 0]   
    # 将水印转换为二进制
    watermark_bin = ''.join(format(ord(c), '08b') for c in watermark)
    watermark_bin = [int(b) for b in watermark_bin]    
    # 分段处理音频
    segment_size = 1024
    num_segments = len(audio_data) // segment_size
    watermark_length = len(watermark_bin)   
    if num_segments < watermark_length:
        raise ValueError("音频太短，无法嵌入水印")   
    # 嵌入水印
    watermarked_audio = np.copy(audio_data)
    for i in range(watermark_length):
        start = i * segment_size
        end = start + segment_size        
        segment = audio_data[start:end]
        dct_coeffs = dct(segment, norm='ortho')       
        # 修改中频系数嵌入水印
        coeff_index = 100 # 选择一个中频系数
        if watermark_bin[i] == 1:
            dct_coeffs[coeff_index] += alpha * np.abs(dct_coeffs[coeff_index])
        else:
            dct_coeffs[coeff_index] -= alpha * np.abs(dct_coeffs[coeff_index])      
        # 逆DCT变换
        watermarked_segment = idct(dct_coeffs, norm='ortho')
        watermarked_audio[start:end] = watermarked_segment   
    # 保存带水印的音频
    wavfile.write(output_path, sample_rate, watermarked_audio.astype(np.int16))
def extract_watermark_dct(audio_path, original_path, watermark_length):
    # 读取带水印音频和原始音频
    sample_rate, watermarked = wavfile.read(audio_path)
    _, original = wavfile.read(original_path)    
    # 如果是立体声，只使用一个声道
    if len(watermarked.shape) > 1:
        watermarked = watermarked[:, 0]
        original = original[:, 0]   
    segment_size = 1024
    watermark_bits = []    
    for i in range(watermark_length):
        start = i * segment_size
        end = start + segment_size       
        wm_segment = watermarked[start:end]
        orig_segment = original[start:end]        
        wm_dct = dct(wm_segment, norm='ortho')
        orig_dct = dct(orig_segment, norm='ortho')        
        coeff_index = 100
        if wm_dct[coeff_index] > orig_dct[coeff_index]:
            watermark_bits.append('1')
        else:
            watermark_bits.append('0')    
    # 将比特转换为字符串
    watermark = ''
    for i in range(0, len(watermark_bits), 8):
        byte = ''.join(watermark_bits[i:i+8])
        watermark += chr(int(byte, 2))  
    return watermark
# 使用示例
embed_watermark_dct('original.wav', '秘密', 'watermarked_dct.wav', 0.02)
extracted = extract_watermark_dct('watermarked_dct.wav', 'original.wav', 16)
print("提取的水印:", extracted)

方法三：扩频水印

import numpy as np
from scipy.io import wavfile
def generate_pn_sequence(length, seed=42):
    np.random.seed(seed)
    return np.random.choice([-1, 1], size=length)
def embed_watermark_spread_spectrum(audio_path, watermark, output_path, alpha=0.01):
    # 读取音频
    sample_rate, audio_data = wavfile.read(audio_path)    
    # 如果是立体声，只使用一个声道
    if len(audio_data.shape) > 1:
        audio_data = audio_data[:, 0]    
    # 将水印转换为二进制
    watermark_bin = ''.join(format(ord(c), '08b') for c in watermark)
    watermark_bits = np.array([int(b) for b in watermark_bin])
    watermark_bits = 2 * watermark_bits - 1 # 转换为±1   
    # 生成伪随机序列
    pn_length = len(audio_data) // len(watermark_bits)
    pn_sequence = generate_pn_sequence(pn_length)   
    # 创建扩频水印
    spread_watermark = np.repeat(watermark_bits, pn_length)
    spread_watermark = spread_watermark[:len(audio_data)] * pn_sequence[:len(audio_data)]   
    # 嵌入水印
    watermarked_audio = audio_data + alpha * spread_watermark * np.abs(audio_data)
    watermarked_audio = np.clip(watermarked_audio, -32768, 32767) # 确保在16位范围内 
    # 保存带水印的音频
    wavfile.write(output_path, sample_rate, watermarked_audio.astype(np.int16))
def extract_watermark_spread_spectrum(audio_path, original_path, watermark_length, pn_length):
    # 读取音频
    sample_rate, watermarked = wavfile.read(audio_path)
    _, original = wavfile.read(original_path)   
    # 如果是立体声，只使用一个声道
    if len(watermarked.shape) > 1:
        watermarked = watermarked[:, 0]
        original = original[:, 0]    
    # 计算差异
    diff = watermarked - original   
    # 生成相同的伪随机序列
    num_bits = watermark_length * 8
    pn_sequence = generate_pn_sequence(pn_length)   
    extracted_bits = []
    for i in range(num_bits):
        start = i * pn_length
        end = start + pn_length       
        segment_diff = diff[start:end]
        segment_pn = pn_sequence[:len(segment_diff)]        
        correlation = np.sum(segment_diff * segment_pn)
        extracted_bits.append('1' if correlation > 0 else '0')    
    # 将比特转换为字符串
    watermark = ''
    for i in range(0, len(extracted_bits), 8):
        byte = ''.join(extracted_bits[i:i+8])
        watermark += chr(int(byte, 2))    
    return watermark
# 使用示例
embed_watermark_spread_spectrum('original.wav', '秘密', 'watermarked_ss.wav', 0.01)
extracted = extract_watermark_spread_spectrum('watermarked_ss.wav', 'original.wav', 2, 1000)
print("提取的水印:", extracted)

注意事项

1. **音频质量**：水印嵌入会影响音频质量，需要平衡水印强度和音频质量。

2. **鲁棒性**：不同方法对音频处理的抵抗能力不同：

- LSB方法脆弱但容量大

- DCT方法对压缩有一定抵抗能力

- 扩频方法鲁棒性最强但容量小

3. **安全性**：可以考虑加密水印内容提高安全性

4. **格式支持**：示例中使用WAV格式，因其是无损格式，其他格式可能需要先解码

扩展建议

1. 添加错误校正码提高水印提取的可靠性

2. 实现盲水印提取（不需要原始音频）

3. 添加同步信号提高对裁剪、时间拉伸的抵抗能力

4. 结合多种技术提高水印的鲁棒性和隐蔽

这些方法可以根据具体需求进行调整和组合，以实现不同场景下的音频数字水印需求。

以上就是Python实现音频添加数字水印的示例详解的详细内容，更多关于Python音频添加数字水印的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

python2.7 安装pip的方法步骤（管用）
这篇文章主要介绍了python2.7 安装pip的方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-05-05
python实现人机对战的五子棋游戏
这篇文章主要为大家详细介绍了python实现人机对战的五子棋游戏，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2022-04-04
python3之http.server模块用法
这篇文章主要介绍了python3之http.server模块用法,具有很好的参考价值,希望对大家有所帮助,
2023-09-09
使用Pandas修改DataFrame中某一列的值
DataFrame是Pandas中的主要数据结构之一,下面这篇文章主要给大家介绍了关于使用Pandas修改DataFrame中某一列的值的相关资料,文中通过图文介绍的非常详细,需要的朋友可以参考下
2022-12-12
Python实现文本文件拆分写入到多个文本文件的方法
这篇文章主要介绍了Python实现文本文件拆分写入到多个文本文件的方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-04-04
Python中os.path用法分析
这篇文章主要介绍了Python中os.path用法,实例分析了os.path的各种常用方法,具有一定参考借鉴价值,需要的朋友可以参考下
2015-01-01
python中的标准库html
html库是用于解析HTML的一个工具，是python自带的标准库之一，今天通过本文给大家介绍下python中的标准库html，感兴趣的朋友一起看看吧
2022-04-04
Flask请求钩子与上下文及异常处理分项精解
这篇文章主要介绍了Flask请求钩子与上下文及异常处理，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习吧
2022-10-10
pandas数据探索之合并数据示例详解
这篇文章主要为大家介绍了pandas数据探索之合并数据示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2023-10-10
Python绘制极坐标基向量详解
这篇文章主要介绍了如何利用python绘制极坐标的基向量,文中的示例代码讲解详细,具有一定的的参考价值,感兴趣的小伙伴可以跟随小编一起学习一下
2023-08-08