脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|shell|

服务器之家 - 脚本之家 - Python - Python使用PyAudio制作录音工具的实现代码

Python使用PyAudio制作录音工具的实现代码

2022-12-05 10:46宿者朽命 Python

这篇文章主要介绍了Python使用PyAudio制作录音工具,音频录制与视频录制相似,也是以数据帧的方式录制保存,这次使用强大的第三方包PyAudio和内置的wave模块编写,需要的朋友可以参考下

最近有在使用屏幕录制软件录制桌面,在用的过程中突发奇想,使用python能不能做屏幕录制工具,也锻炼下自己的动手能力。
接下准备写使用python如何做屏幕录制工具的系列文章:

录制屏幕制作视频 

录制音频   

合成视频,音频

基于pyqt5制作可视化窗口

大概上述四个部分,希望自己能够尽快完善,上一篇文章利用opencv制作了屏幕录制部分,接下继续更新系列,使用python录制音频。

应用平台

  • windows 10
  • python 3.7

音频录制部分

音频录制与视频录制相似,也是以数据帧的方式录制保存,这次使用强大的第三方包PyAudio和内置的wave模块编写主要部分代码:

?
1
pip install PyAudio

如果出现安装失败,可点击去此处下载对应.whl文件,cp37代表python3.7环境,64代表64位操作系统。
假如不是下载对应的whl包会导致安装失败,下载完成后,cmd窗口下进入whl的所在目录,使用pip install PyAudio-xx.whl即可完成安装。

Python使用PyAudio制作录音工具的实现代码

音频录制主要代码:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
from pyaudio import PyAudio, paInt16, paContinue, paComplete
 
# 设置固定参数
chunk = 1024  # 每个缓冲区的帧数
format_sample = paInt16  # 采样位数
channels = 2  # 声道: 1,单声道;2,双声道
fps = 44100  # 采样频率
# 这里采用回调的方式录制音频
def callback(in_data, frame_count, time_info, status):
    """录制回调函数"""
    wf.writeframes(in_data)
    if xx:  # 当某某条件满足时
        return in_data, paContinue
    else:
        return in_data, paComplete
# 实例化PyAudio
p = PyAudio()
stream = p.open(format=format_sample,
                channels=channels,
                rate=fps,
                frames_per_buffer=chunk,
                input=True,
                input_device_index=None# 输入设备索引, None为默认设备
                stream_callback=callback   # 回调函数
                )
# 开始流录制
stream.start_stream()
# 判断流是否活跃
while stream.is_active():
    time.sleep(0.1)    # 0.1为灵敏度
# 录制完成,关闭流及实例
stream.stop_stream()
stream.close()
p.terminate()

采取流式并用回调函数录制,需要先定义保存音频文件,用wave新建音频二进制文件:

?
1
2
3
4
5
import wave
wf = wave.open('test.wav', 'wb')
wf.setnchannels(channels)
wf.setsampwidth(p.get_sample_size(format_sample))
wf.setframerate(fps)

为了后续代码可以很好的与之结合复用,将上面的代码包装成类

?
1
2
3
from pyaudio import PyAudio
class AudioRecord(PyAudio):
    def __init__(self,):

源码于文末补充。

音频播放部分

播放部分代码与录制部分代码相差不大,核心部分:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
wf = wave.open('test.wav', 'rb')
def callback(in_data, frame_count, time_info, status):
    data = wf.readframes(frame_count)
    return data, paContinue
stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
                channels=wf.getnchannels(),
                rate=wf.getframerate(),
                output=True,
                output_device_index=output_device_index,  # 输入设备索引
                stream_callback=callback  # 输出用回调函数
                )
stream.start_stream()
while stream.is_active():
    time.sleep(0.1)

目前暂时测试了.wav.mp3格式可以正常录制及播放,其它类型格式音频可以自行调用代码进行测试。

GUI窗口所需属性值代码部分

考虑到GUI窗口能较为人性化的输出及输入值,编写该部分代码,内容含音频时长及获取输入设备及输出设备。

?
1
2
# 音频时长
duration = wf.getnframes() / wf.getframerate()
?
1
2
3
4
5
6
7
8
# 获取系统目前已安装的输入输出设备
dev_info = self.get_device_info_by_index(i)
default_rate = int(dev_info['defaultSampleRate'])
if not dev_info['hostApi'] and default_rate == fps and '映射器' not in dev_info['name']:
    if dev_info['maxInputChannels']:
        print('输入设备:', dev_info['name'])
    elif dev_info['maxOutputChannels']:
        print('输出设备:', dev_info['name'])

pynput监听键盘

在这部分代码也暂时使用pynput监听键盘来对录音做中断处理。可以调用上一篇文章中的键盘监听代码。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
def hotkey(self):
    """热键监听"""
    with keyboard.Listener(on_press=self.on_press) as listener:
        listener.join()
 
def on_press(self, key):
    try:
        if key.char == 't'# t键,录制结束,保存音频
            self.flag = True
        elif key.char == 'k'# k键,录制中止,删除文件
            self.flag = True
            self.kill = True
    except Exception as e:
        print(e)

功能与上一篇类似,不再赘述。

总结

以上就是使用PyAudio调用windows的音频设备进行录制及播放,整体学习了使用类及其继承相关知识,用法在这只是展示了冰山一角,还有更多的知识等待着我们一起去探索!

于二零二一年十二月二十日作

源码:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
import wave
import time
from pathlib import Path
from threading import Thread
from pyaudio import PyAudio, paInt16, paContinue, paComplete
from pynput import keyboard  # pip install pynput
 
class AudioRecord(PyAudio):
    def __init__(self, channels=2):
        super().__init__()
        self.chunk = 1024  # 每个缓冲区的帧数
        self.format_sample = paInt16  # 采样位数
        self.channels = channels  # 声道: 1,单声道;2,双声道
        self.fps = 44100  # 采样频率
        self.input_dict = None
        self.output_dict = None
        self.stream = None
        self.filename = '~test.wav'
        self.duration = 0   # 音频时长
        self.flag = False
        self.kill = False
    def __call__(self, filename):
        """重载文件名"""
        self.filename = filename
    def callback_input(self, in_data, frame_count, time_info, status):
        """录制回调函数"""
        self.wf.writeframes(in_data)
        if not self.flag:
            return in_data, paContinue
        else:
            return in_data, paComplete
    def callback_output(self, in_data, frame_count, time_info, status):
        """播放回调函数"""
        data = self.wf.readframes(frame_count)
        return data, paContinue
    def open_stream(self, name):
        """打开录制流"""
        input_device_index = self.get_device_index(name, True) if name else None
        return self.open(format=self.format_sample,
                         channels=self.channels,
                         rate=self.fps,
                         frames_per_buffer=self.chunk,
                         input=True,
                         input_device_index=input_device_index,  # 输入设备索引
                         stream_callback=self.callback_input
                         )
    def audio_record_run(self, name=None):
        """音频录制"""
        self.wf = self.save_audio_file(self.filename)
        self.stream = self.open_stream(name)
        self.stream.start_stream()
        while self.stream.is_active():
            time.sleep(0.1)
        self.wf.close()
        if self.kill:
            Path(self.filename).unlink()
        self.duration = self.get_duration(self.wf)
        print(self.duration)
        self.terminate_run()
    def run(self, filename=None, name=None, record=True):
        """音频录制线程"""
        thread_1 = Thread(target=self.hotkey, daemon=True)
        if record:
            # 录制
            if filename:
                self.filename = filename
            thread_2 = Thread(target=self.audio_record_run, args=(name,))
            # 播放
            if not filename:
                raise Exception('未输入音频文件名,不能播放,请输入后再试!')
            thread_2 = Thread(target=self.read_audio, args=(filename, name,))
        thread_1.start()
        thread_2.start()
    def read_audio(self, filename, name=None):
        """音频播放"""
        output_device_index = self.get_device_index(name, False) if name else None
        with wave.open(filename, 'rb') as self.wf:
            self.duration = self.get_duration(self.wf)
            self.stream = self.open(format=self.get_format_from_width(self.wf.getsampwidth()),
                                    channels=self.wf.getnchannels(),
                                    rate=self.wf.getframerate(),
                                    output=True,
                                    output_device_index=output_device_index,  # 输出设备索引
                                    stream_callback=self.callback_output
                                    )
            self.stream.start_stream()
            while self.stream.is_active():
                time.sleep(0.1)
    @staticmethod
    def get_duration(wf):
        """获取音频时长"""
        return round(wf.getnframes() / wf.getframerate(), 2)
    def get_in_out_devices(self):
        """获取系统输入输出设备"""
        self.input_dict = {}
        self.output_dict = {}
        for i in range(self.get_device_count()):
            dev_info = self.get_device_info_by_index(i)
            default_rate = int(dev_info['defaultSampleRate'])
            if not dev_info['hostApi'] and default_rate == self.fps and '映射器' not in dev_info['name']:
                if dev_info['maxInputChannels']:
                    self.input_dict[dev_info['name']] = i
                elif dev_info['maxOutputChannels']:
                    self.output_dict[dev_info['name']] = i
    def get_device_index(self, name, input_in=True):
        """获取选定设备索引"""
        if input_in and self.input_dict:
            return self.input_dict.get(name, -1)
        elif not input_in and self.output_dict:
            return self.output_dict.get(name, -1)
    def save_audio_file(self, filename):
        """音频文件保存"""
        wf = wave.open(filename, 'wb')
        wf.setnchannels(self.channels)
        wf.setsampwidth(self.get_sample_size(self.format_sample))
        wf.setframerate(self.fps)
        return wf
    def terminate_run(self):
        """结束流录制或流播放"""
        if self.stream:
            self.stream.stop_stream()
            self.stream.close()
        self.terminate()
    def hotkey(self):
        """热键监听"""
        with keyboard.Listener(on_press=self.on_press) as listener:
            listener.join()
    def on_press(self, key):
        try:
            if key.char == 't'# t键,录制结束,保存音频
                self.flag = True
            elif key.char == 'k'# k键,录制中止,删除文件
                self.kill = True
        except Exception as e:
            print(e)
if __name__ == '__main__':
    audio_record = AudioRecord()
    audio_record.get_in_out_devices()
    # 录制
    print(audio_record.input_dict)
    audio_record.run('test.mp3')
    # 播放
    print(audio_record.output_dict)
    audio_record.run('test.mp3', record=False)

到此这篇关于Python使用PyAudio制作录音工具的文章就介绍到这了,更多相关Python PyAudio录音工具内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/weixin_46281427/article/details/122035728

延伸 · 阅读

精彩推荐
  • PythonPandas中GroupBy具体用法详解

    Pandas中GroupBy具体用法详解

    pandas中的DF数据类型可以像数据库表格一样进行groupby操作。通常来说groupby操作可以分为三部分:分割数据,应用变换和和合并数据。本文就详细的来介绍一...

    flydean8972021-12-13
  • Pythonmatplotlib savefig 保存图片大小的实例

    matplotlib savefig 保存图片大小的实例

    今天小编就为大家分享一篇matplotlib savefig 保存图片大小的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    胖大海瘦西湖6532021-02-24
  • Python在python中将字符串转为json对象并取值的方法

    在python中将字符串转为json对象并取值的方法

    今天小编就为大家分享一篇在python中将字符串转为json对象并取值的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    u_ZJL_FFF5802021-05-10
  • PythonVS Code有哪些奇技淫巧(必知)

    VS Code有哪些奇技淫巧(必知)

    VS Code这几年作为一款热门的开发工具,逐渐受到更多开发者的欢迎,今天给大家分享VS Code有哪些奇技淫巧,感兴趣的朋友跟随小编一起看看吧...

    七步编程7512021-12-12
  • PythonPython ttkbootstrap 制作账户注册信息界面的案例代码

    Python ttkbootstrap 制作账户注册信息界面的案例代码

    ttkbootstrap 是一个基于 tkinter 的界面美化库,使用这个工具可以开发出类似前端 bootstrap 风格的 tkinter 桌面程序。本文重点给大家介绍Python ttkbootstrap 制作账...

    终究不过路人11042022-10-07
  • PythonPython基础学习之函数方法实例详解

    Python基础学习之函数方法实例详解

    这篇文章主要介绍了Python基础学习之函数方法,结合实例形式分析了Python函数方法的定义、参数、复用和继承相关操作技巧,需要的朋友可以参考下...

    George-Henry5462021-07-14
  • PythonPython实现PS滤镜的旋转模糊功能示例

    Python实现PS滤镜的旋转模糊功能示例

    这篇文章主要介绍了Python实现PS滤镜的旋转模糊功能,涉及Python基于skimage库针对图片进行旋转与模糊化处理的相关操作技巧,需要的朋友可以参考下...

    Matrix_118562021-01-07
  • Pythonpython的迭代器,生成器和装饰器你了解吗

    python的迭代器,生成器和装饰器你了解吗

    这篇文章主要为大家详细介绍了python的迭代器,生成器和装饰器,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希...

    野猫炫4602022-09-16