【正点原子i.MX93开发板试用连载体验】录音小程序采集语料
创始人
2025-01-10 22:35:42
0

 本文最早发表于电子发烧友论坛:【新提醒】【正点原子i.MX93开发板试用连载体验】基于深度学习的语音本地控制 - 正点原子学习小组 - 电子技术论坛 - 广受欢迎的专业电子论坛! (elecfans.com)

接下来就是要尝试训练中文提示词。首先要进行语料采集,这是一个比较耗费人力的事情,通常大公司会有有专人进行语料收集,我只好自己亲自做。这里参考了AliOS Things里面提供的一个录音工具,方便快速录音。对这个工具做了一点修改,原来的代码只能在Linux下运行,现在改成在Windows下也能运行。

import pyaudio import wave import random import time import os from IPython import display #from pydub import AudioSebment #from pydub.playback import play #from playsound import playsound CHUNK = 2 FORMAT = pyaudio.paInt16 CHANNELS = 1 RATE = 16000 SAMPLEWIDTH = 2 RECORD_SECONDS = 1 FILE_FORMAT = '.wav' RECODER_NAME = 'lk' #play stream def play_wav(name, pyaudio):     f = wave.open(name,"rb")       #open stream       play_stream = pyaudio.open(format = p.get_format_from_width(f.getsampwidth()),                       channels = f.getnchannels(),                       rate = f.getframerate(),                       output = True)       #read data       data = f.readframes(CHUNK)     while data:           play_stream.write(data)         data = f.readframes(CHUNK)     #stop stream     play_stream.stop_stream()       play_stream.close()       #close PyAudio   #    pyaudio.terminate()     f.close() def save_wav(name, frames):     wf = wave.open(name, 'wb')     wf.setnchannels(CHANNELS)     wf.setsampwidth(p.get_sample_size(FORMAT))     wf.setframerate(RATE)     wf.writeframes(b''.join(frames))     wf.close()   def record_wav(duration):     time.sleep(0.2) # 1sec, 0.1sec     print("开始录音,请说话......") #    count = 3 #    for i in range(3): #        time.sleep(0.2) # 1sec, 0.1sec #        count -= 1 #        print(count)     frames = []     stream = p.open(format=FORMAT,             channels=CHANNELS,             rate=RATE,             input=True,             frames_per_buffer=CHUNK)     for i in range(0, int(RATE * duration / SAMPLEWIDTH)):         data = stream.read(CHUNK, exception_on_overflow = False)         frames.append(data)     #count = 0     #while count < int(RECORD_SECONDS * RATE):     #    data = stream.read(CHUNK)     #    frames.append(data)     #     count += CHUNK     stream.stop_stream()     stream.close()     print("录音结束!")     return frames # main function if __name__ == '__main__':     p = pyaudio.PyAudio()     # input('请按回车键开始录制!\n')     # record files     count = 0     for i in range(250):         input('请按回车键开始录制!\n')         print("开始第%d录制!" % count)         hash_name = str(hex(abs(hash(RECODER_NAME + str(random.random()))) % 1000000000)).replace('0x','') \                     + '_nohash_' + str(count) + FILE_FORMAT         rframes = record_wav(1) # record 1 sec         save_wav(hash_name, rframes)         #time.sleep(0.5) # 1sec, 0.1sec         print("录音回放开始!\n")         play_wav(hash_name, p)         print("录音回放结束!\n")         value = input("按‘回车’保存,放弃本条请按‘其他’键并回车!\n")         if (value == ''):             count += 1             print("保存录音成功!")         else:             os.remove(hash_name)             print("已删除本条录音!")                  #display.display(display.Audio(hash_name, rate=16000))     #wav = AudioSegment.from_wav(hash_name)     #play(wav)     p.terminate() 

相关内容

热门资讯

辅助了解!人人燕赵辅助(辅助)... 您好,人人燕赵辅助这款游戏可以开挂的,确实是有挂的,需要了解加去威信【136704302】很多玩家在...
辅助了解!情怀莆仙吹牛脚本(辅... 辅助了解!情怀莆仙吹牛脚本(辅助)捉住捣蛋鸡都是存在有辅助挂(哔哩哔哩)1、超多福利:超高返利,海量...
详细了解!新518互游插件(辅... 详细了解!新518互游插件(辅助)白金岛歪胡子竟然是真的辅助下载(哔哩哔哩)运新518互游插件辅助工...
教你了解!宝宝吃吃吃外g挂(辅... 教你了解!宝宝吃吃吃外g挂(辅助)开心娱乐一直真的是有辅助软件(哔哩哔哩)1、许多玩家不知道宝宝吃吃...
分享了解!微信开心泉州辅助(辅... 分享了解!微信开心泉州辅助(辅助)怀远麻将本来是真的辅助器(哔哩哔哩)1、实时微信开心泉州辅助透视辅...
关于了解!冰球突破辅助软件(辅... 关于了解!冰球突破辅助软件(辅助)和和嫩江麻将果然是有辅助神器(哔哩哔哩)1.冰球突破辅助软件 选牌...
科普了解!川娱竞技血战辅助器(... 科普了解!川娱竞技血战辅助器(辅助)中至鹰潭麻将原来是真的辅助平台(哔哩哔哩)1、玩家可以在川娱竞技...
推荐了解!微乐小程序辅助(辅助... 推荐了解!微乐小程序辅助(辅助)聚游广东麻将本来有挂辅助软件(哔哩哔哩)1、不需要AI权限,帮助你快...
必备了解!皮皮游戏辅助器(辅助... 必备了解!皮皮游戏辅助器(辅助)盛世2果然有挂辅助安装(哔哩哔哩);1、玩家可以在皮皮游戏辅助器线上...
透视了解!三哥玩透视辅助(辅助... 透视了解!三哥玩透视辅助(辅助)米乐互娱竟然是真的辅助脚本(哔哩哔哩)进入游戏-大厅左侧-新手福利-...