| RSS
深圳电器感厂家
您当前的位置:电感器制造商 > 行业动态

DSP嵌入式说话人识别系统的设计与实现

时间:2015-06-08 08:04:54  来源:扁平线圈电感厂家   点击:

(1)数组大小选择。该系统算法中包含训练和识别两个内容。语音信号的训练需要大量的数据才能准确的提取语音的特征参量。该系统采用8 kHz采样率的10 s的绕行电感器语音信号,所需的数组空间大小为80 000个数据单位;语音信号的识别要求快速性,该系统采用时间较短的8 kHz 3 s语音信号,所需数组空间大小为30 000个数据单位,为了减少数据空间,系统设定为与训练数组共用前30 000个数据单位的空间。
(2)数组类型为浮点型,由于设定的采样格式是16 b采样,而采样后数据类型是Uint32,语音数据位于低16位,所以赋值过程中取低16位数据赋值给数组。
1.5 模型参数存入与参数调出
将模型参数存入FLASH ROM的目的是保存训练所得的参数,以供识别时调用。训练可能用于多次识别,或者训练和识别可能处于不同的时间地点,所以,保存参数的存储器选定为具有掉电时数据不丢失特点的FLASH ROM。每个说话者语音参数代表一个说话者身份,所以每个说话者模型参数应存储在FLASHROM中一个确定的位置。为此,该系统在FLASHROM中分配了10块的区域,每个说话者模型参数占有一块特定的区域。
在FLASH ROM中存人数据格式为32 b无符号整数。而训练得到的是浮点型的数据。这就要求在数据存入之前将浮点数转换为32 b无符号类型的整数,假设模压电感要转换的数据为float x[M][N]则转换方法如下:
(1)x[M][N]归一化;
(2共模电感)对x[M][N]乘以一常数K得到有符号整型的数组y[M][N],即:
y[M][N]=x[M][N]×K (1)
(3)屏蔽第32位符号位,得到32 b无符号类型的整数数组。方法如下:
z[i][j]=y[i][j]&0x7FFFFFFF (2)
(4)将z[i][j]存入FLASH ROM。
通过统计实验数据发现归一化后数据的范围为10-5~1,故K选择为108,既可以实现较大精度的转化,又不会影响第31位的数值。转换得到的有符号整型数组y[M][N]范围为-108~108,在存储器中正数为原码表示,负数为补码表示,通过计算发现,该范围的正数第31位为0,负数第31位为1,所以,上述第(3)步,将有符号数转换为无符号数后,数值的正负改为使用第31位标识。在识别阶段,要将说话者的GMM参数依次从FLASH ROM中读出,逐个与待识别者语音的MFCC参数比较,求最大似然值。参数调出过程与以上存入过程相反。
1.6 说话人身份识别的结果显示
说话人的身份显示通过LED的组合显示确定。在DSK上有4只LED灯,将每个LED灯看成是一位二进制数。则4个LED灯最大可表示16个人的身份。该系统取前10个组合来表示所识别的说话人的身份。
1.7 自举的实一体电感现
以上程序都是通过PC机与DSP组合实现,要想使系统在DSP上单独完成,还必须实现自举。该系统采用ROM方式自举。在自举实现过程中,程序的烧写可以通过CCS自带的FLASHBorn工具实现。在烧写过程中应正确的分配FLAH ROM的空间。FLASHROM空间总塑封电感体分为程序存储区和数据存储区,经计算,程序代码段大小为0x162C0,故在FLASH ROM中划分127 KB的空间供程序代码使用,空间中未使用的部分供程序扩展使用。数据存储区划分的大小为64 KB的空间,每个说话者模型参数占用空间为4.2 KB左右,最多可存放15个说话人GMM模型参数。该系统训练者数目为10个,占用空间为42 KB左右。剩余的空间可用来扩展训练人数,也可用于后期系统的改进。如可以利用语音提示来显示说话人身份,而提示语音的数据可以存放于此区域。具体的存储的安排如表1所示。

2 系统的算法与软件设计
说话人识别系统的实现方案如图3所示。

输入的模拟语音先通过预处理,包括预滤波、采样、量化、加窗、端点检测、预加重等。语音经过预处理后进行特征提取。在训练阶段,对提取的特征进行相应的处理后就可以获得参考模型。识别阶段,语音通过同样的通道获得特征参数,生成测试摸型,之后将测试摸型与参考摸型进行匹配,从而根据判决逻辑获得判决结果。
2.1 语音信号的端点检测
语音信号的端点检测目的是去除语音信号中的噪声段。端点检测从很大程度上影响到识别率。常用方法有短时能量法,短时过零率法和双门限法等。本系统选用双门限法,实验表明,效果优于前两种方法。在双门限方法端点检测中,阈值的选择尤为关键,该系统的语音采样频率设为8 kHz,语音分帧为每帧80个点。经过多次实验,这里短时能量低阈值通过式(3)的动态方式得到,高阈值设为低阈值的5倍。而过零率的阈值选取应充分考虑到噪声的影响,通过大量实验发现系统中噪声的过零率一般不电感加工超过5,所以对过零率的阈值选取为25,取得了很好的效果,准确率达到95%以上。1

随着电力系统的不断发展,雷击输电线路杆塔引起的事故越来越多。在我国跳闸率比较高的地区,雷击引起的跳闸次数约占线路运行总跳闸次数的40蹦~70%“。]。雷击引起的线路跳闸

TMS320C32是32位浮点DSP芯片,在数字信号处理和自动化领域得到了广泛应用;而RS232(EIA232)是自动化控制领域中一种基本的串行异步通信规约。在开发基于TMS320C32的热力系统测控

SH_CP:数据输入控制端,在每个SH_CP的上升沿, SDA口上的数据移入寄存器, 在 SH_CP的第 9个上升沿, 数据开始从 QS移出。ST_CP:数据置入锁存器控制端。Q0~Q7:数据并行输出


上一篇: 燃料开关测试系统的设计与实现
下一篇:功率电感器
来顶一下
返回首页
返回首页
相关文章
推荐资讯
电感数字转换器
电感数字转换器
相关文章
栏目更新
栏目热门