軟件介紹

宏樂聲紋對比控件是一款對比聲紋來識別聲音的音頻處理軟件。這是一款非常實用的軟件，可以用到生活中的方方面面。歡迎需要的用戶來綠色資源網(wǎng)下載使用。

宏樂聲紋對比軟件介紹

宏樂聲紋對比控件可以對比任意兩個聲音句子的紋理，并獲得兩個聲紋的近似度的百分值。讓軟件設(shè)計者根據(jù)識別的結(jié)果控制各種設(shè)備或操縱軟件執(zhí)行相應(yīng)的功能。

用戶可以將不同的特征文件與數(shù)據(jù)庫一一對應(yīng)保存，然后通過對比函數(shù)從數(shù)據(jù)庫取出不同的特征文件與當(dāng)前的錄音結(jié)果對比，從而知道當(dāng)前的聲紋與數(shù)據(jù)庫內(nèi)的哪一個聲紋最吻合。

我們還為掌上電腦，或?qū)W習(xí)機提供DLL評分插件。通過它，可以獲得學(xué)生跟讀老師句子的吻合程度。

該控件還附帶一個精美的可變色按鈕控件，利用它可以美化程序的界面。

宏樂語音識別控件功能

1.Rocord 〔錄制〕(true 或 false) true 開始錄音（控件在句結(jié)束后自動停止錄音并識別）。

2.Establish 〔設(shè)置〕(true) 將當(dāng)前的錄音特征設(shè)置為對比特征。

3.Percentage 〔評分〕獲取當(dāng)前對比結(jié)果的分?jǐn)?shù)值（0 表示根本不吻合，有數(shù)值表示相似度的百分比。）

4.AutoRecord〔自動錄音〕（true 或 false） true 則啟動適時錄音，源源不斷的將錄音的內(nèi)容進(jìn)行對比分析。Falae 則關(guān)閉自動錄音。

5.Comp 〔對比特征〕從V9.0版本起,這個指令不再對比bin格式特征文件名,而是對比當(dāng)前啟用庫的一個特征名稱！可用44.UserLib(啟用庫名稱)函數(shù)來選擇庫。

6.EstablishVoiceFileNameToComp 〔設(shè)聲音文件為對比〕(WAV格式聲音文件路徑名稱) 將一個任意格式的WAV文件分析后獲取的聲紋特征設(shè)置為對比內(nèi)容。(注意：用聲音文件來對比，如果還沒有聲音庫，請用16位單聲道8000采樣的格式記錄聲音，這樣可以省略格式轉(zhuǎn)換的過程。)

7.CompVoiceFile 〔對比聲音文件〕(WAV格式聲音文件路徑名稱) 將一個任意格式的WAV文件（而不是錄音內(nèi)容）來對比。(可直接拖放Wav文件到本控件測試)

8.Noise 〔測噪音〕(true) 這個函數(shù)一般不用,因為控件會在錄音結(jié)果

9.Volume 〔音量〕獲取當(dāng)前錄音結(jié)果的音量（最大值為100）

10.Painting 〔繪圖〕（true 或 false） true 則繪圖，false 則不繪圖。

11.RecordCharacterFileName 〔錄音特征文件名〕(bin格式文件名) 獲取當(dāng)前錄音結(jié)果的特征文件名全稱。（特征文件的長度為2310字節(jié){如果選擇身份鑒別長度為2320字節(jié)}，可以將這個文件用不同的名稱命名保存到數(shù)據(jù)庫中對應(yīng)某個聲音文件，便于單獨或批量對比。通常這個文件名是控件包路徑+"\總特征.bin"）

12.CompCharacterFileName 〔對比特征文件名〕(bin格式文件名) 獲取對比特征文件名的全稱。(通常這個文件名為控件包路徑+"\總對比特征.bin")

13.OpenF12 〔允許F12鍵錄音〕(true 或 false) true 則允許F12鍵代替鼠標(biāo)錄音。（按下F12開始錄音，放開F12結(jié)束錄音。結(jié)束錄音的同時分析聲紋的相似度）

14.DiscriminateBody 〔鑒別身份〕 (true 或 false) 選擇 true 則比較嚴(yán)格的校對個人的聲紋，選擇 false 則適合男女老幼的各種音色。

15.Reverse 〔反向〕(true 或 false) true 則反向，用于相位相反的麥克風(fēng)接口。

16.Play （播放錄音） (true) 播放現(xiàn)場錄音的（學(xué)生）聲音,或 CompVoiceFile 函數(shù)調(diào)入的聲音文件。

17.Play_Comp （播放對比） (true) 播放用于對比的（老師）聲音。

18.Re_Recognition 〔重新識別〕(true 或 false) true ，主要用于“反向”之后的不重錄音而直接識別。

19.OCX_Path 〔控件路徑〕(true 或 false) true ，讀取控件所在的路徑全稱。

20.IsOver 事件，這個事件在分析完畢后自動啟用。能調(diào)用OCX控件的用戶在設(shè)計時雙擊本控件可以看到IsOver事件，然后在這個事件中插入分析完成后響應(yīng)的代碼。

21.Max_Record_Timer（沒有響應(yīng)的最大秒數(shù)） (1～６０)　人工錄音方式時啟動錄音后如果一直沒有聲音數(shù)據(jù)提交，將在這個值到后無條件停止錄音提交數(shù)據(jù)進(jìn)行分析（默認(rèn)值是6秒）。

22.PeakValue (峰值校驗 ) (true 或 false) true 則校驗峰值誤差（校驗峰值誤差有時會因為環(huán)境噪音太大導(dǎo)致聲音串首尾定位不準(zhǔn)而評分失?。?。

23.ALC (自動電平 ) (true 或 false) true 則啟用自動電平控制，能在聲音較小時放大，聲音太大時衰減到比較合理的電平。

24.WordNoumber (字段數(shù)) () 一個數(shù)值，顯示詞句切割出的段數(shù)（個別詞會無法分割而連接在一起，所以這個值并不代表字?jǐn)?shù)，可以理解為嘴唇開合的次數(shù)），用于將數(shù)據(jù)庫分類，減少識別時搜索的范圍。[注意:使用它分類要考慮有可能誤差正負(fù)1個值;比如獲得的字段數(shù)是3，應(yīng)該在2、3、4字段庫尋找特征文件]

25.Zero (允許零分 ) (true 或 false) true是默認(rèn)值，在不吻合的因素太多時評分的值為零，但在老師與學(xué)生聲紋誤差較大時會也可能導(dǎo)致錯評為零分的現(xiàn)象，此時應(yīng)該禁用它。

26.Word_Max_Timer(t) t是提交詞匯的反應(yīng)秒數(shù)（停頓提交詞匯的時間），范圍必須在0.125秒～3秒之間。（默認(rèn)值是0.66秒）

27.Auto_Clips (自動剪輯) (true 或 false) 默認(rèn)為true；對應(yīng)于控件的“自剪”復(fù)選框。true則錄音按鈕點擊開始錄音，當(dāng)音量小到只有噪音時提交錄音結(jié)果并分析。false則錄音的開始與結(jié)束是手工控制，按下錄音按鈕[或使用Rocord_Start(true)函數(shù)]開始錄音，放開錄音按鈕[或使用函數(shù)Rocord_End(true)]結(jié)束錄音并提交分析。

28.Rocord_Start (開始錄音) (true) 在“自剪”復(fù)選框（自動剪輯）不選時，啟動錄音。

29.Rocord_End (結(jié)束錄音) (true) 在“自剪”復(fù)選框（自動剪輯）不選時，結(jié)束錄音并分析。

30.Filters_Infrasound (濾除次聲波) (true 或 false) false是默認(rèn)值，濾除次聲波的功能已經(jīng)在句子剪裁器中使用，通常對比現(xiàn)成的WAV文件才使用它，濾除非語音成分的超低音部分，主要排除板載聲卡的零點電平漂移或口風(fēng)或風(fēng)扇等帶來的低頻噪音。

31.FrequencyFitsTogetherRate (頻率吻合率) 對應(yīng)最上方的版塊，頻率曲線吻合的百分值

32.PeakMatchingRate (峰值吻合率) 對應(yīng)中間的版塊，峰值曲線吻合的百分值。

33.FrequencyChartFitsTogetherRate (頻譜吻合率) 在身份鑒別狀態(tài)下，它顯示頻譜的吻合百分值。

34.ReasonDoesNotMatch (不吻合原因) 在評分失敗后給出原因，鼠標(biāo)點擊分?jǐn)?shù)可以看到這個提示。

35.CutRatio (切割比例) 頭尾切割與最大值的倍數(shù)，值在10～50之間,這個值影響數(shù)據(jù)頭尾定位的切割（默認(rèn)值=25）

36.FrequencyComp(頻率鑒別選擇) 頻率鑒別選擇,它控制最上方的頻率變化曲線版塊是否參與分析, 可以用 FrequencyComp(True) 或 FrequencyComp(False) 指令控制它。

37.Save(保存特征) 保存特征，并給特征命名；可用 Save("") 啟動輸入板；或直接命名一個特征，如Save("1234")。

38.CompAll(批量對比(特征庫的所有內(nèi)容)) 用當(dāng)前的錄音與對比特征庫內(nèi)所有內(nèi)容進(jìn)行對比，可用 CompAll("") 指令啟動批量對比。

39.AutoCompAll(自動批量對比) 分析完錄音后自動啟動批量對比，可用 AutoCompAll( true ) 啟用它用AutoCompAll( false ) 禁用它。

40.MaxNumber(有分?jǐn)?shù)的結(jié)果個數(shù)) 有分?jǐn)?shù)的結(jié)果個數(shù)，可用 MaxNumber(0) 讀取它。

41.Answerp(取第幾個答案) 取第幾個分?jǐn)?shù) ，可以用 AnswerP(1) 獲得最高分用 AnswerP(2) 獲得第二高分,其他以此類推。

42.AnswerT(取第幾個答案) 取第幾個特征結(jié)果名稱.

宏樂聲紋對比工具使用方法

測試的技巧主要是先調(diào)整好麥克風(fēng)的靈敏度，然后點擊“錄音”，發(fā)音停頓則結(jié)束錄音并評分。此時會看到一條亮青色的變化曲線；之后點擊“保存特征”，記錄到特征庫中,同時會看到亮青色的曲線變?yōu)榛疑?/p>

如果只是單獨對比兩個聲音特征請將“批量”復(fù)選框設(shè)為不選，然后在特征列表中選中要對比的內(nèi)容，這是會看到灰色的曲線對應(yīng)特征而變化，點擊“錄音”按鈕，錄入一個句子，則可看到評分的結(jié)果。

V9以上的版本默認(rèn)錄音結(jié)束后對比當(dāng)前特征庫的所有特征，并將對比結(jié)果從高分到低分順序排列。

這些過程完全可以用軟件通過相應(yīng)的函數(shù)來控制；具體請參閱函數(shù)說明。

錄音時麥克風(fēng)不能正對準(zhǔn)口中央，你會發(fā)現(xiàn)用于語音識別的耳麥麥克風(fēng)都是偏離嘴巴的。同時不易遠(yuǎn)距離錄音，當(dāng)有效的聲音與環(huán)境噪音達(dá)不到5倍以上，識別將不理想；最重要的是如何獲得連續(xù)的頻率曲線，如果破碎，要分析原因。對于一個詞組或句子來說，曲線斷續(xù)是正常的，因為一些語音成分沒有頻率特征，比如聲母T、F等，對應(yīng)它的部分是一個缺口，這里指的破碎是指對應(yīng)一個字中的曲線是否連續(xù)。

峰值曲線的切割是自動的，但要注意錄音時是否有干擾的噪音，請留意曲線的頭尾是否正常切割，再將它保存到特征庫中。

特征庫是需要長期訓(xùn)練的，合理的方法是設(shè)為對比以后，重錄一次，看看分?jǐn)?shù)是否足夠高，不高的要重錄。

（如果特征曲線總是出不來，請嘗試“反向”功能，通常在面板插入的麥克風(fēng)插孔需要“反向”）

為了提高識別率，不同時出現(xiàn)的特征庫要盡可能的分類。假設(shè)正在操控一個窗體，而窗體上只有幾個按鈕，這種情況下應(yīng)該為該窗體單獨建立一個小特征庫，庫內(nèi)只有相應(yīng)的幾個按鈕的特征，這樣識別起來就會很準(zhǔn)。

當(dāng)庫內(nèi)特征較多時，不可避免會出現(xiàn)識別結(jié)果不止一個或需要的結(jié)果不排在第一位的現(xiàn)象，這時應(yīng)該類似拼音輸入法，讓同音字或詞組有個選擇的機會。