當前位置:
首頁 > 最新 > 嗓音的聲學分析

嗓音的聲學分析

本刊:

《中國聽力語言康復科學雜誌》

2016年 第14卷 第5期 P351-355

精品賞析

人類嗓音源自聲帶的振動,發音過程是動能將通過聲道的氣流轉換為聲能,成為言語交流的基礎。如何對嗓音進行全面、有效的評估,判斷嗓音障礙的發病機理、病變部位、程度以及預後等是嗓音工作者必不可少的工作內容。在嗓音醫學的臨床實踐中,嗓音評估具有至關重要的作用。目前針對嗓音的臨床評估主要有以下4種方法:①嗓音的主觀感知評估;②嗓音的客觀聲學分析;③發音的空氣動力學檢查;④聲帶振動的內鏡影像學檢查。聲學分析作為嗓音評估方法之一具有客觀、非侵入性等特點,計算機嗓音分析軟體在臨床逐漸普及。

1 常用聲學分析參數

1.1 嗓音頻率及強度的檢查

基頻、聲壓級、基頻微擾、振幅微擾是嗓音聲學分析中最基本的聲學參數,是反映嗓音高低、強弱以及規律性的重要指標。

基頻是指聲帶振動的基本頻率,反映聲音的高低;聲壓級反映聲音的大小。基頻除與聲帶本身的基本特徵(長度、質量、張力等)有關外,還受環甲肌、甲杓肌及聲門下壓的調節。基頻微擾及振幅微擾顯示聲學信號中振動周期間頻率及強度的差異,均用於反映聲學信號的規律性,需要採集持續母音的聲學信號進行檢測。當聲帶病理改變等因素影響其周期性運動時,聲學性質將發生紊亂並摻入雜訊成分,基頻微擾、振幅微擾值均增加,因此能夠反映聲帶病理損傷或神經肌肉病變影響聲帶導致的嗓音改變等。

基頻微擾有許多測量方法,最常用的是基頻微擾比(jitter ratio)或基頻微擾百分比(jitter percent),是指聲波內相鄰周期間周期差異的均數與整體聲學信號平均周期的比值。另一個常用的參數為基頻微擾因數(jitter factor),與基頻微擾比類似,是其倒數,為聲波內相鄰周期間頻率差異的均數與平均頻率的比值。相對平均擾動商(RAP)又稱為頻率擾動商(FPQ),是相鄰3個周期間周期差異的均數與平均周期的比值。相鄰5個周期間周期差異的均數除以平均周期,則為音高周期擾動商(PPQ)。

與基頻微擾類似,振幅微擾的測量方法也有很多。最常用的是振幅微擾百分比(shimmer percent),為相鄰周期間振幅差異的均數與平均振幅間的比值。振幅擾動商(APQ)為相鄰11個周期間振幅差異的均數與平均振幅的比值。

由於嗓音本身具有多變性,加之基頻微擾、振幅微擾易受聲學分析過程中檢查設備、母音類型、性別、發音強度以及音調影響,不同聲學分析軟體具有不同的正常值標準,因此聲學分析的可靠性飽受爭議。採用統一母音進行反覆檢測的方法能夠有效提高其特異性及可靠性。Brockmann等人通過橫斷面隊列研究,發現發音強度及聲壓級明顯影響shimmer及jitter的數值,建議通過母音/a/及最低80 dB的發音強度進行基頻微擾及振幅微擾檢測,能夠有效提高檢查的可信性。

1.2 基於頻譜的聲學分析

聲帶振動發出的聲音被認為是近似於周期性的、具有不同頻率成分的複合波。這種周期性的聲學信號通過傅立葉轉換,分解為具有不同頻率、能量的與基頻成諧波關係的一系列正弦波。如果將它們的能量按其頻率次序加以排列,得到在某一時間斷面上的頻率—強度二維圖形,即為頻譜(spectrum)。頻譜能夠反映聲學信號在不同頻率上的能量分布,因此又稱為功率譜。

在嗓音聲學分析中,有短時頻譜(short-termspectrum )及長時平均譜(LTAS),前者指某一時間點上聲波在不同頻率上的能量分布,後者則是一段時間內聲波在不同頻率上的能量分布,例如一段具有一定時長、穩定的母音。相對於短時頻譜,LTAS能夠有效降低環境中隨機的噪音污染對於聲學分析的影響。

通過LTAS 能夠得到的參數包括諧噪比(HNR),嗓音紊亂指數(VTI),以及軟發音指數(SPI)。

在頻譜中,能量集中的最低頻率即為基頻,頻率等於基頻整數倍的正弦波即為諧波(harmonic)。頻譜中諧波總能量與雜訊能量之比,即為諧噪比。一般認為雜訊指標與聲帶閉合程度有一定關係,也就是說在一定程度上反映閉合氣聲狀況,聲門閉合越差、通過聲門溢出的氣流越多,雜訊越大。由於病變造成的聲音嘶啞度很大程度上取決於聲音中的雜訊和諧波成分的比值,因此諧噪比對聲音嘶啞程度的敏感性高,較基頻微擾、振幅微擾等參數對於聲帶器質性病變、老年性嗓音等檢查更敏感。

VTI是與呼吸有關的新參數,是指低頻率與高頻非諧波的平均比值,它代表高頻雜訊的相對能量級,與聲帶關閉不全或內收時鬆弛有關。SPI是較低頻率範圍內諧波能量與較高頻率範圍內諧波能量的比值。與嗓音主觀感知評估中GRBAS評估相比,其氣息音的程度與SPI明顯相關,該值的升高表明發聲時聲門閉合不良或聲帶內收無力,如聲帶麻痹。

2 聲學綜合分析方法

2.1 多維嗓音分析(MDVP)

MDVP是目前常用的聲學分析軟體,其標準化數據基於正常與病理嗓音資料庫,結果以圖形、數值的形式與標準化的閾值相比較。MDVP可以計算8個類別,共30項嗓音參數,見表1。在發母音/a/的情況下,基頻相關參數具有最高的穩定性,基頻微擾、振幅微擾、噪音相關參數、次諧波相關參數以及嗓音不規則性參數的穩定性處於可接受範圍內,微擾相關參數的穩定性最低。與振幅相關的參數相對於基頻相關的參數可靠性更高。

在應用MDVP錄製聲學信號過程中,環境因素、錄製時間、硬體選擇等均是聲學分析的影響因素。錄製過程中,為了避免環境噪音及回聲的影響,最好在消聲室錄製研究性的聲學信號,Deliyski等人建議在錄製過程中,控制信噪比即聲學信號與雜訊之間的比值為42。日常生活中,隨著時間的變化嗓音會出現輕微波動,因此對於需要反覆記錄嗓音的受試者,建議在每天的同一時間進行錄製。

2.2 聲音障礙指數(DSI)

DSI 指數由多個嗓音參數綜合計算而得,可以客觀、定量地評估聲音的質量,是描述嗓音障礙的重要參數之一。DSI 的計算公式如下:DSI=0.13×MPT+0.0053×F0max-0.26×SPLmin-1.18×jitter+12.4。其中MPT為最長發音時間,F0max為最高基頻,SPLmin為最小音量,jitter為基頻微擾。由於DSI的計算過程中既引入了聲學分析相關參數,又引入了空氣動力學評估範疇內的MPT參數,屬於多維的嗓音分析方法。正常嗓音對應的DSI指數為﹢5;嚴重嗓音障礙DSI指數為﹣5;因此DSI指數的範圍為-5~+5。也有學者認為在-8~+8之間,對1名受試者實施DSI檢查,分數相差2.49視為具有明顯差異性。

DSI的優勢在於語言病理學家在臨床實踐中可以便捷地獲取參數。DSI與GRBAS評估之間存在明顯的關聯性,同時能夠對功能性嗓音疾病、聲帶器質性病變及聲帶麻痹等疾病進行區別。年齡對DSI的影響大,隨著年齡增長,DSI數值降低,但是性別對DSI無明顯影響。從某種程度上說,DSI在老年性嗓音的評估上具有一定的研究依據。雖然DSI與GRBAS具有一定的相關性,但是研究顯示與嗓音障礙指數(VHI)無明確關聯性,DSI與VHI從不同的方向對嗓音障礙進行評估,不能相互替代,這也是聲學分析方法普遍存在的問題,目前還不能通過單純聲學分析對嗓音障礙做出全面而系統的評估,多種評估方式的結合才能使檢查結果具有臨床意義。

2.3 音域圖(VRP)

音域(register)是指嗓音能達到的最低音至最高音的範圍。對音域的評估通過VRP進行,VRP在某些文獻中也被稱為語音圖(phonogram)。VRP的橫軸為基頻範圍,縱軸為以dB為單位的聲壓級。在評估過程中,檢查者需要通過樂器對受試者提供音高,在此音高下,受試者從最小的發音強度開始(通常發/a/或/i/音),唱到能夠發出的最大發音強度。如法依次進行其他頻率的嗓音檢查。計算機對受試者發音頻率、強度進行自動描記,生成VRP。

正常的VRP圖形為傾斜的類橢圓形,可以明確顯示基頻和發音強度之間的關聯性,隨著發音頻率的升高,發音強度也會有輕微的上升趨勢。這是由於在低頻率發音時聲帶鬆弛,不可能通過提高聲帶緊張度提高發音強度,只能通過提高聲門下壓提高發音強度。在高頻率發音時聲帶緊張,對於聲門下氣流的阻力增加,需要更高的聲門下壓來維持通過聲門的氣流,使聲帶保持振動的狀態,因此聲音強度就更高。VRP範圍越大,提示受試者對於嗓音強度、頻率的調節性越好。雖然針對男、女受試者VRP具有一定的平均範圍,但VRP還是具有顯著的個人及時間差異性,相同的受試者在不同時間接受VRP評估,結果也會不同。目前VRP主要用於測定受試者的嗓音能力範圍,以及治療前後的嗓音能力評估。

3 嗓音學發展現狀

3.1 基於倒頻譜的聲學分析

倒頻譜(cepstrum)是在頻譜的基礎上再次進行傅里葉轉換得到的,為具有高尖峰值的圖形,又稱為倒頻譜峰值圖(CPP)。CPP能夠反映信號的周期性,信號的周期性強、峰值高,如在聲帶小結、聲帶麻痹等嗓音障礙情況下,聲學信號周期性弱、峰值低。倒頻譜不僅能對持續的母音進行分析,對於言語狀態下的母音成分也可進行計算。相對於傳統聲學分析方法,基於倒頻譜的聲學分析在這方面更具有優勢。發音與言語嗓音障礙分析(ADSV)便是基於倒頻譜理論,針對持續母音及標準言語檢測語句的聲學分析方法,CPP是其主要參數之一。除CPP外,此分析方法中還涉及倒頻譜峰值標準差(CPP standarddeviation,CPP SD)、低/高頻譜比(L/H spectralratio,L/H Ratio)以及低/高頻譜比標準差(L/Hratio standard deviation,L/H Ratio SD)等重要參數。

L/H Ratio源自頻譜,泛指頻譜中低頻區與高頻區間能量的比值,在ADSV程序中,低頻、高頻的界限劃分為4000 Hz。有研究顯示,氣息音的頻譜能量分布中,2000~3000 Hz以上頻率範圍內噪音能量偏高,因此L/H Ratio對於嗓音氣息程度的檢測十分敏感。

在ADSV軟體中,通過CPP 、CPPSD 、L / HRatio及L/H Ratio SD 4個參數,可以計算得出嗓音障礙倒頻譜/頻譜指數(cepstral/spectral indexof dysphonia,CSID)。研究顯示,CSID指數與嗓音主觀評估具有良好的相關性,能夠較為準確地評估嗓音障礙程度。區分正常嗓音與嗓音障礙的CSID數值目前尚無統一標準,通過ROC曲線研究顯示,當CSID≈24時具有良好的敏感性及特異性,當CSID≈19時敏感性更高,還能保證一定的特異性,可以用於嗓音障礙的篩查。由於ADSV應用於臨床實踐有限,仍應就其影響因素、臨床意義等方面進行探索。鑒於ADSV涵蓋言語障礙檢查範疇,不同語種導致的檢查結果差異性也是未來的研究方向。

3.2 非線性動態分析

以上聲學分析方法均是基於周期性或近似於周期性的聲學信號進行。聲學信號分為3類:①周期性信號或近似周期性信號;②存在次諧波成分的聲學信號;③非周期性信號。當出現嚴重嗓音障礙時,用周期性聲學信號為前提的聲學分析方法進行嗓音評估顯然不夠準確。因此,非線性分析技術逐漸應用於嗓音醫學領域。

與傳統嗓音聲學分析不同,非線性分析的目的在於尋找隨機、無序的聲學信號中的規律,前者則是尋找周期性的聲學信號中的變異。目前嗓音的非線性研究屬於探索階段,作為嗓音評估研究的新領域,其臨床應用價值和前景仍需要研究探討。

嗓音障礙的明確診斷是嗓音治療的第一步。目前,還沒有哪一種聲學分析方法能夠完全替代嗓音主觀感知評估,全面而準確地反映嗓音問題。因此聲學分析一定要結合其他嗓音評估方法,否則聲學分析的臨床應用價值將大打折扣。隨著研究技術和儀器設備的發展,探索新的聲學分析參數、簡化現有聲學分析方式、增加聲學分析的穩定性及可靠性、聲學分析的臨床應用等成為聲學分析主要研究方向。

註:相關文獻請查看當期原文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!

TAG: |