當前位置:
首頁 > 最新 > 不可想像!人的語音中會包含如此之多的信息

不可想像!人的語音中會包含如此之多的信息

人工智慧時代來臨了,作為模式識別中最為重要的一支——語音識別,語音中包含了哪些信息呢?為小夥伴們羅列了一下,希望能有所幫助。

一、語音中的語義信息(含文字信息):語義信息也就是日常語言所說的信息,它不僅包括語言提供的信息,比如天氣預報,命題或描述語句,預言, 科學理論......提供的信息,也包括其它事物提供的信息,例如:溫度表、天平、秤、GPS、數學公式、交通指示牌、疾病癥狀、化驗數據、圖片、視頻等提供的信息。因此,從廣義上看,數據的含義就是語義,語義的概念應該包涵兩個方面的內容:1)、語義信息和信號(message)的含義及知識有關;2)、語義信息可以包含在單個信號(message)和命題中。

二、語音中的生理信息(含情緒信息):人的發音器官大致可分為3個部分:喉下、喉部、喉上部分。喉下有用來呼吸,並且也包括發音能源的各器官,包括氣管、肺、胸廓、橫膈膜和腹肌。喉部是聲源器官,包括喉頭、聲帶。喉上是用共鳴作用或阻礙作用來調節聲音的各器官,包括口腔中各部及鼻腔。

人類聲音的發出,是多個發音器官共同作用的結果,所以在語音中就包含了這些發音器官的生理信息,例如,當一個人感冒時,其發聲就有明顯的改變和特徵。中醫中的「望聞問切」中,就明確說明了可以通過一個人的聲音信息來辨別生理的病變。

同樣,在一個人的聲音信息中還明確包涵了語言中的情緒信息。

三、語音中的聲紋信息:所謂聲紋(Voiceprint),是用電聲學儀器顯示的攜帶言語信息的聲波頻譜。現代科學研究表明,聲紋不僅具有特定性,而且有相對穩定性的特點。成年以後,人的聲音可保持長期相對穩定不變。實驗證明,無論講話者是故意模仿他人聲音和語氣,還是耳語輕聲講話,即使模仿得惟妙惟肖,其聲紋卻始終不相同。

按照常用的方法,可以製作七種聲紋圖:寬頻聲紋、窄帶聲紋、振幅聲紋、等高線聲紋、時間波譜聲紋、斷面聲紋(又分寬頻、窄帶二種)。其中,前二種顯示語聲的頻率與強度隨時間推移的變化特徵;中間三種顯示語音強度或聲壓隨時間變化的特徵;斷面聲紋只是顯示某一時間點上聲波強度和頻率特徵的聲紋圖。

四、語音中的語種信息:語言是人類用來交流的一種工具。但對人類語言差別的準確定義則是很困難的。據統計提供的人類語言數量是5561種,在這之外,已經有很多種語言文字在世界上消失了,也有很多小語種並為統計入列。其中使用人數超過去5000萬的語言有13種:漢、英、印度、俄、西班牙、德、日、法、印度尼西亞、葡萄牙、孟加拉、義大利和阿拉伯語。按被規定為官方語言或通用語言的國家數目來說,英語占第一位(約44國),法語第二(約31國),西班牙語第san約22國)被定為聯合國的正式語言的有五種:漢語、英語、俄語、法語、西班牙語。

五、語音中的邏輯信息:邏輯是人類語言中所包含的,超越語義的深層次信息,是人類思維邏輯的具體表現形式之一,其與上下文相關、問答相關、大腦思維相關,通過對語言中邏輯信息的提取,可以研究一個人慣用的思維方式,甚至性格、氣質等。

六、語音中的空間信息:人的語音以聲波形式由空氣作為媒介傳到對方,言語聲波的特性分析是現代語音學研究的最重要手段之一。言語聲波的研究,早期都由物理學家進行。20世紀初分析語音只能用一種特製的浪紋計畫出波形,用傅里葉分析尺對逐個周期的波進行測算,才得出表示聲波特性的頻譜和頻率。通常,為了研究語音中的聲學特性,會對語音中的聲學特徵、言語波模式、過渡音征等進行分析和研究。

七、語音中的韻律特點:語音的聲學特性除音色外,還有3種特性,如音強、音高、音長,總稱為語音的韻律特徵,也可以稱為超音段特徵,它們都可以用語圖儀或音強計、音高計等儀器來分析。音強顯示語音的重音、輕音等強弱變化,音高表現語音的字調與語調,而音長則對語言節奏的快慢,字與句之間的長短關係等加以準確地計量。

用普通話、廣州話和上海話3種方言來朗讀一首古詩,會得到不同的窄帶語圖。從圖中比較這3種方言中韻律特徵,除了音色不同之外,聲調的調形、變調的規律以及輕重音的分布都有很大的區別。韻律特徵研究在提高人工言語合成的質量上起著決定性作用。聲學研究已致力於韻律特徵的全面分析。

八、聽覺中的生理信息:聽覺作為人類語音信息的接收端,有著重要的作用,是語音信息的天然的反饋形式,同樣的聲音,不同的人會解讀出不同的語義、空間等信息。一個人的生理聽覺取決於其HRTF函數情況。研究一個人的生理聽覺情況,對於語音全維信息圖譜的研究有著不可或缺的作用。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 知行合一工程化 的精彩文章:

TAG:知行合一工程化 |