Taiwan
Displaying present location in the site.
在噪音環境下仍能輕鬆通話,語音辨識率大大提升!為您直擊「NEC低失真降噪器」音響訊號處理技術的秘密
將聲音傳送給「機器」
- 三田
-
辻川先生,等了這麼久,現在要輪到您上場囉!可以請您談談將聲音傳送給「機器」,也就是所謂的「語音辨識」技術嗎?
- 辻川
-
接下來,就讓我簡單地介紹一下「語音辨識」的原理吧!首先在辨識前,我們要先讓語音辨識裝置事先建立「ㄅ」、「ㄆ」這些注音符號庫,以及取樣頻率等等。這項工作必須蒐集幾千、幾萬筆樣本資料,並讓語音辨識裝置學習,然後再推測所輸入的聲音可能與哪一個樣本資料吻合。
- 三田
-
原理原來是這樣子啊!
- 辻川
-
最後在消除雜音的時候,必須將聲音調整為與機器內建樣本相近的聲音形態,所以機器所能辨識的聲音和人類聽得到的聲音是不一樣的。
- 三田
-
原來如此。

語音辨識原理
- 辻川
-
NEC的語音辨識雜音抑制技術就是將麥克風的訊號進行「整形處理」,讓機器更容易進行語音辨識。順帶一提,NEC語音辨識技術適用的用途非常廣泛,比方說,將會議的語音資料即時轉換為文字資料(※1)、或是用語音輸入方式確認工廠的庫存作業(※2),另外,三麗鷗彩虹樂園(位於日本東京都多摩市)所提供能和卡通人物「大耳狗」對話的服務(※3),就是採用NEC的語音辨識技術。即使在工廠或遊樂場這一類吵雜的環境下,也能確實進行語音辨識所需的「整形處理」,才能滿足客戶在語音辨識產品及服務上的需求。
※1產品名稱為「VoiceGraphy」 ※2產品名稱為「VoiceDo」
※3 自2012年4月~6月起開始提供「大耳狗說話」服務 - 三田
-
不過,我們最常將語音辨識用在智慧型手機上,如果周邊環境吵雜的話,手機就無法做出正確的反應。即使在雜音較多的地方,是不是也能確實做到語音辨識呢?
- 辻川
-
本公司從今年5月起開始提供這項技術(※)。傳統的技術必須靠近麥克風才能進行語音辨識,NEC所研發的是即使和麥克風稍微隔一段距離說話,也能達到語音辨識效果的技術。這項技術乃是利用2組麥克風消除雜音,然後再將聲音調整為最適合語音辨識的狀態,這麼一來,即使在充滿雜音的環境下,也能利用智慧型手機或平板電腦進行語音辨識。另外,像是行進中的車內環境、或是有電視聲的客廳這一類充斥雜音的空間,也能藉由這項技術正確進行語音辨識。
※這是一項即使在雜音環境下,也能利用語音方式遠端操控家電或智慧型手機的語音辨識技術
- 三田
-
真的能夠辨識嗎?
- 辻川
-
您要不要體驗一下呢?(拿出喇叭等音響裝置以及電腦)現在我們用喇叭播放吵雜的音效。這裡有一個麥克風,三田小姐,請您稍微和麥克風保持一點距離,然後講講話。
- 三田
-
嗯~「您好」「初次見面」。(裝置也回答「您好」「初次見面」)
- 三田
-
哇!它回答我了!
- 辻川
-
語音辨識裝置即使在吵雜的環境下,也能辨識三田小姐的聲音,並且用語音回答,這麼一來,即使在充斥雜音的空間,而且和麥克風稍微保持一點距離的位置,裝置也能確實辨識我們的聲音。
- 三田
-
這真是一項我們切身需要的技術呢(笑)!希望它可以運用在各種裝置上,今天非常感謝兩位和我們分享了這麼有意義的新知。
- 宮原、辻川
-
我們也非常高興能接受您的訪問,謝謝!

結語
這次我們為各位介紹了「EuphoMagic」這項技術,即使在充斥雜音的環境下,也能進行通話或語音辨識。在我們剛剛所做的體驗實驗中發現,雜音幾乎消失,聲音變得更清晰了,可惜我無法也讓觀眾們親身體會這種感受。未來這項技術如果能夠普及,相信我們的生活一定會變得更舒適,「MiTA TV」我們下次見囉!