Displaying present location in the site.

全球最精確!根據「意義」分析巨量文字數據─NEC的文字分析技術

「文字含意辨識技術」可應用於企業活動的風險控管。

山本
不過,只要運用文字含意辨識技術,事先輸入符合禁止事項的文字,就能從大量文件中篩選出含有禁止事項的文句。這樣一來,管理人員就能滴水不漏地檢閱含有可疑文字的報告和郵件,可提升風險控管的工作效率。
三田
原來如此!
山本
順道一提,這裡所謂的監控不只在發現風險,還能找出商機。
三田
這話怎麼說呢?
山本
舉例來說,在分析社群網站留言等文字數據時,或許可以判讀出過去未曾注意過的市場需求,再根據這些資訊提供商品訊息或發送折價券,即可藉此提升業績。
三田
也就是說,發揮創意來開拓更多用途,是吧? 另一項用途呢?
山本
對於消費者反饋給企業或機關的意見,這項技術可以「彙整(※)」出意義相同的意見和要求。
※NEC稱之為「概要掌握」。
三田
彙整?
山本
假設三田小姐是速食麵的新產品負責人,在分析問卷調查結果時,針對問卷中各式各樣的意見,例如「湯頭要濃」、「麵條要有咬勁」、「包裝要新穎」等等,在分析消費者意見前,首先得把這些意見分門別類才行,對吧?
三田
第一道關卡就是非常艱鉅的任務呢。
山本
能夠自動幫我們完成這項艱鉅任務的就是文字含意辨識技術(※)。讓電腦讀取大量問卷的文件資料後,就能將意義相同的資料自動彙整,例如「湯頭要濃」、「麵條要有咬勁」、「包裝要新穎」等等。不僅如此,還會一併顯示該群組的「代表字眼」,一看就立即明白是怎樣的群組。
※ 正確來說應該是應用了NEC以「文字含意辨識技術」為基礎研發的「含意分群技術」解決方案。

 根據意義將大量的文件群分組,並篩選出代表字眼的機制。

水口
像這樣將消費者意見彙整成群組之後,就能清楚掌握哪種意見有多少數量。這樣的資訊有助於找出產品或服務相關有待解決的問題。
三田
原來如此。
山本
順道一提,文字含意辨識技術可應用在任何的文字數據上。電子郵件、社群網站留言,甚至是電話客服中心的通話內容記錄也都適用。
三田
換句話說,這項技術的應用範圍相當廣泛呢!

斟酌單字重要性和句型結構,提升分析精確度。

三田
NEC這項技術具有何種優勢呢?
山本

首先,NEC文字含意辨識技術的精確度已獲得全球第一的評價※
※由NIST(美國國家標準與技術研究院,National Institute of Standards and Technology)進行之評鑑。

三田

哇!全球第一嗎?

山本

是的。傳統技術在比對兩段文字的語意時,主要是以「單字」是否一致作為判斷基準。如果遇到異詞同義或同詞異義的情況,就無法分析出正確結果。然而,NEC的文字含意辨識技術分析的方式則一併將該段文字中重要的單字和主詞、述詞等句型結構納入考量。如此一來,即使看似相同的單字,也能辨識其文意的不同。

三田

可是,如果連句型結構都要這麼仔細地分析的話,感覺好像很花時間……。

山本

以NEC的文字含意辨識技術來說,從近七百萬句的文字數據中找出意義相同的文句,處理時間大約是0.2秒。

三田

哇,好快…!

山本

就是因為我們擁有全球最快的處理速度,所以很適合數量極為龐大的文字數據,也就是所謂的巨量資料方面的應用。

三田

原來是這麼一回事啊!