Displaying present location in the site.

於美國成立資料分析流程自動化的新公司

以「資料科學民主化」為目標

AI改變了資料科學的常識,目標是實現任何人都能活用資料分析的社會

2018年4月,NEC宣布成立「dotData.Inc」(下稱dotData)公司,研發、銷售由AI將資料分析流程自動化的軟體,該消息也獲得客戶與業界相關人士的熱烈迴響。本專欄將為各位介紹,在美國成立這間新公司的目標,以及既有技術所帶來的價值。

隨著機械學習技術的發展,企業與公家機關過去累積至今的資料將愈來愈具價值。例如商品個別銷售額預估、活動效果預估、機器故障預測等,運用累積資料的資料分析市場,正從北美開始向世界各國擴展中。

而進行資料分析時,最困難之處是在設計輸入機械學習模型的「特徵量」這項產生資料步驟的流程。能否導出高精確度的預測分析結果,關鍵就在於輸入資料(=特徵量)的品質。因此,資料科學家過去必須長時間反覆設計並驗證特徵量,耗費人力找出各個分析對象(商品或地區)所存在的多項規則性。然而,這項流程全都憑藉資料科學家的個人技能與經驗,因此而面臨的問題是:預測分析精確度經常產生落差。換句話說,資料科學在過去是僅有少數專家才能駕馭的領域。

NEC積極研發使用AI的資料分析程序自動化技術,特別是在長久以來被認為「唯有人類才能勝任」的「特徵量設計自動化」領域中,更是擁有領先全球的技術。隨著巨量資料市場的環境變化,以及企業、技術人員的改變意識,資料分析流程自動化技術的普及已逐步打下良好基礎。NEC有鑑於此,秉持著「任何人都能進行資料分析,並推出更好的服務與商品」這項願景,成立了新公司dotData。

看準持續進化的市場與顧客需求

運用本項資料分析流程自動化技術,能夠將原本在實證實驗中需要耗費2~3個月的特徵量設計時間,縮短到1天以內,不僅如此,從篩選出的特徵量,更能獲得人類所無法發現的洞見(Insight)等。為了因應未來持續進化的市場與顧客需求,除了擴展處理資料的種類等,持續加強本技術的核心領域之外,NEC也著眼在客戶的業務流程研發,以期實現任何人都能運用資料分析的社會。

在日本市場方面,NEC已向dotData申請軟體的獨家銷售權。預期在不久之後,當dotData研發軟體導入到全世界,過去一向由資料科學家負責人工作業的流程,在自動化與簡易化後,屆時可望實現能讓資料科學家更加集中在本質業務上的工作環境,例如運用累積資料,擬定、設計出商業模式,並套用、運用至業務上等。今後dotData也會更加積極透過VC等公司外部募集資金、採用外部人才,同時也不排除IPO(首次公開發行)的可能性,目標是2022年度企業價值達到500億日圓。

以「分割(Carve-out)*」手法於北美成立新公司的目標

1.「競爭環境」

資料分析相關市場,美國就佔了大約一半。換句話說,在美國對於資料分析的需求最高。dotData身處在這片最大、最尖端的競爭環境之中,為使公司願景與產品持續成長,特別將總公司設在矽谷。置身在嚴苛的競爭環境與刁鑽的需求之中,首先第一步就是在美國市場確立一定的存在感(Presence),接著是著手擬訂計畫,一步步打造足以在全球奮戰的事業。

2.「確保人才」

由於矽谷的工作環境十分多元,無論軟體領域或AI領域的工作都相當具有挑戰性,因此聚集來自世界各國的優秀人才。dotData將總公司設在矽谷,目的是希望可以利用新創公司特有的吸引力,獲得對本公司願景與產品產生共鳴的優秀人才。

3.「成長速度」

與傳統型的公司內部投資企業不同,而是從NEC當中,將NEC成長事業領域的資料分析相關技術與開發小組分割出來,如此不僅能取得公司外部資金,亦能加速事業開發。正因為公司剛成立,方能迅速靈活地做出決策,以火力全開的成長速度逐步提升事業價值。

 

※企業將自家公司過去經手具有發展性的研究成果等一部分事業種子分割出來,設立獨立投資公司的手法。

(日文版原文發表日期:2018年7月)

研究者簡介

藤卷遼平 NEC資料科學研究所主席研究員、工學博士

大學主修航空宇宙工學。念碩士時,致力於研究使用機械學習/資料探勘(Data Mining)技術檢測人工衛星的異常與故障。進入NEC後,隷屬於資訊.知識研究所,負責研發演算法、機械學習/資料(數據)探勘原理等,也從事研發巨量資料分析所需的解決方案與軟體等。2011年起轉調美國,與全球客戶共同開發解決方案、軟體。2015年成為NEC史上最年輕的主席研究員,2018年預定就任美國dotData的CEO。