Cortana暖身,微軟AI野心勃勃

「松鼠陪著核桃在庭院追迷藏,葡萄躲進木桶釀出時光。」2016年6月1日微軟開發者峰會上,Ptt創辦人、來自台灣的Microsoft人工智慧亞太區研究總監杜奕瑾,站在舞台上對著Cortana說,「請播放周杰倫的〈前世情人〉」時,Cortana馬上聽懂了杜奕瑾的指令,隨即並播放周杰倫最新MV〈前世情人〉。不僅如此,Cortana還會訂餐,當用戶的會議日程與用餐時間產生重疊時,Cortana會提前進行詢問是否需要訂餐,並且推薦用戶喜歡的美食。

翁羽汝/製作

工作與生活的幫手Cortana

Cortana是微軟開發的虛擬語音助理。「Cortana的研發歷程,不像一般產品,更像是孩子慢慢長大的過程,它先天很聰明資質很好,雖然我們還有很多不滿意的地方,但用戶回饋常給團隊很多驚喜。」微軟亞洲網際網路工程院常務副院長兼產品及開發總經理幺寶剛說。

「我們要打造個性化與客製化的,屬於你的Cortana。讓Cortana非常了解你,提供無縫接軌的服務,幫助你的工作和生活。」幺寶剛說。他舉例,讓Cortana提醒使用者下一個會議和與誰開會;如果會議在城市另外一點,Cortana會提醒使用者早點出發,因為當時交通有些壅塞。Cortana非常了解使用者的日程,喜歡看哪種新聞,喜好哪種食物,並且能在最適合的時機點,提供這些服務。「我們還在做不同的嘗試,看哪種個性的Cortana,哪種聲音的Cortana使用者會喜歡。」

人工智慧助手已經成為科技巨頭的兵家必爭之地,除了微軟,Google、亞馬遜與百度等公司紛紛推出雷同產品,百家爭鳴。不過微軟早在1991年就招攬人工智慧人才,累積研發能量一直到現在。今年3月微軟開發出一款人工智慧聊天機器人Tay,一炮而紅,但才上線一天就因種族歧視暫停使用。

截自Windows Cortana官網

「微軟的人工智慧研究成就都很突出,尤其是在語音辨識和圖像辨識等領域,如果你沒有非常認真的投入這些領域,是很難發展並且轉化成產品的。」微軟執行長納德拉(Satya Nadella)在公開場合曾自豪地說。微軟人工智慧團隊10月就發表了一篇語音辨識系統的論文,報告中指出,微軟語音技術在Switchboard(美國國防高級研究計劃局資助蒐集的電話對話語料庫)對話語音辨識的詞錯率為5.9%,與人工聽寫的錯誤率差別不大。

把AI技術打包成API

單靠語音助理,無法撐起微軟的人工智慧大夢,微軟雲端平台Azure在微軟人工智慧藍圖中扮演更關鍵角色。「微軟要把人工智慧技術民主化(democratize),成為汽車、醫療製造、金融保險等領域企業的賦能者(enabler)……大眾把人工智慧看得太玄了,我們應該要用一種平常心去面對這樣的科技。」微軟全球資深副總裁洪小文說。

為了達成民主化目標,微軟從雲端平台Azure切入,圍繞Cognitive Services核心,把人工智慧所有的技術打包成API,讓開發者使用。「微軟是一個平台公司,讓任何一個公司可以來簡單ㄐ寫用人工智慧,包括了語言、語音與視覺等各種領域,大家都可以用我們的API(Application Programming Interface,應用程式介面),很容易就可以寫程式。」洪小文舉例,以造成轟動的How old.net來說,裡面的代碼不到八行就可以寫出來,因為這個Code是Cognitive Services的API,微軟還陸續推出了新的Cognitive Services,不斷的更新,產生一些新的功能,最近加的Video的功能,也是一個新API,是Aptionbot.ai,也可以上傳任何照片。

為企業應用添加人工智慧

「微軟所有願景的交匯處就是人工智慧。人工智慧提供的是將大數據解析之後產生智慧……我們如何為所有的軟體和應用,比如Cortana、Office 365、Dynamic 365,添加人工智慧因素?這是我們發展人工智慧的角度。」納德拉說。為了人工智慧,微軟也以262億美元收購專業社群網站LinkedIn,是微軟史上最大併購。「擁有再高深的軟體演演演算法,再強大的硬體,沒有所謂的商業邏輯與資料積累,任何商業的人工智慧都是沒有意義的空盒子。微軟買LinkedIn為的是幫Office 365軟體及客戶關係管理Dynamics注入專業人士的靈魂。」HWTrek創辦人王仁中在Facebook上發文分析。

「LinkedIn全公司都有這樣一種數據文化,以產品部門來說,雖然LinkedIn今天有4億用戶,但是從1萬到2萬5千個用戶的時候就開始用數據分析。」前LinkedIn美國商業分析部高階總監,GrowingIO創辦人兼CEO張溪夢在他LinkedIn中發文。LinkedIn團隊以數據驅動的文化聞名矽谷,這正是微軟導入人工智慧的重要原動力。

除了Cortana,微軟也把人工智慧添加到Office 365與Dynamic 365等產品中。舉例來說,Office 365藉助Microsoft Graph,Word與Outlook中的Tap功能將讓使用者輕鬆地把內容整合自己的檔案和信件中;微軟MyAnalytics則是Office 365的一項分析服務,能幫助人們更好地分析工作中時間消耗的情況。

「從投資的衡量角度來看,我覺得人工智慧的價值在於它將被注入我們所有的產品和服務裡。」納德拉說,40年歷史的微軟,要靠著人工智慧平台展現昔日風華。

翁羽汝/製作

微軟認知服務範籌

語音

  • Bing Speech API
    雙向轉換語音與文字,從而了解使用者的想法

  • 說話者辨識API
    使用語音來辨識及驗證說話者

搜尋

  • Bing 搜尋API
    供應用程式使用的Web、影像、影片及新聞搜尋API

  • Bing 自動建議 API
    將搜尋用的智慧型自動建議選項提供給應用程式

辨識

  • 人臉識別 API
    偵測、分析、組織及標記相片中的臉孔

  • Emotion API
    利用表情辨識個人化使用者體驗

  • Computer Vision API
    從影像擷取可操作的資訊

語言

  • Language Understanding Intelligent Service
    教導應用程式理解使用者發出的命令

  • Text Analytics API
    輕鬆解讀意見與話題,了解使用者需求

  • Web Language Model API
    透過網路規模資料訓練,預測語言模型

  • Bing 拼字檢查 API
    偵測並校正應用程式中的拼字錯誤

知識

  • Recommendations API
    預測並建議客戶想要的商品

  • Academic Knowledge API
    充分利用 Microsoft Academic Graph 中豐富的學術內容