今年 5 月,英國機器人技術創企 Emotech 宣佈完成總額 1000 萬美元的 A 輪融資,將開發一款擁有自己性格的人工智慧機器人 Olly 。
Emotech 的起點是 2014 年 8 月莊宏斌和 Chelsea 一起獲得 UCL 學生創業大賽的第二名,這是 UCL 年度針對從本科到博士在內的全體學生的創業競賽,負責人 Timothy Barney 直接授命於現任英女皇負責提升英國高校的創業水準。最初的產品叫 Happy Cube,目的改善白領在辦公室工作的情緒。
雖然當時的產品僅是擁有淺層人工智慧的桌面小裝置,與現在功能強大的 Olly 無法相比,但這是莊宏斌探索「改變人類與機器關係」的第一步, 也是公司被命名爲 Emotech, Emotion+Technology 的原因。
近日,「機器之心」獨家對話了這家來自英國的新創企業。Emotech 的 創辦人莊宏斌、聯合創辦人 Chelsea 、Jan,以及科學家團隊中的 Pawel、Zarf 和 Pedro 分別就公司團隊、技術、產品以及人工智慧行業等問題接受了「機器之心」的採訪。
關於產品和技術
機器之心:請介紹一下你們的產品,它能完成怎樣的任務?
Emotech:我們目前在開發新的產品設計,今年 11 月左右會公佈,到時再詳細地介紹。簡單來說,Olly 是世界上唯一具有獨立個性的家用機器人,類人腦的情感互動是它的重要特色。
機器之心:HB 有豐富的產品管理經驗,能否介紹下 Olly 的產品思路和理念?
Emotech:產品的思路源於之前做社會網路時對產品給用戶帶來價值的理解,2007 年人人網用戶數量大爆發其中的一個關鍵因素是產品策略上的優化讓用戶找到失去聯繫的老同學/朋友,這裏面是情感緊密聯繫的。當時一直在思考如何衡量產品給用戶帶來的價值,比如從表面的數據上,兩個用戶在吵架,帶來的「UGC」要遠比一句「我喜歡你」多得多,但顯然價值和體驗恰恰相反。
當然這只是一個簡單的例子說明情感的重要性,深入下去會發現這其實在多方面有情感的理論根基,包括認知心理學和神經科學等等。所以我堅信下一代的互動模式情感是不可或缺的。技術上人工智慧的發展和產品上情感設計的升級,讓個人機器人成爲可能。
等產品公佈時可以比較系統和詳細的講。
機器之心:Echo 和 Google Home 等都有巨大的數據支援,作爲一家創業公司,你們的技術在哪些方面有競爭優勢?
Emotech:我們對於競爭的的理解:
第一,數據固然重要,但演算法和模型也尤其關鍵,我們專注的領域和用戶羣比大公司要窄,而且我們同樣擁有在這些領域的頂級科學家(語音識別、類人腦、增強式機器學習);
第二,邊際效益遞減,數據並非越多越好;
第三,Data-efficient Learning 也是我們的強項之一。
機器之心:在英語用戶使用中學習到的經驗能否遷移到漢語環境中,能遷移多大比例,還是要重新學習?
Emotech:語音資訊的特徵可以被學習和遷移到不同語言,這已經被很多研究驗證了;另外有些數據(比如文字)可以透過很多線上資源低成本地獲取,而有些數據(比如用戶互動模型)是可以被抽象,與具體語言分離的。
機器之心:Olly 能夠學習不同用戶的個性,在家庭使用中,Olly 如何區分不同角色?
Emotech:產品設計理念上,我們參考了很多家裏寵物尤其是狗和不同家人之間的關係和互動;技術上,聲音、樣子等等都可以成爲角色區分的方法。
機器之心:預計語音助手技術何時成熟,迎來市場爆發?有進入漢語市場時間表嗎?
Emotech:從技術方面,硬體上 MEMS 麥克風發展非常迅速,雖然還需要提高,但 1-2 年內質量和成本上都要大大優於現在;而目前隨著深度學習的發展,我們已經看到很多可以透過演算法方面來降低硬體要求的例子。
當然不同領域會有不同,比如車載的語音助手和家居語音助手的要求是不一樣的。市場方面語音互動是和 GUI、觸屏互動同一個量級的概念,但我們相信市場成熟需要的時間應該比智慧型手機花的時間短。
明年年底左右中文的 Olly 就會開始售賣。
機器之心:很多公司在開發語音助手時更傾向於基於已有的平臺開發軟體和服務,因爲更簡單,你們爲什麼要選擇做更難的硬體呢?對於智慧助手來說,硬體實體帶來的最主要區別是什麼?
Emotech:一方面實體機器人有多方面優勢,包括數據收集和情感互動等, 我們尤其在 Olly 的動作方面做了很多吸引人的有趣設計;另一方面我們團隊很多人都有創造一個實體機器人的夢想。最後就像滑雪一樣,高級道的纜車排隊的人遠比低級道少得多。
機器之心:你們的產品應該是做開放域問題的 chatbot, 請問開放域 chatbot 難點有哪些?你們成功解決了哪些?
Emotech:我們的產品和 chatbot 還是有很多不同點。但就 chatbot 來說,基本的挑戰主要集中在
1.理解語義;
2.確定內容;
3.確定如何表達。
對於我們而言,在場景理解,情感和數據有效性等方面有很多優勢,這對 Olly 和用戶互動上有很大的幫助。
機器之心:開放領域的 chatbot 位元定領域的 chatbot 難度更大,爲什麼選擇這個難度更大的領域而不是先從哪個領域內的 chatbot 做起呢?比起巨擘,你們又有哪些優勢?
Emotech:第一,我們做的事情和 chatbot 有一些共同點,但還是很不一樣的;
第二,僅從難度方面探討,難度小的事情沒什麼意思;
第三,相比起「開放域」或「通用」,我們更傾向於認爲我們是找到了一個簡潔優美,並且高度可擴展的方向。
機器之心:實體類的 chatbot 可以獲得更豐富的 context 資訊,包括語調,表情,歷史對話,位置等,處理這麼多類型的 context 是一個比較困難的問題,你們如何處理?
Emotech:Olly 的核心 AI 引擎本質上就是多重模態的;我們透過低層演算法處理各種輸入,然後用高層演算法合併。舉個例子不同演算法處理音檔和影片資訊,而提取出來是什麼人正在說話。
機器之心:要實現深層次的個性化需求需要來源廣泛的各類數據,請問作爲作爲創業公司你們如何獲得?或者是如何與其他公司合作?
Emotech:做一個令人興奮的產品是關鍵,大家會覺得一起合作有前景,有意思。這裏面既有我們尋求的合作伙伴,也有一些是看到我們的報導後,主動找到我們的。
機器之心:在獲取多樣化的數據之後,實現有意義的個性化還需要深層挖掘各數據之間的關係,並具有一定的長時記憶和推理能力,這些都是技術上的難點,請問 Olly 在技術上有什麼創新?
Emotech:我們的 AI 引擎是一個高度可擴展的層級結構,這個架構有一個很大的好處就是支援我們對不同類型數據進行處理。
機器之心:你們如何保護用戶的私隱?用戶的歷史數據你們如何處理?在用戶私隱和提供個性化服務之間,你們的平衡理念是什麼?
Emotech:我們對用戶的私隱極度重視。首先我們只收集經過用戶同意的數據,而且用戶擁有對自己所有數據的完全控制;其次我們儘量進行本地化實時處理,如果需要透過雲端,則儘量只傳輸提取後的特徵數據,而且本地和雲端都會經過嚴格的加密。
機器之心:human-inspired computing 是否可以理解爲用機器學習理解問題?數據規模和質量的挑戰都很大,如何解決問題?
Emotech:並不一樣,比如飛機並不需要像鳥一樣扇動翅膀,具備理解能力的演算法並不需要像大腦一樣。深度+一些特定的增強式學習方法會被用到。
關於團隊
機器之心:目前公司規模及技術人員比例是怎樣的?
Emotech:目前 15 名全職員工,會繼續擴中到 25-30 名左右,其中 80% 爲技術人員科學家。英國和美國是全球人工智慧儲備最多的國家,Emotech 會繼續以倫敦爲核心研發中心,同時開始向矽谷發展,吸收優秀的人工智慧專家及市場領域的資深人員,爲明年的年產與銷售做準備,努力讓 OLLY 成爲世界上最有趣的個人機器人。
機器之心:Zaff 角色多重,這是保持創造力的方式嗎?
Emotech:角色多重,在各跨界中都有專業水準並不是我們的用人標準,但似乎公司充滿創造力,勇於改變和冒險的氣氛吸引了這樣的團隊成員。創辦人莊宏斌除了產品設計外,也是單板滑雪的狂熱愛好者,在創業的巨大壓力和緊迫時間下,還是會在冬季每個月去瑞士 Zermatt 峯報導;Chelsea 是科班出身的當代藝術投資專家,至今還在最大的藝術雜誌《hiart》撰寫專欄;Pedro 是樂隊的貝斯手,還出過專輯;Pawel 熱衷鋼琴作曲等等
機器之心:對於一家聰明人聚集的人工智慧公司,平時有哪些團隊建設?
Emotech:喫喫喝喝是團隊的重要娛樂之一,尤其是在倫敦美食地圖 Szu 博士的領導下,這個擁有 14 國母語的超級國際化團隊善於在倫敦的東區和 central 尋找各國美食,並在肉食動物和素食者之間找到平衡;宏斌、Jan、Pawel 都是單板迷,在計劃冬天的集體滑雪;音樂和藝術也是團隊的共同愛好,2 個鋼琴,1 個古箏,1 個薩克斯風,1 個貝斯,等等。
娛樂之外,充電也是重要內容。公司支援團隊成員相關或者不相關的學習,比如參與心理學互動研究、攝影、人工智慧垮領域交流等。始終相信,沒有不相關的學習,只有不斷開拓未知領域,勇敢冒險,才能真正創造世界上最好的人工智慧創業團隊。
關於人工智慧行業
機器之心:英國的很多人工智慧創業公司都走上了被收購的道路,你如何看待這種現象?被收購是好事還是壞事?Emotech 未來是否走同樣的路?
Emotech:首先很多美國的創業公司也被收購,另外很多英國人工智慧公司被大公司類似 Google,Amazon 和 Apple 收購也從一個側面反映了英國 AI 的技術積累和先進性。在去年 TechCrunch 獲獎之後,我們已經收到不少來自產業基金的投資意向,但是爲了最大程度的保持獨立,按照我們的規劃打造世界上最好的人工智慧團隊,生產最有趣的機器人,我們選擇了現在的投資人。
但是,我們並不拒絕各種形式的跨界合作,開放平臺與各種智慧裝置整合,或者 Olly 主體的特殊定製,還是人工智慧軟體與其他硬體廠商的合作,我們都非常樂意嘗試,只要不違揹我們向用戶提供最好的「hands free 的人工智慧體驗,讓用戶體驗更好的生活方式的原則」。
機器之心:Yann LeCun 說生成模型是機器學習領域過去十年最有趣的進展,你們認爲近期的機器學習和人工智慧有哪些重要的發展?
Emotech:我們非常驚喜地看到很多進展其實是硬體端帶來的發展,很多解決方案是在相對簡單但是透過大規模數據訓練出來的模型。當然在理論方面的進展也是驚人的,比如對聯結式模型機制的更深入理解所帶來更優的方式優化和參數使用(例如注意力機制);另一方面是對多模式數據的聯合處理,比如結合語言和視覺數據。
機器之心:DeepMind 大大提升了強化學習的熱度,能否請 Pedro 給沒有背景的專業讀者解釋說明一下?
Emotech:大家應該比較熟悉圖片分類的演算法,這類演算法需要判斷每給定一張圖片中是否有一隻貓或者房子等,這樣的任務是一張張圖片完成但相互間不會影響。與這類演算法不同,經典增強式學習的問題的例子包括讓一個機器人走出迷宮或者下圍棋,在這類問題裏,機器人當前的每一步(左轉或右轉,下哪一格等)都會影響到後面的步驟,這就是增強式學習最基本的特點:解決有連續性相互影響的問題,過程中機器需要在連續性的很多步中選擇正確的答案(卻不知道最終結果是什麼)。
機器之心:在對話和自然語言處理領域目前亟待解決的技術難題是哪些?
Emotech:絕大部分當前機器學習應用的挑戰在於很多模型在特定的任務/領域可以取得非常出色的表現,但卻很難應用到更廣義的領域。對話,自然語言處理和語音識別也有這樣的問題。當然具體來講有很多難點需要更多的投入,比如說當多個用戶用同一個設備時,需要特定的處理,再比如說,經常是即便語音識別已經達到非常高的水準,系統並不理解用戶的意圖或者失去對話中的當前狀態;另外自然語言生成也是很有挑戰的領域。
機器之心:bot 是目前很多科技巨擘都看好的方向,認爲是將來可以解除自然對話連接服務的一種全新的產品形態,你們對此怎麼看?如果長期看好的話,目前制約 bot 發展的技術難點和產品難點各是什麼?
Emotech:更全面地說,人工智慧帶來全新的產品形態,人工智慧是這整個星球的趨勢,而且我們堅信會是一個比移動網路要更大的市場,因爲它不光可以變革移動網路上絕大部分的應用,還產生新的互動方式以及有物聯網等基礎;學術界已經積累了好幾十年,工業界剛剛開始。技術難點方面前面的問題已經有提到了。
機器之心:團隊中有些神經科學背景的專家,如何看待神經科學與人工智慧之間的關係?
Emotech:我們可以看到很多人工智慧上的進展是得到神經科學方面的啓發,包括深度學習和一些關鍵電腦視覺方面的突破;人類擁有這個星球上最高級的智慧系統,顯然有很多方面值得研究,比如小孩的學習能力遠比目前的電腦系統要先進;Olly 的核心是一個類腦人工智慧引擎,使其情感化及高效學習;當然,如以上提到的:飛機並不需要像鳥一樣扇動翅膀。
人工智慧技術的成熟可能會帶來一種全新的產品開發思路,而產品是一個綜合學科,顯然人工智慧相關的產品其科研性會更突出,但依然是建立在滿足用戶需求的基礎上。這部分等我們的產品出來後我們會比較系統地講一次,這樣能更形象一些。