在ChatGPT將人工智慧這一話題推向大衆視線一年半之後,大多數人都會有這樣的疑問:人工智慧何時才能給我的生活帶來巨大改變?
這個問題在大科技公司(Big Tech)的年度開發者大會季節尤爲引人注目,該季節始於5月中旬。這是一年中科技公司展示他們對即將到來的科技未來的願景,試圖用這些願景來吸引顧客的時刻。
ChatGPT的到來可能引起了大衆的想像力,但對於大多數人來說,透過文字聊天機器人輸入問題的興趣有限。此後,科技圈的關注主要集中在競相構建能夠以大規模交付生成式人工智慧所需能力的競賽上,而不是其應用。頭條新聞主要被越來越強大的大型語言模型、對強大新晶片的大量投資以及處理人工智慧所需的巨大、耗電量大的數據中心的擴散所主導。
現在,這些強大的技術能力正在更接近實際的技術用戶。微軟(Microsoft)本月最大的訊息是推出了一款新一代的AI智慧電腦,將在今年以Copilot+品牌推出,它將具備足夠的能力來處理AI,而無需調用遠距數據中心。
在這個過程中,微軟向蘋果(Apple)發起了挑戰,聲稱新的個人電腦將超越蘋果的MacBook。現在,在個人計算和智慧型手機領域,人工智慧的競賽正如火如荼地進行著。
然而,對於大多數消費者來說,這些都沒有回答一個最重要的問題:這些昂貴的新技術將如何在何時讓我的生活變得更好?到目前爲止,生成式人工智慧已經在網路上帶來了大量的文字框,用於回答問題(包括在Meta的WhatsApp和Instagram等服務中);提供幫助撰寫電子郵件或文檔的服務;以及各種摘要文字的服務,包括谷歌(Google)在其搜索結果頂部開始提供的網頁摘要。目前尚不清楚人們實際上有多少在使用這些功能。
正如本月的事件所強調的那樣,科技公司懷有更大的野心。他們的目標是能夠預測用戶需求並在很大程度上介入其在線活動的個人數字助手,以及能夠進一步代表用戶採取行動的數字代理人。這些想法是谷歌兩週前的活動、微軟上週的活動以及OpenAI的新模型GPT-4o的發佈的核心內容。
然而,如果這是人工智慧的最大承諾,那只是一個承諾。
還有兩個基本問題尚未解決。其中一個問題是讓以歷史數據訓練的人工智慧模型能夠理解並適應任何新的情境,並做出恰當的回應。用谷歌人工智慧研究部門負責人德米斯•哈薩比斯(Demis Hassabis)的話來說,人工智慧需要能夠「像我們一樣理解和應對我們複雜而動態的世界」。
這是一個艱鉅的任務。挑戰不僅在於避免AI系統容易出現的「幻覺」或偶爾的明顯錯誤,還需要對上下文有全面的理解,以便始終提供真正有幫助的結果。谷歌聲稱在這方面取得了重大進展,將擴展的「上下文視窗」引入其最新的雙子座(Gemini)模型,以使系統能夠保持對複雜情況的意識。但是,如果這項技術需要與人類在對世界的理解上相匹敵,仍有很多事情需要證明。
另一個相關問題是如何使與人工智慧的交流像與人交談一樣自然。只有到了那個時候,根據構建這些系統的人們所說,技術才能真正發揮其潛力。
微軟首席執行長薩蒂亞•納德拉(Satya Nadella)表示,這將涉及學習「如何構建能理解我們的電腦,而不是我們必須理解電腦」。儘管他聲稱這一目標離實現令人心動地近了,但包括哈薩比斯在內的其他人警告稱,試圖實現與電腦的「自然」互動仍然是「一個非常高的門檻」。
OpenAI展示了GPT-4o,這是一個設計用於非正式、對話式風格的AI模型,爲未來可能出現的情景提供了一瞥。然而,一個預先排練過的演示和一個有效的現實世界產品之間的差距仍然很大。很難預測AI何時會在消費者世界取得重大突破。