我們離真正的開源人工智慧還有很長的路要走 - FT中文網
登錄×
電子郵件/用戶名
密碼
記住我
請輸入郵箱和密碼進行綁定操作:
請輸入手機號碼,透過簡訊驗證(目前僅支援中國大陸地區的手機號):
請您閱讀我們的用戶註冊協議私隱權保護政策,點擊下方按鈕即視爲您接受。
FT商學院

我們離真正的開源人工智慧還有很長的路要走

沃特斯:目前的開源人工智慧並非真正的開源,如果用戶無法看到模型的基礎數據,就無法自由地複製這些模型。
00:00

{"text":[[{"start":null,"text":"

Meta的Llama 3:用戶可以使用和調整模型,但他們看不到訓練模型的基礎數據,也沒有足夠的資訊從頭開始複製模型。
"}],[{"start":7.45,"text":"開源人工智慧是過去一年最令人驚訝的科技故事之一。"},{"start":12,"text":"隨著OpenAI和谷歌(Google)等公司投入數十億美元打造更強大的人工智慧,開發人員可以免費使用和調整的「開源」模型縮小了效能差距。"}],[{"start":22.45,"text":"但有一個缺點:大多數開源系統並不十分開源。"},{"start":26.48,"text":"批評者指責它們的支持者「開源洗白」——試圖從開源的光環效應中獲益,擺脫普通商業軟體產品的束縛,但卻名不副實。"}],[{"start":36.19,"text":"創造真正開源版人工智慧的努力終於獲得了動力。"},{"start":40.209999999999994,"text":"但誰也不能保證其進展能與過去20年在科技界發揮了關鍵作用的開源軟體相媲美。"},{"start":46.949999999999996,"text":"傳統的開源軟體,如Linux操作系統,代碼是免費提供給開發人員檢查、使用和調整的。"},{"start":54.62,"text":"所謂的開源人工智慧則截然不同,這主要是因爲大多數現代人工智慧系統都是從數據中學習,而不是用代碼編程邏輯。"}],[{"start":64.31,"text":"以Meta的Llama爲例。"},{"start":66.14,"text":"只有決定模型如何響應查詢的「權重」是公開的。"},{"start":69.89,"text":"用戶可以使用並調整它,但他們看不到訓練它的基礎數據,也沒有足夠的資訊從頭開始複製該模型。"}],[{"start":78.05,"text":"對於許多開發人員來說,這仍然有一些明顯的好處。"},{"start":82.12,"text":"他們可以根據自己的資訊調整和訓練準開源模型,而無需將敏感的內部數據交給另一家公司。"}],[{"start":89.38000000000001,"text":"但不完全開源是有代價的。"},{"start":91.95,"text":"Mozilla基金會高級顧問阿亞•貝迪拉(Ayah Bdeir)表示,只有真正的開源技術才能讓人們全面瞭解那些開始影響我們生活方方面面的系統,同時也能保證創新和競爭不會被少數幾家占主導地位的人工智慧公司扼殺。"}],[{"start":107.28,"text":"其中一個回應來自開源促進會(Open Source Initiative)——它在20多年前就給出了開源軟體的定義。"},{"start":113.4,"text":"本週,它給出了一個接近最終的定義,可能有助於塑造該領域的發展方向。"}],[{"start":119.29,"text":"這不僅需要公開模型的權重,還需要公開關於訓練模型的數據的足夠資訊,以便其他人複製模型,以及系統背後的所有代碼。"},{"start":128.63,"text":"Mozilla和Linux Foundation等其他組織也在推動類似的舉措。"}],[{"start":133.53,"text":"諸如此類的舉措已經導致人工智慧領域出現了更大的細分。"},{"start":138.18,"text":"許多公司在使用術語時更加謹慎——也許是考慮到開源促進會擁有「開源」一詞的商標,並可能提起訴訟,以防止該詞被用於自己定義之外的人工智慧模型。"},{"start":150.12,"text":"例如,Mistral將其Nemo稱爲「開放權重」模型。"}],[{"start":154.16,"text":"除了部分開源的系統,完全開源的模型也開始出現,比如Allen Institute for AI開發的大型語言模型Olmo。"},{"start":162.68,"text":"然而,這個版本在人工智慧領域是否會像在傳統軟體領域那樣產生巨大影響,目前還遠不清楚。"},{"start":170.63,"text":"要做到這一點,需要滿足兩個條件。"}],[{"start":173.62,"text":"首先,這項技術需要滿足足夠大的需求,以吸引大量的用戶和開發人員。"},{"start":179.74,"text":"在傳統軟體方面,Linux伺服器操作系統顯然是微軟Windows的替代品,爲其贏得了大量用戶,並得到了包括IBM和甲骨文(Oracle)在內的微軟競爭對手的大力支援。"},{"start":192.36,"text":"在人工智慧領域,Linux沒有類似存在。"},{"start":195.87,"text":"市場已經變得更加分散,許多用戶會發現像Llama這樣的準開源大型語言模型已經足夠了。"}],[{"start":203.09,"text":"開源人工智慧的支持者也需要更好地證明其安全性。"},{"start":207.3,"text":"這種強大的通用技術被髮布供任何人正確使用的前景引起了廣泛關注。"}],[{"start":213.05,"text":"Allen Institute前所長奧倫•埃齊奧尼(Oren Etzioni)表示,許多擔憂被誇大了。"},{"start":218.17000000000002,"text":"當談到在線研究如何製造炸彈或生物武器時:「你真的無法從這些(人工智慧模型)中獲得比谷歌上更多的東西。"},{"start":226.99,"text":"市面上有很多這樣的東西,只是包裝不同而已。」"},{"start":230.79000000000002,"text":"他承認,在某些領域,更自由地使用人工智慧可能會造成傷害,比如自動創造更多的在線錯誤資訊。"}],[{"start":239.04000000000002,"text":"「閉源」人工智慧也有風險。"},{"start":241.31000000000003,"text":"但是,除非更徹底地研究了開源技術的額外邊際風險,以及潛在的好處,否則擔憂仍將存在。"}]],"url":"https://creatives.ftacademy.cn/album/168559-cn-1724375808.mp3"}

版權聲明:本文版權歸FT中文網所有,未經允許任何單位或個人不得轉載,複製或以任何其他方式使用本文全部或部分,侵權必究。
設置字型大小×
最小
較小
默認
較大
最大
分享×