第六部:大數據與算力的大爆炸
演算法就像引擎。如果你只有一台法拉利的引擎,卻沒有汽油,它哪裡也去不了。對神經網路來說,「數據」就是汽油。
1. 李飛飛與愚公移山的 ImageNet
進入 21 世紀,網際網路與數位相機的普及,讓人們每天在網路上產生數以億計的圖片。但當時的人工智慧,仍然連區分一隻狗和一隻貓都顯得很吃力。
為什麼?因為機器學習界陷入了一個盲點:大家都把精力花在微調那些精緻但狹隘的演算法上,卻忽略了餵給機器的「教材」太少了。當時標準的影像訓練庫通常只有幾萬張圖片,這對一個需要模仿人類視覺的系統來說,簡直是杯水車薪。
這時,史丹佛大學的一位年輕華裔女教授李飛飛 (Fei-Fei Li) 看出了問題的癥結。
她決定做一件當時被學界認為是「瘋狂且吃力不討好」的事:建立一個全人類歷史上最大的影像資料庫。
從 2007 年開始,李飛飛的團隊利用亞馬遜的群眾外包平台 (Mechanical Turk),雇用了全球超過五萬名工人,不分晝夜地在電腦螢幕前為圖片標籤(這隻是貓、那台是車)。經過多年的苦工,他們建立了一個名為 ImageNet 的超級資料庫,裡面包含了超過 1400 萬張帶有精確標籤的圖片!
這不僅是一個資料庫,它是 AI 歷史上第一桶真正意義上的「高辛烷值火箭燃料」。
2. GPU 的意外跨界
與此同時,另一個決定命運的拼圖正在成形。
傑弗瑞·辛頓 (Geoffrey Hinton) 知道他的神經網路需要大量的運算才能消化大數據,但傳統的電腦中央處理器 (CPU) 算力根本不夠。
他實驗室裡的一位天才博士生亞歷克斯·克里澤夫斯基 (Alex Krizhevsky) 發現了一個「作弊」的方法。他發現,那些被玩家用來打 3D 遊戲的顯示卡 (GPU),特別擅長進行大量的平行矩陣運算。而神經網路的數學本質,正好就是無數個矩陣相乘!
於是,Alex 把兩張普通的 NVIDIA 遊戲顯示卡裝進了電腦裡,然後用極高的程式技巧,將一個擁有 8 層網路、6000 萬個參數的超深「卷積神經網路 (CNN)」塞了進去。
這個名為 AlexNet 的神經網路,貪婪地吸收了 ImageNet 中的百萬張圖片,在 GPU 的轟鳴聲中不分晝夜地訓練了好幾個星期。
3. 2012 年:震驚世界的時刻
李飛飛為了推動計算機視覺的發展,從 2010 年開始舉辦了一年一度的 ImageNet 視覺辨識挑戰賽 (ILSVRC)。
在 2010 和 2011 年,傳統機器學習演算法(如 SVM 和特徵工程)的錯誤率大概停留在 25% 左右,學者們認為這已經是極限了,每年只能勉強進步個 1% 或 2%。
2012 年,辛頓帶著 Alex 和他的 AlexNet 報名了比賽。
當比賽結果公布時,整個電腦科學界陷入了長達數分鐘的死寂。
第二名的傳統演算法,錯誤率是 26.2%。 而第一名的 AlexNet,錯誤率竟然暴跌到了不可思議的 15.3%!
它不僅贏了,而且是將對手遠遠甩在後頭,達到了碾壓級的勝利。那些堅持寫複雜規則與數學特徵提取的傳統學者,看著這個「簡單粗暴、只會盲目用數據砸出來」的神經網路黑盒子,感到無比的震撼與挫敗。
4. 深度學習的狂潮
2012 年的 ImageNet 大賽,被公認是 AI 歷史上最重要的轉捩點,標誌著「深度學習 (Deep Learning)」時代的正式爆發。
辛頓、楊立昆與班吉歐在幾十年的寒冬中堅持的火種,終於在「大數據(ImageNet)」與「強大算力(GPU)」的澆灌下,化為了燎原的烈火。(這三人最終在 2018 年共同獲得了計算機科學界的最高榮譽——圖靈獎)。
科技巨頭 Google、微軟、Facebook 瞬間陷入了對 AI 人才的瘋狂爭奪戰。NVIDIA 這家原本只做遊戲顯卡的公司,一躍成為了主宰 AI 算力基礎設施的全球霸主。
機器終於擁有了敏銳的眼睛。但接下來,它們即將挑戰人類智力的最高殿堂:一盤古老而深奧的棋局。
下一集:當西洋棋世界冠軍早被電腦擊敗後,人類認為「圍棋」是機器永遠無法觸及的直覺領域。直到一個名為 AlphaGo 的神經網路,在首爾的棋盤上落下了震撼人類的「第 37 手」。