第六部：大數據與算力的大爆炸

發布於 2026/04/14

作者

7 分鐘閱讀

第六部：大數據與算力的大爆炸

演算法就像引擎。如果你只有一台法拉利的引擎，卻沒有汽油，它哪裡也去不了。對神經網路來說，「數據」就是汽油。

1. 李飛飛與愚公移山的 ImageNet

進入 21 世紀，網際網路與數位相機的普及，讓人們每天在網路上產生數以億計的圖片。但當時的人工智慧，仍然連區分一隻狗和一隻貓都顯得很吃力。

為什麼？因為機器學習界陷入了一個盲點：大家都把精力花在微調那些精緻但狹隘的演算法上，卻忽略了餵給機器的「教材」太少了。當時標準的影像訓練庫通常只有幾萬張圖片，這對一個需要模仿人類視覺的系統來說，簡直是杯水車薪。

這時，史丹佛大學的一位年輕華裔女教授李飛飛 (Fei-Fei Li) 看出了問題的癥結。

她決定做一件當時被學界認為是「瘋狂且吃力不討好」的事：建立一個全人類歷史上最大的影像資料庫。

從 2007 年開始，李飛飛的團隊利用亞馬遜的群眾外包平台 (Mechanical Turk)，雇用了全球超過五萬名工人，不分晝夜地在電腦螢幕前為圖片標籤（這隻是貓、那台是車）。經過多年的苦工，他們建立了一個名為 ImageNet 的超級資料庫，裡面包含了超過 1400 萬張帶有精確標籤的圖片！

這不僅是一個資料庫，它是 AI 歷史上第一桶真正意義上的「高辛烷值火箭燃料」。

2. GPU 的意外跨界

與此同時，另一個決定命運的拼圖正在成形。

傑弗瑞·辛頓 (Geoffrey Hinton) 知道他的神經網路需要大量的運算才能消化大數據，但傳統的電腦中央處理器 (CPU) 算力根本不夠。

他實驗室裡的一位天才博士生亞歷克斯·克里澤夫斯基 (Alex Krizhevsky) 發現了一個「作弊」的方法。他發現，那些被玩家用來打 3D 遊戲的顯示卡 (GPU)，特別擅長進行大量的平行矩陣運算。而神經網路的數學本質，正好就是無數個矩陣相乘！

於是，Alex 把兩張普通的 NVIDIA 遊戲顯示卡裝進了電腦裡，然後用極高的程式技巧，將一個擁有 8 層網路、6000 萬個參數的超深「卷積神經網路 (CNN)」塞了進去。

這個名為 AlexNet 的神經網路，貪婪地吸收了 ImageNet 中的百萬張圖片，在 GPU 的轟鳴聲中不分晝夜地訓練了好幾個星期。

3. 2012 年：震驚世界的時刻

李飛飛為了推動計算機視覺的發展，從 2010 年開始舉辦了一年一度的 ImageNet 視覺辨識挑戰賽 (ILSVRC)。

在 2010 和 2011 年，傳統機器學習演算法（如 SVM 和特徵工程）的錯誤率大概停留在 25% 左右，學者們認為這已經是極限了，每年只能勉強進步個 1% 或 2%。

2012 年，辛頓帶著 Alex 和他的 AlexNet 報名了比賽。

當比賽結果公布時，整個電腦科學界陷入了長達數分鐘的死寂。

第二名的傳統演算法，錯誤率是 26.2%。而第一名的 AlexNet，錯誤率竟然暴跌到了不可思議的 15.3%！

它不僅贏了，而且是將對手遠遠甩在後頭，達到了碾壓級的勝利。那些堅持寫複雜規則與數學特徵提取的傳統學者，看著這個「簡單粗暴、只會盲目用數據砸出來」的神經網路黑盒子，感到無比的震撼與挫敗。

4. 深度學習的狂潮

2012 年的 ImageNet 大賽，被公認是 AI 歷史上最重要的轉捩點，標誌著「深度學習 (Deep Learning)」時代的正式爆發。

辛頓、楊立昆與班吉歐在幾十年的寒冬中堅持的火種，終於在「大數據（ImageNet）」與「強大算力（GPU）」的澆灌下，化為了燎原的烈火。（這三人最終在 2018 年共同獲得了計算機科學界的最高榮譽——圖靈獎）。

科技巨頭 Google、微軟、Facebook 瞬間陷入了對 AI 人才的瘋狂爭奪戰。NVIDIA 這家原本只做遊戲顯卡的公司，一躍成為了主宰 AI 算力基礎設施的全球霸主。

機器終於擁有了敏銳的眼睛。但接下來，它們即將挑戰人類智力的最高殿堂：一盤古老而深奧的棋局。

下一集：當西洋棋世界冠軍早被電腦擊敗後，人類認為「圍棋」是機器永遠無法觸及的直覺領域。直到一個名為 AlphaGo 的神經網路，在首爾的棋盤上落下了震撼人類的「第 37 手」。

矽基心智的覺醒, 人工智慧

本文章以 CC BY 4.0 授權

1. 李飛飛與愚公移山的 ImageNet

2. GPU 的意外跨界

3. 2012 年：震驚世界的時刻

4. 深度學習的狂潮

熱門標籤