討論 | 創(chuàng)新者窘境的另一面:?當心沉默的顛覆者
1997年,哈佛商學院教授克萊頓?克里斯坦森(Clayton Christensen)的《創(chuàng)新者的窘境》一書在風險投資人和企業(yè)家之中引起了轟動。大多數(shù)人從中得到的教訓是,要轉而采用最終會取代當前商業(yè)模式的新方法,一家經(jīng)營良好的企業(yè)是無法承受其中的代價的,而且往往為時已晚。
這一難題最著名的例子與攝影有關。盈利能力很強的大型相機膠卷生產(chǎn)公司20世紀90年代中期就知道,數(shù)碼攝影才是未來,但這些公司從未真正遇到過轉型的好時機。幾乎任何時候他們都會賠錢。因此,結果當然就是這些公司被生產(chǎn)數(shù)碼相機的新公司取而代之。(雖然富士幸存了下來,但其轉型并不順利,而且卷入了一系列荒唐的事件、陰謀和巨變。)
來自克里斯坦森著作的第二個教訓雖然沒有被人們牢記于心,但卻是必不可少的一部分。涌現(xiàn)的新公司可能會在多年里依靠一種災難性的低能力技術為生。不過,其中有些公司找到了大型公司未能發(fā)現(xiàn)的新興小眾市場,因此得以生存。這些公司正是通過這種方式來悄悄提升自己的能力。
例如,早期數(shù)碼相機的分辨率遠遠低于膠卷相機,但數(shù)碼相機要小巧得多。我曾經(jīng)在口袋里裝著一個掛在鑰匙鏈上的數(shù)碼相機,用它來給我所參加的每場會議的參會者拍照。雖然這種相機的分辨率很低,無法記錄令人驚艷的假期風景,但用來幫助我記住人臉卻是綽綽有余的。
這種教訓也適用于研究領域。新方法表現(xiàn)不佳的一個很好的例子就是20世紀80年代和90年代的第二波神經(jīng)網(wǎng)絡,它在2010年左右最終徹底改變?nèi)斯ぶ悄堋?/span>
20世紀50年代初以來,人們就將各種神經(jīng)網(wǎng)絡作為機器學習的機制進行了研究,但神經(jīng)網(wǎng)絡并不擅長學習有趣的事物。
1979年,福島邦彥(Kunihiko Fukushima)首次發(fā)表了他對平移不變神經(jīng)網(wǎng)絡的研究結果,該神經(jīng)網(wǎng)絡能夠讓他的自組織網(wǎng)絡學習對圖片中任意位置的手寫數(shù)字進行分類。20世紀80年代,人們重新發(fā)現(xiàn)了一種名為反向傳播的技術;借助這種技術,可以實現(xiàn)受監(jiān)督的學習形式,在這種學習形式中,網(wǎng)絡會被告知正確答案應該是什么。1989年,揚 ? 勒丘恩(Yann LeCun)將反向傳播與福島的理念結合了起來,形成了我們所知道的卷積神經(jīng)網(wǎng)絡(CNN)。勒丘恩也將注意力放在了有手寫數(shù)字的圖片上。
接下來的10年里,美國國家標準技術研究所(NIST)打造了一個數(shù)據(jù)庫,該數(shù)據(jù)庫包含6萬個訓練數(shù)字和1萬個測試數(shù)字,勒丘恩對該數(shù)據(jù)庫進行了修改。這個標準測試數(shù)據(jù)庫名為MNIST,借助該數(shù)據(jù)庫,研究人員能夠準確地對卷積神經(jīng)網(wǎng)絡不同改進的效果進行衡量和對比。雖然有很多進展,但在應用到早期自動駕駛汽車或工業(yè)機器人所生成的任意圖像中時,卷積神經(jīng)網(wǎng)絡并不是在計算機視覺方面根深蒂固的人工智能方法的對手。
不過,21世紀的卷積神經(jīng)網(wǎng)絡中增加了越來越多的學習技術和算法改進,從而形成了我們現(xiàn)在所知的深度學習。2012年,突然之間,在一組名為ImageNet的物體測試圖像中,似乎不知從何而來的深度學習超越了標準計算機視覺算法。這個計算機視覺的相似物取得了勝利,并徹底改變了人工智能領域。
少數(shù)人已經(jīng)研究了幾十年并且給所有人帶來了驚喜。恭喜這些知名的和不那么知名的耕耘者。
不過,我們也要知道,克里斯坦森的書所傳達的信息是,這種顛覆從未停止。如今站在高處的人將會對自己從未開始考慮的新方法感到驚訝。有一小群人正在嘗試各種新事物,而且其中有些人愿意面對所有的困難,默默耕耘幾十年??傆幸惶欤@群人中的某個人會給我們所有人帶來驚喜。
我喜歡科技顛覆的這一面。正是這一點讓人類變得偉大。也是它讓人類變得危險。