人工智能需如何跨越“人工智能技術(shù)鴻溝”?
關(guān)于人工智能如何改善我們的生活以及如何讓企業(yè)進(jìn)步的那些故事,每天都會(huì)給我們帶來(lái)驚喜。人工智能已經(jīng)分析了X射線,為物聯(lián)網(wǎng)供電,并為銷售和營(yíng)銷團(tuán)隊(duì)推薦下一步最佳行動(dòng)計(jì)劃。它似乎還有無(wú)限的可能性。
但是在每個(gè)人工智能成功的故事背后,都有無(wú)數(shù)個(gè)項(xiàng)目死在實(shí)驗(yàn)室里。這是因?yàn)閷C(jī)器學(xué)習(xí)研究投入生產(chǎn)并且用它為客戶提供真正的價(jià)值通常比開(kāi)發(fā)一個(gè)科學(xué)合理的算法更困難。在過(guò)去幾年里,我遇到的許多公司都面臨著這個(gè)挑戰(zhàn),我稱之為“跨越人工智能鴻溝”。
在本文中,我將站在你的角度分享我在克服技術(shù)和產(chǎn)品困難時(shí)的四大教訓(xùn),我最近在 ApacheCon 上提出了這些知識(shí)點(diǎn)。
人工智能技術(shù)鴻溝
新數(shù)據(jù)。 數(shù)據(jù)是人工智能的關(guān)鍵。例如,如果你想讓聊天機(jī)器人學(xué)習(xí),你必須向其算法模型提供客戶請(qǐng)求和相應(yīng)的正確響應(yīng)的樣本數(shù)據(jù)。樣本通常是靜態(tài)化、結(jié)構(gòu)化的數(shù)據(jù),如 CSV 的數(shù)據(jù)格式。
雖然你可以使用靜態(tài)數(shù)據(jù)集構(gòu)建很酷的人工智能演示,但真實(shí)世界中的人工智能算法模型需要新的數(shù)據(jù)進(jìn)行增量式的訓(xùn)練,使其隨著時(shí)間的變化而變得更聰明。這就是為什么公司應(yīng)該及早投資機(jī)器學(xué)習(xí)架構(gòu),不斷收集新的數(shù)據(jù),并使用它定期更新其人工智能模型。
實(shí)時(shí)數(shù)據(jù)的使用面臨著許多工程性挑戰(zhàn),包括調(diào)度,不停機(jī)模型迭代,穩(wěn)定性和性能監(jiān)控。此外,如果新數(shù)據(jù)出現(xiàn)問(wèn)題,您需要一種機(jī)制來(lái)回溯到先前的狀態(tài),使我們到下一個(gè)點(diǎn)。
保證收集訓(xùn)練數(shù)據(jù)的質(zhì)量。公司應(yīng)該從一開(kāi)始就考慮數(shù)據(jù)的質(zhì)量 - 特別是由用戶生成的數(shù)據(jù)。機(jī)器學(xué)習(xí)自動(dòng)化是一件令人興奮的事,但它也可能適得其反。最近推特(Twitter)上有些聊天機(jī)器人變得很無(wú)賴,這是一個(gè)典型的自動(dòng)化變差的例子。
在聊天機(jī)器人開(kāi)始自由交談之前,它是利用公開(kāi)的經(jīng)過(guò)模型化、清洗和過(guò)濾的數(shù)據(jù)進(jìn)行訓(xùn)練的。但是在機(jī)器人開(kāi)始從與真實(shí)的人的不適當(dāng)?shù)慕涣髦羞M(jìn)行學(xué)習(xí)之后,它的推文的語(yǔ)氣迅速地變得更差。GIGO(garbage in, garbage out)是機(jī)器學(xué)習(xí)的基本規(guī)則,所以一個(gè)良好的人工智能系統(tǒng)能夠檢測(cè)出潛在的問(wèn)題,并在需要人工干預(yù)的時(shí)候向管理員發(fā)出警報(bào)。
人工智能產(chǎn)品鴻溝優(yōu)化正確的目標(biāo)。人工智能的成功取決于正確地定義你的預(yù)測(cè)問(wèn)題。從一開(kāi)始,你需要清楚地識(shí)別輸入查詢,輸出預(yù)測(cè),并且分辨哪些預(yù)測(cè)是好的,哪些預(yù)測(cè)是壞的。數(shù)據(jù)科學(xué)家將使用這些評(píng)估指標(biāo)來(lái)確定人工智能模型的準(zhǔn)確性。
首先定下你的目標(biāo)。你想要最大限度地提高收入,創(chuàng)造更好的用戶體驗(yàn),自動(dòng)執(zhí)行手動(dòng)任務(wù)或者其他任務(wù)?要想成功,現(xiàn)實(shí)世界的人工智能產(chǎn)品必須使用能夠準(zhǔn)確反映業(yè)務(wù)目標(biāo)的評(píng)估指標(biāo)。
Netflix 開(kāi)展推薦算法競(jìng)賽的故事給大家上了一課。一位新的電影評(píng)級(jí)算法的創(chuàng)作者被授予100萬(wàn)美元獎(jiǎng)金后,Netflix 無(wú)法在現(xiàn)實(shí)世界中大規(guī)模使用該算法,主要是因?yàn)閺?DVD 到視頻流的過(guò)渡使原始目標(biāo)失去意義。
設(shè)置指標(biāo)時(shí),請(qǐng)記住三個(gè)關(guān)鍵要求。你需要確保:(1) 衡量什么是真正重要的事情;(2) 使用實(shí)時(shí)數(shù)據(jù)和新數(shù)據(jù)對(duì)結(jié)果進(jìn)行評(píng)估;(3) 以一種他們理解的、有價(jià)值的方式向利益相關(guān)者解釋結(jié)果。最后一個(gè)要求指出了人類和人工智能交互的關(guān)鍵點(diǎn)。
人類與人工智能交互。人類很復(fù)雜。 因此,當(dāng)他們與人工智能進(jìn)行交互時(shí),會(huì)遇到在實(shí)驗(yàn)室中處理數(shù)據(jù)集時(shí)不會(huì)碰到的新挑戰(zhàn)。請(qǐng)注意,如果客戶不信任人工智能,就不會(huì)使用它驅(qū)動(dòng)的產(chǎn)品。雖然你可以通過(guò)顯示預(yù)測(cè)模型的準(zhǔn)確性來(lái)嘗試建立信任,但大多數(shù)消費(fèi)者不能真正去關(guān)注可靠的科學(xué)指標(biāo)。
因此,你需要使用你的產(chǎn)品的用戶體驗(yàn)/用戶界面(UX / UI)來(lái)克服構(gòu)建信任的困難。例如,當(dāng)蘋果的Siri虛擬助手首次啟動(dòng)時(shí),它默認(rèn)是男性聲音還是女性聲音具體取決于用戶所在的國(guó)家和地區(qū)。谷歌的自駕車型以一副可愛(ài)和友好的面孔出現(xiàn),以安撫那些擔(dān)心自己安全的客戶。記住,人們使用你的算法給你帶來(lái)的不是只有挑戰(zhàn),還會(huì)給你提供解決方案。
實(shí)際上跨越人工智能的鴻溝并不是那么令人恐懼。當(dāng)你邁進(jìn)這個(gè)鴻溝時(shí),要確保自己能夠制定一個(gè)良好的計(jì)劃去跨越它而不是跌落鴻溝。并且記住想要成為人工智能的先行者,你的公司必須要秉承客戶至上的原則。
本文作者 Simon Chan 是 PredicTIonIO 的前聯(lián)合創(chuàng)始人/首席執(zhí)行官,目前擔(dān)任 Salesforce Einstein 產(chǎn)品經(jīng)營(yíng)的高級(jí)主管。