人工智能和機(jī)器學(xué)習(xí)的QA測(cè)試有何不同
掃描二維碼
隨時(shí)隨地手機(jī)看文章
智能手機(jī)、智能音箱、智能汽車(chē)、智能咖啡機(jī),物品被賦予智能的例子不勝枚舉,似乎周?chē)囊磺卸极@得了生命和智慧。
由于人類(lèi)長(zhǎng)期以來(lái)對(duì)機(jī)器人統(tǒng)治世界充滿(mǎn)恐懼,這類(lèi)的科幻小說(shuō)也備受歡迎。但盡管如此,智能設(shè)備絕不是反烏托邦式的——它們的存在實(shí)際上是為了讓我們的生活更方便,讓我們有更多時(shí)間專(zhuān)注重要事務(wù),而不用操心單調(diào)忙碌的工作。
科技公司深知發(fā)展自動(dòng)化是未來(lái)的必經(jīng)之路,一如當(dāng)年福特率先推出汽車(chē)流水線(xiàn)。人工智能(AI)和機(jī)器學(xué)習(xí)(ML)這樣先進(jìn)的技術(shù)正在為史上最振奮人心的創(chuàng)新賦能——想一想無(wú)人駕駛汽車(chē)、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)、自動(dòng)化投資、醫(yī)學(xué)成像等等創(chuàng)新吧。這些先進(jìn)技術(shù)的優(yōu)勢(shì)日益凸顯,眾多公司爭(zhēng)先恐后地采用這些技術(shù),并將其應(yīng)用到自己的產(chǎn)品中。
隨著先進(jìn)技術(shù)越來(lái)越廣泛應(yīng)用于汽車(chē)、醫(yī)療、金融等高敏感、高風(fēng)險(xiǎn)領(lǐng)域,開(kāi)發(fā)運(yùn)營(yíng)團(tuán)隊(duì)的QA測(cè)試(即QUALITY ASSURANCE TEST,質(zhì)量監(jiān)督測(cè)試)至關(guān)重要。如果公眾安全、客戶(hù)的生計(jì)或病人的數(shù)據(jù)有可能面臨風(fēng)險(xiǎn),那么即使最智能的算法也必須經(jīng)過(guò)人類(lèi)工程師反復(fù)檢查。
在深入探討智能設(shè)備的測(cè)試方法之前,我們需要先區(qū)分一下人工智能和機(jī)器學(xué)習(xí)。雖然這兩個(gè)術(shù)語(yǔ)經(jīng)常互換使用,但它們之間還是存在一些主要區(qū)別。簡(jiǎn)單來(lái)說(shuō),人工智能系統(tǒng)以人類(lèi)認(rèn)為聰明或高效的方式執(zhí)行任務(wù),而機(jī)器學(xué)習(xí)系統(tǒng)則是利用已有數(shù)據(jù)進(jìn)行自動(dòng)的連續(xù)的自我訓(xùn)練。
大量收集的數(shù)據(jù)會(huì)帶來(lái)存儲(chǔ)和分析方面的挑戰(zhàn)——清除這些數(shù)據(jù)可能耗費(fèi)很多時(shí)間。數(shù)據(jù)收集可能發(fā)生在意外事件或情況下,這使收集數(shù)據(jù)并將其用于訓(xùn)練變得困難重重。訓(xùn)練和測(cè)試數(shù)據(jù)集中可能會(huì)出現(xiàn)個(gè)人偏見(jiàn)。在人工智能系統(tǒng)中,系統(tǒng)缺陷會(huì)迅速惡化并變得更加復(fù)雜。
人工智能系統(tǒng)取得成功的關(guān)鍵是精確無(wú)誤的數(shù)據(jù)。在將數(shù)據(jù)提供給人工智能系統(tǒng)之前,應(yīng)該對(duì)數(shù)據(jù)進(jìn)行過(guò)濾、清理和驗(yàn)證。QA團(tuán)隊(duì)?wèi)?yīng)該警惕個(gè)人偏見(jiàn)以及多樣性問(wèn)題出現(xiàn),這可能使系統(tǒng)對(duì)數(shù)據(jù)的解釋變得復(fù)雜——想一想汽車(chē)導(dǎo)航系統(tǒng)或智能手機(jī)助手試圖理解一種不常見(jiàn)的口音時(shí)的場(chǎng)景吧。
算法是人工智能的核心,算法可以處理數(shù)據(jù)并生成觀念。一些常見(jiàn)的算法涉及到易學(xué)性(即Netflix或Amazon學(xué)習(xí)用戶(hù)偏好并提供新推薦的能力)、語(yǔ)音識(shí)別(智能揚(yáng)聲器)和現(xiàn)實(shí)世界的傳感器檢測(cè)(無(wú)人駕駛汽車(chē))等技術(shù)。(這些技術(shù)應(yīng)通過(guò)模型驗(yàn)證、易學(xué)性成功率、算法有效性和核心理解力等方面的全面測(cè)試。)算法如果在某一方面出現(xiàn)問(wèn)題,都必將產(chǎn)生更為嚴(yán)重的后果。
與任何其他軟件平臺(tái)一樣,人工智能系統(tǒng)也需要性能和安全性的強(qiáng)化測(cè)試以及法規(guī)遵從性測(cè)試。未經(jīng)過(guò)恰當(dāng)測(cè)試,利基安全漏洞(利用語(yǔ)音錄音欺騙語(yǔ)音識(shí)別軟件或控制聊天機(jī)器人)出現(xiàn)概率將會(huì)更高。建立人工智能系統(tǒng)目的在于接入其他系統(tǒng),在更大的場(chǎng)景中解決問(wèn)題。為使所有集成環(huán)節(jié)運(yùn)行正常,有必要對(duì)人工智能系統(tǒng)及其各個(gè)連接點(diǎn)進(jìn)行完整評(píng)估。隨著越來(lái)越多系統(tǒng)吸收了人工智能系統(tǒng)的特性,對(duì)這些系統(tǒng)進(jìn)行仔細(xì)測(cè)試至關(guān)重要。
機(jī)器學(xué)習(xí)系統(tǒng)的目標(biāo)是在不進(jìn)行顯式編程的情況下獨(dú)立獲取知識(shí)。實(shí)現(xiàn)該目標(biāo)要求系統(tǒng)有持續(xù)的數(shù)據(jù)流輸入——此方法動(dòng)態(tài)性更強(qiáng),傳統(tǒng)測(cè)試正是基于此(固定輸入=固定輸出)。因此,QA專(zhuān)家需要從不同角度思考如何為機(jī)器學(xué)習(xí)系統(tǒng)實(shí)施測(cè)試策略。