www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 與其他的人工智能技術相比,情感分析(Sentiment Analysis)顯得有些特殊,因為其他的領域都是根據(jù)客觀的數(shù)據(jù)來進行分析和預測,但情感分析則帶有強烈的個人主觀因素。情感分析的目標是從文

與其他的人工智能技術相比,情感分析(Sentiment Analysis)顯得有些特殊,因為其他的領域都是根據(jù)客觀的數(shù)據(jù)來進行分析和預測,但情感分析則帶有強烈的個人主觀因素。情感分析的目標是從文本中分析出人們對于實體及其屬性所表達的情感傾向以及觀點,這項技術最早的研究始于2003年Nasukawa和Yi兩位學者的關于商品評論的論文。

隨著推特等社交媒體以及電商平臺的發(fā)展而產生大量帶有觀點的內容,給情感分析提供了所需的數(shù)據(jù)基礎。時至今日,情感識別已經在多個領域被廣泛的應用。

評價者表達的是對手機整體的褒義評價,但如果是:“我覺得這款手機拍照功能很不錯,但信號不是很好”這樣的句子,在同一個評論中出現(xiàn)了褒義詞又出現(xiàn)了貶義詞,篇章級的分析是無法分辨出來的,只能將其作為一個整體進行分析。不過好在有很多的場景是不需要區(qū)分觀點評價的實體和觀點持有者,例如:在商品評論的情感分析中,可以默認評論的對象是被評論的商品,評論的觀點持有者也是評論者本人。

第一步是判斷待分析的句子是否含有觀點信息;第二步則是針對這些含有觀點信息的句子進行情感分析,發(fā)現(xiàn)其中情感的傾向性,判斷是褒義還是貶義。關于分析情感傾向性的方法與篇章級類似,依然是可以采用監(jiān)督學習或根據(jù)情感詞詞典的方法來處理,我們會在后續(xù)的小節(jié)詳細講解。句子級的情感分析相較于篇章級而言,顆粒度更加細分,但同樣只能判斷整體的情感,忽略了對于被評價實體的屬性,同時它也無法判斷比較型的情感觀點。

另一種需要注意的情況是否定詞,否定詞的出現(xiàn)一般會改變情感詞原本的情感傾向,變?yōu)橄喾吹那楦?,例如“不好”就是在“好”前面加上了否定詞“不”,使之變成了貶義詞。除了條件句之外,還有一種語言表達也是需要在數(shù)據(jù)預處理階段進行排除的,那就是疑問句。

具體的做法與機器學習一樣需要分為兩個步驟:第一步是根據(jù)訓練數(shù)據(jù)構建算法模型;第二步是將測試數(shù)據(jù)輸入到算法模型中輸出對應的結果,接下來做具體的講解。首先,我們需要準備一些訓練用的文本數(shù)據(jù),并人工給這些數(shù)據(jù)做好情感分類的標注。通常的做法下:如果是褒義和貶義的兩分類,則褒義標注為1,貶義標注為0,如果是褒義、貶義和中性三分類,則褒義標注為1,中性標注為0,貶義標注為-1。

當訓練好分類模型之后,就可以對測試集進行分類了,具體的流程與建模流程類似,先對測試的文本數(shù)據(jù)進行分詞并做數(shù)據(jù)預處理,然后根據(jù)特征詞矩陣抽取測試文本的特征詞構建詞袋矩陣,并將詞袋矩陣的詞頻數(shù)據(jù)作為輸入數(shù)據(jù)代入之前訓練好的模型進行分類,得到分類的結果。

互聯(lián)網(wǎng)上的交流不僅僅只是通過單純的文字來進行,大量的情感表達是通過顏文字或表情包來實現(xiàn)的,例如經典的表示笑臉的顏文字“:D”,這類文本表達無法與上下文形成聯(lián)系,所以很難判斷他們評價的實體對象是什么。

不過好在這類數(shù)據(jù)本身就代表了非常強烈的情感傾向,在篇章級和句子級的顆粒度對情感進行分析,我們可以將特定的顏文字作為一種特殊的詞組構建成情感字典,并人工進行情感分的賦值,對于emoji表情也可以將標準的emoji編碼編入情感字典。而對于表情包的識別則是一個計算機視覺的問題,目前還沒有學者在這個領域方向展開研究。

這類比較語句中通常存在著兩個以上的實體或屬性,如果只是在句子級的顆粒度下可以辨別出這句話是含有褒義的情感,但在屬性級的顆粒度下,以情感五元組來定義的情感無法將一個實體作為另一個實體的屬性來進行判斷,很難分辨觀點持有者到底是在對哪一個實體或屬性表達情感。而這類語句在商品的評論中有非常常見,需要特別注意。

目前對于情感的分析依然處于初級階段,僅僅只是對情感做了褒義、貶義、中性三種劃分,但現(xiàn)實生活中的情緒遠遠不止這三種類型,例如:在心理學領域中,著名的心理學家羅伯特·普拉切克(Robert Plutchik)提出的情緒輪包含了8種基本情緒,并且每種情緒又劃分了不同的情緒強度等級,8種情緒還可以相互結合形成更多的情緒,如圖所示。

情緒輪在用戶體驗設計上被廣泛的應用,很多情感化設計都是基于情緒輪進行的。但是在人工智能領域,將情緒進行多分類比情感分析的三分類任務要難得多,目前大多數(shù)分類方法的結果準確性都不到50%。這是因為情緒本身包含了太多的類別,而且不同的類別之間又可能具有相似性,一個情緒詞在不同的語境下有可能表達的是不同的情緒類別,算法很難對其進行分類。即使是人工對文本進行情緒類別標注也往往效果不佳,因為情緒是非常主觀性的,不同的人對不同的文本可能產生不同的理解,這使得人工標注情緒類比的過程異常困難。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉