隨著人工智能技術在各領域的廣泛應用,將大型語言模型(LLM)部署到嵌入式端側設備成為重要趨勢。Llama 2 - 7B作為一款性能優(yōu)異的大語言模型,具有廣泛的應用前景。然而,其龐大的參數量對嵌入式設備的計算資源和存儲能力提出了巨大挑戰(zhàn)。瑞薩RZ/V2L處理器集成了強大的NPU(神經網絡處理單元),結合INT4量化技術,為在嵌入式端側部署Llama 2 - 7B提供了可行方案。
自誕生以來,人工智能大模型始終被“幻覺”問題困擾。這里的“幻覺”,指的是大語言模型會將虛構信息當作真實事實輸出。
2025年4月29日,阿里巴巴云旗下的Qwen團隊正式發(fā)布并開源Qwen3,作為Qwen系列的最新一代大型語言模型(LLM),包含一系列密集型(Dense)和混合專家(MoE)模型,參數規(guī)模從0.6億至2350億不等。同日,海光信息技術股份有限公司(以下簡稱“海光信息”)在其“智能深算”戰(zhàn)略引領下,宣布其深算單元(DCU,Deep Computing Unit)已完成對Qwen3全部8款模型(235B、32B、30B、14B、8B、4B、1.7B、0.6B)的無縫適配與優(yōu)化,實現零錯誤、零兼容性問題、秒級部署。這一整合依托基于GPGPU架構的生態(tài)優(yōu)勢和海光DTK軟件棧的領先特性,展現了Qwen3在DCU上的卓越推理性能與穩(wěn)定性,充分驗證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術優(yōu)勢,使其成為支撐AI大模型訓練與推理的關鍵基礎設施。
2025年4月25日,中國,北京——人工智能終端產業(yè)發(fā)展研討會暨人工智能終端工作組第一次全體大會召開,工業(yè)和信息化部副部長熊繼軍出席會議并致辭,工業(yè)和信息化部電子司和科技司、國家發(fā)展和改革委員會、商務部、北京市朝陽區(qū)有關領導參會,各地行業(yè)主管部門以及工作組有關專家學者、企業(yè)單位共200余人參加大會。
在當今數字化時代,人工智能(AI)無疑是推動各行業(yè)創(chuàng)新與發(fā)展的核心力量。從最初的簡單算法到如今復雜的大模型,AI 的發(fā)展日新月異。而隨著數據量呈指數級增長以及實時處理需求的飆升,傳統(tǒng)的云端 AI 模式逐漸顯露出諸多局限性,尤其是在帶寬受限或對隱私要求極為嚴苛的場景下,依賴遠程云服務器進行 AI 計算已難以滿足實際需求。在這樣的背景下,邊緣生成式 AI 異軍突起,正引領著智能計算領域的全新變革,將智能體驗切實地帶到消費者身邊。
助力生成式 AI 初創(chuàng)企業(yè)釋放潛能,加速全球化進程
隨著大模型在不斷演進的同時將推理應用大規(guī)模推向邊緣和端點設備,以及物聯網智化、具身智能、AI智能體(AI Agent)和物理AI等新的AI應用場景和模式的快速涌現,AI賦能設備的主控芯片設計師正面臨著全新的挑戰(zhàn)。尤其是對于邊緣和端點設備,它們既可能成為大模型的承載設備,也可能是用智能去為應用提供更好的核心功能,新的產品定義方向使主芯片架構師不得不去思考,其芯片在如何應對大模型快速演進的同時,還能實現用智能手段賦能傳統(tǒng)應用和實現新興功能。
4月13日消息,北京大學定量生物學中心錢瓏團隊研發(fā)、構建了全球首個針對功能基因挖掘任務的大語言模型SYMPLEX。
在當今數字化時代,數據量呈爆炸式增長,從人工智能大模型的訓練,到實時性要求極高的自動駕駛場景,從大規(guī)模數據中心的高效運算,到邊緣設備的快速響應,各行各業(yè)對計算性能的需求持續(xù)攀升。傳統(tǒng)的電計算模式在面對如此龐大且復雜的計算任務時,逐漸暴露出其在延遲和能效方面的局限性。而光電混合計算,作為一種融合了光與電優(yōu)勢的新興計算方式,正悄然崛起,逐步實現商業(yè)落地,為低延遲、高能效計算帶來了新的曙光,有望成為未來計算領域的主流選擇。
近日,百川智能被曝聯合創(chuàng)始人焦可已經離職,聯合創(chuàng)始人、模型研發(fā)負責人陳煒鵬即將離職。對于這些消息,百川智能方面選擇保持沉默。
3月12日消息,3月6日,來自中國的創(chuàng)業(yè)公司Monica正式對外發(fā)布通用型AI Agent(AI智能體)產品Manus。
3月10日消息,Monica聯合創(chuàng)始人、首席科學家季逸超(Peak)今日在社交平臺透露,Manus使用了Claude大模型和不同的阿里千問大模型(Qwen)的微調模型開發(fā)。
最近,OpenAI、DeepSeek、谷歌、Anthropic都推出新模型,它們都宣稱模型已經具備真正的推理能力,也就是人類解決問題時運用的思維方式,但問題在于:AI大模型所說的推理真的和人一樣嗎?
近日,搭載安謀科技最新一代“周易”NPU處理器的硬件平臺成功運行DeepSeek-R1系列模型,性能卓越、成本優(yōu)異,為用戶帶來了更高效、便捷的AI應用體驗。這款創(chuàng)新性NPU處理器采用專為大模型特性優(yōu)化的架構設計,其beta版本在2024年底已面向早期用戶開放評估測試,并獲得了廣泛認可與積極反饋。預計今年上半年,這款備受期待的NPU產品將正式亮相市場,屆時將為更多用戶帶來突破性的端側算力體驗。
盡管美國出臺法律禁止下載和使用DeepSeek,甚至對違規(guī)者處以最高20年的刑期,但這一措施似乎并未遏制美國人對DeepSeek的興趣,反而催生了大量山寨網站。
2025蛇年春節(jié),DeepSeek大語言模型以超低的訓練成本震撼全球,預示著大模型技術將以更快的腳步全面走進我們的工作和生活,同時也促進了能夠連通各種大模型和應用場景的智能終端將加速演進。語音作為人類與機器最常用的互動溝通媒體,將在大模型和邊緣智能并蒂薄發(fā)的時代成為可帶來巨大便利和效率的媒體,智能語音處理技術也將成為支撐大模型和邊緣智能的關鍵技術之一。
我們正身處一場技術革命的歷史開端,以 ChatGPT 為標志的這輪 AI 科技浪潮是算法和軟件誕生以來人類科技最重要的技術變革,由此開啟了以智能為核心的第四次工業(yè)革命。這次 AI 變革是由以 Scaling Law 為底層邏輯的基礎模型驅動,其整體的發(fā)展脈絡由基礎模型的技術邏輯主導。
1月10日,由全球計算聯盟(簡稱“GCC”)主辦的“2025全球計算大會——全球計算聯盟啟航大會”在深圳舉行。大會期間,同步舉辦了全球計算聯盟(GCC)成立慶典,并在隨后的年度系列成果發(fā)布儀式上,重磅發(fā)布了包括2部白皮書、2部研究報告、1項標準項目合作成果以及案例集等在內的一系列豐碩成果。作為GCC理事單位及白皮書牽頭參編的重要代表之一,安謀科技(中國)有限公司(簡稱“安謀科技”)受邀出席此次盛會,發(fā)表了主旨演講,并參與了GCC成立及成果發(fā)布儀式。
在信息技術飛速發(fā)展的今天,傳統(tǒng)搜索引擎正面臨前所未有的挑戰(zhàn)。AI大模型的興起,尤其是其在搜索技術中的應用,預示著搜索行業(yè)的未來將發(fā)生根本性變革。
12月24日消息,據報道,百川智能發(fā)布全鏈路領域增強大模型Baichuan4-Finance。在高質量金融數據的基礎上,通過行業(yè)首創(chuàng)的領域自約束訓練方案,實現了金融能力和通用能力同步提升的效果,極大提高了金融場景的整體可用性。