久久久久久久网-久久久久久久男人的天堂-久久久久久久免费视频-久久久久久久久综合影视网-尤物视频网站在线观看-尤物视频网站在线

行業門戶
NEWS CENTRE
首頁
>
新聞中心
>
谷歌深夜炸場 發布Gemini 2.0 2025屬于智能體?
谷歌深夜炸場 發布Gemini 2.0 2025屬于智能體?
2024-12-13 閱讀:839

AI大廠的競爭日趨白熱化,一邊OpenAI正如火如荼進行著為期12天的產品發布活動,另一邊谷歌也在頻頻放大招。

12月11日晚,剛剛發布量子芯片的谷歌,又投下一枚重磅炸彈,正式發布其最新版大模型Gemini 2.0系列。谷歌表示這是他們迄今為止最強大的人工智能模型,“專為智能體時代設計”,并同時介紹了多個智能體應用(AI Agent)。

值得一提的是,時至年末,海內外大廠對AI智能體的布局都熱情高漲,包括谷歌、微軟,以及國內以智譜為代表的廠商都在加速對這一領域的探索。“隨著越來越多的大廠布局AI智能體產品和生態,預計2025年將會成為AI智能體商用爆發的年度。”中信建投證券表示。

“展示了通用AI助手的曙光”

如果說去年底發布的Gemini 1.0是整合和理解信息,那么Gemini 2.0是能夠讓信息更加有用。谷歌在博客中表示,基于此前多模態方面的進展,Gemini 2.0能夠構建新的AI智能體,從而離通用助手的愿景更進一步。

目前谷歌完全對外開放的新模型是Gemini 2.0 Flash體驗版,這是谷歌的主力模型,具有低延遲特性。與此前的1.5 Flash版本相比,Gemini 2.0 Flash在同樣快速的響應時間下性能進一步增強。谷歌提到,2.0 Flash 在關鍵基準測試中甚至超越了此前的旗艦模型1.5 Pro,其速度是1.5 Pro的兩倍。

同時2.0 Flash還具有新功能,除了能夠支持圖片、視頻和音頻等多模態輸入,2.0 Flash還可以支持多模態輸出,例如可以直接生成圖像與文本混合的內容,以及原生生成可控的多語言文本轉語音(TTS)音頻;它還可以原生調用Google Search、代碼執行以及第三方用戶定義的函數等工具。

作為提供給開發者的體驗版模型,Gemini 2.0 Flash現在可以通過Google AI Studio和Vertex AI中的Gemini API獲取,所有開發者均可使用多模態輸入和文本輸出。該產品將于明年1月全面上市,谷歌稱屆時將推出更多型號。

對于Gemini 2.0模型,谷歌表示會先開放給開發者以及受信任的測試人員,并將其整合到產品中。Gemini 2.0基于谷歌定制的硬件第六代TPU Trillium構建而成。谷歌表示,TPU為Gemini 2.0的訓練和推理提供100%算力支持。

模型之外,谷歌這次的重頭戲是智能體。在發布產品的同時,谷歌CEO桑達爾·皮查伊(Sundar Pichai)在X平臺上著重提到了智能體Project Astra,認為其“展示了通用AI助手的曙光”。

皮查伊表示:“2025年將是令人興奮的一年。”帖子下則有評論表示,2025年會是屬于智能體的一年。

所謂智能體,簡單來說是能夠感知環境,具有獨立思考和行動能力的AI程序。傳統AI通常是指令驅動的,需要人類用戶輸入指令才會執行相應的任務,AI智能體則有獨立解決任務的能力。

Project Astra是谷歌最初在5月的I/O大會上首次對外發布的AI助手,彼時主要是對標OpenAI的GPT-4o,其主要功能包括實時語音和視覺處理,能夠通過手機或谷歌眼鏡進行跨文本、音頻、視頻的多模態實時推理。谷歌在此次的博客中將其稱為“使用多模態理解現實世界的智能體”。

對于此次正式發布的Project Astra,谷歌表示,它能夠流暢地在多種語言和混合語言之間進行對話,并且能夠理解不同口音和生僻單詞。此外,借助Gemini 2.0,Project Astra可以使用Google Search、Google Lens和Google Maps,從而在日常生活中發揮助手的作用。

谷歌增強了Project Astra的記憶能力,這一助手目前可以記住長達10分鐘的會話內容,并且可以回憶起過去與它進行的更多對話,能提供個性化服務。

在此前5月I/O大會上的演示中,在詢問Project Astra時,其語音回復還有一定的延遲,谷歌這次改進了這一點。博客提及,借助新的流式處理技術和原生音頻理解能力,該智能體能夠以接近于人類對話的延遲來理解語言。

除了Project Astra的升級版,這次谷歌發布的智能體還包括:完成復雜任務的智能體Project Mariner,能夠幫助開發者的編碼智能體Jules,以及游戲和其他領域的智能體。

Project Mariner是使用Gemini 2.0構建的早期研究原型,可以從瀏覽器開始探索人機交互,它能夠理解和推理瀏覽器頁面中的信息,包括像素和文本、代碼、圖像和表單等網頁元素,然后通過Chrome擴展程序使用這些信息為用戶完成任務。

在WebVoyager基準測試中,Project Mariner作為單個智能體設置實現了83.5% 的工作效率,達到了先進的水平。但谷歌提到,Project Mariner目前的運行并非總是準確,且完成任務的速度較慢,仍處于早期階段。

谷歌還在博客最后介紹了游戲和其他領域的智能體。就在上周,谷歌剛剛推出了世界基礎模型Genie 2,這是一個可以從單個圖像創建無限3D世界的AI模型。基于此,谷歌使用Gemini 2.0構建了智能體,可以幫助用戶在電子游戲中做出更好的決策。谷歌稱,這些游戲智能體可以根據屏幕上的實時畫面,分析游戲情況,并為用戶提供下一步的行動建議。

除了探索虛擬世界的智能體能力外,谷歌還將Gemini 2.0的空間推理能力應用于機器人領域,嘗試讓智能體在現實世界中提供幫助。這項研究仍處于初期階段,但谷歌認為智能體在現實環境中的應用前景非常廣闊。

海內外大廠積極布局智能體

“AI智能體在現實中的應用是一個令人振奮且充滿可能性的研究領域。”谷歌稱,團隊正在探索這個全新的領域,并開發出了一系列原型,幫助人們完成任務。

不僅是谷歌,臨近2024年底,AI智能體頻頻被行業人士提及。

近日,天風證券發布研究報告稱,海外大廠積極布局智能體構建應用,AI智能體正在快速發展,智能體在C端硬件落地正進入臨界點。

10月21日,微軟連發10個AI智能體,面向銷售、運營等場景;11月19日,微軟又宣布Copilot Studio平臺已支持用戶構建自主智能體,同時發布5款預構建的智能體。12月,亞馬遜公布了一系列布局AI大模型的進展。

在國內,以智譜為代表的廠商也開始重點發力AI智能體。10月25日,智譜發布AutoGLM智能體,可通過讀取語音指令理解用戶意圖,并模擬人類行為,自動完成點外賣、訂機票和酒店等操作。11月29日,智譜推出AutoGLM智能體升級版,支持自主執行超過50步的長步驟任務,并且能夠在執行任務時靈活切換不同的APP。

除智譜以外,字節、百度、騰訊、阿里等科技大廠也開始布局智能體,包括字節的Coze Agent平臺、百度千帆AgentBuilder智能體開發工具等。

在此前的采訪中,瑞銀證券中國科技軟件分析師張維璇預測:“明年是智能體的大年。”

她表示,最近也看到美國領先的軟件廠商發布了AI智能體的產品,通過智能體將企業的工作流自動化,在前中后臺的很多應用都能看到對客戶的效率和用戶體驗的提高,并且這些軟件公司也獲得了提價。

13560189272
地址:廣州市天河區黃埔大道西201號金澤大廈808室
COPYRIFHT ? 2010-2020 廣州市名聯網絡科技有限公司 ALL RIGHTS RESERVED 粵ICP備10203057號
  • 這里是二維碼