谷歌反擊OpenAI奇襲:發(fā)布生成式AI版搜索引擎等大模型“全家桶”

陳振芳2024-05-16 14:27

OpenAI召開春季發(fā)布會(huì)第二日,谷歌則以新一屆I/O開發(fā)者大會(huì)對(duì)陣。

這場(chǎng)活動(dòng)自北京時(shí)間5月15日凌晨1點(diǎn)開始便“火藥味”滿滿。谷歌在會(huì)上選擇“宣布一切”:連續(xù)發(fā)布、更新了十多款產(chǎn)品,包括AI助手Astra、文生圖模型Imagen3、對(duì)標(biāo)Sora的文生視頻模型Veo,以及備受矚目的旗艦大模型Gemini。

當(dāng)OpenAI“鴿”掉搜索,轉(zhuǎn)而推出最新旗艦大模型GPT-4o后,長期占據(jù)搜索霸主地位的谷歌,不僅重新設(shè)計(jì)了AI搜索,還同步推出AI識(shí)圖助手。

Gemini的新語音對(duì)話功能Live更是直接對(duì)標(biāo)OpenAI的GPT-4o,同樣可通過手機(jī)實(shí)時(shí)詢問周圍的情況,即使中斷對(duì)話也能再及時(shí)跟進(jìn)。

此外,谷歌瀏覽器Chrome將添加Gemini Nano。后者是Gemini系列中的一個(gè)輕量級(jí)版本,主要針對(duì)移動(dòng)設(shè)備設(shè)計(jì)。

谷歌還表示,另一小模型Gemma2.0即將于今年夏天推出,包括開源模型PaliGemma,可用于標(biāo)記照片以及為圖像添加標(biāo)題。Gemma模型采用與Gemini模型相同的技術(shù)棧,但規(guī)模更小,適合在資源受限的環(huán)境中部署。

很大程度上,人工智能競(jìng)賽也是一次爭(zhēng)奪智能手機(jī)的競(jìng)賽。谷歌產(chǎn)品管理副總裁Sameer Samat明確表示,谷歌將通過Gemini進(jìn)一步優(yōu)化安卓操作系統(tǒng)。這種優(yōu)化將首先在谷歌自家手機(jī)Pixel上得到體現(xiàn)。

Gemini顯然是此次發(fā)布會(huì)的主角,這當(dāng)中尤以多模態(tài)和長上下文技術(shù)被著墨更多。

過去幾個(gè)月,谷歌已經(jīng)推出了能夠進(jìn)行長上下文預(yù)覽的Gemini 1.5 Pro,在翻譯、編碼和推理方面進(jìn)行了一系列改進(jìn)。目前,Gemini 1.5 Pro的上下文長度由100萬token(文本處理的基本單位)刷新到200萬token,三個(gè)月即翻了一倍,表明該公司急于借此向外界“秀肌肉”。

此時(shí)距離Gemini問世已有一年,這一多模態(tài)大模型已經(jīng)可以跨文本、圖像、視頻、代碼等進(jìn)行推理。據(jù)谷歌透露,有20億用戶以及超150萬開發(fā)人員都在使用Gemini模型,該模型可被用于調(diào)試代碼、獲得新的見解并構(gòu)建下一代人工智能應(yīng)用程序。

為了能夠進(jìn)一步展示該模型的多種特性,谷歌針對(duì)搜索、照片、安卓系統(tǒng)等不同場(chǎng)景做了更加細(xì)致地介紹。

例如在搜索方面,Gemini為其帶來了全面的AI化改造。用戶可以提出更新、更長、更復(fù)雜的問題進(jìn)行查詢,甚至利用照片進(jìn)行搜索。谷歌計(jì)劃在本周開始向美國地區(qū)推出“AI概述”搜索,后續(xù)會(huì)在其他國家上線。

谷歌在現(xiàn)場(chǎng)展示了“詢問照片”這一功能。當(dāng)用戶在停車場(chǎng)付費(fèi)卻忘記了車牌號(hào)碼時(shí),通??赡軙?huì)在手機(jī)照片中搜索關(guān)鍵字,瀏覽大批過往照片來尋找車牌。但現(xiàn)在,只需詢問照片,就能準(zhǔn)確告知經(jīng)常出現(xiàn)的汽車,對(duì)車輛進(jìn)行三角測(cè)量,并告知車牌號(hào)。

再比如,你可以向照片提問自己的孩子是什么時(shí)候?qū)W會(huì)游泳的,甚至于干脆讓照片告訴你孩子的游泳進(jìn)展如何。

Gemini不僅僅是一個(gè)聊天機(jī)器人,也是個(gè)人助手,能夠幫助用戶處理復(fù)雜的任務(wù)以及采取行動(dòng)。Gemini 1.5 Pro也被引入谷歌云計(jì)算服務(wù)Google Work space。谷歌號(hào)稱,Gemini可以完成所有工作所需步驟。以退貨為例,AI可在郵件中搜索收據(jù),找到相應(yīng)的訂單號(hào),自動(dòng)填寫退貨表格,并安排取件。

大模型就是一場(chǎng)算力競(jìng)賽,訓(xùn)練最先進(jìn)的模型需要大量的算力。過去六年中,行業(yè)對(duì)機(jī)器學(xué)習(xí)計(jì)算的需求增長了100萬倍,并且每年都會(huì)增加十倍。作為AI時(shí)代的重要參與者,谷歌也在基礎(chǔ)設(shè)施方面發(fā)力頗多。

當(dāng)晚,谷歌即發(fā)布了第六代TPU(谷歌專為加速機(jī)器學(xué)習(xí)工作負(fù)載而設(shè)計(jì)的一種應(yīng)用特定集成電路)——“Trillium”,并稱Trillium是其迄今為止性能最高、效率最高的TPU,與上一代TPU v5e相比,每個(gè)芯片的計(jì)算性能提高了4.7倍,計(jì)劃將在今年底向客戶提供。

Gemini完全在谷歌自研的第四代和第五代TPU上接受訓(xùn)練和服務(wù),包括Anthropic在內(nèi)的其他領(lǐng)先人工智能公司也在TPU上訓(xùn)練了他們的模型。

但在谷歌為其各種產(chǎn)品“灌注”AI功能的同時(shí),意味著用戶需要對(duì)個(gè)人隱私數(shù)據(jù)做出更多讓渡。對(duì)此,谷歌承諾,不會(huì)使用其平臺(tái)上的用戶文件來訓(xùn)練Gemini或其他人工智能模型。

谷歌CEO皮查伊表示,當(dāng)天的發(fā)布會(huì)提到了121次“AI”,足以表明AI對(duì)谷歌的重要性。但除了強(qiáng)調(diào)重要之外,這場(chǎng)被外界所期待的針對(duì)OpenAI的反擊,并沒有帶來更大的驚喜。

轉(zhuǎn)載來源:界面新聞 作者:陳振芳

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【陳振芳】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù),不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議

熱新聞