經(jīng)濟(jì)觀察報(bào) 周悅 任曉寧/文 白天,安迪在一所名校數(shù)學(xué)系攻讀研究生,夜晚,他則化身數(shù)據(jù)標(biāo)注員,應(yīng)招國(guó)內(nèi)外各種大模型的標(biāo)注任務(wù),時(shí)薪大概在150元—300元。
當(dāng)Deepseek在1月下旬橫空出世后,這個(gè)工作越來(lái)越為外人所知。
Deepseek被討論得最多的方面之一是“文筆好”“情感真”。一些專家猜測(cè),DeepSeek團(tuán)隊(duì)可能給模型投喂了大量人文社科類數(shù)據(jù),還采用高水平的專業(yè)人員標(biāo)注數(shù)據(jù),鼓勵(lì)模型幻覺(jué),激發(fā)模型的想象力。
高質(zhì)量的輸出,很大程度上成就了Deepseek的增長(zhǎng)紀(jì)錄——上線7天用戶破億。
這些與安迪們的工作密切相關(guān)。
數(shù)據(jù)標(biāo)注,是指將圖片、語(yǔ)音、文本、視頻等數(shù)據(jù)處理成滿足機(jī)器學(xué)習(xí)訓(xùn)練要求的可讀數(shù)據(jù)編碼,即把信息轉(zhuǎn)化為計(jì)算機(jī)語(yǔ)言供AI學(xué)習(xí)。
華人科學(xué)家、“AI教母”李飛飛,最大的貢獻(xiàn)之一就是給世界上的海量圖像做數(shù)據(jù)標(biāo)注,為AI建立了標(biāo)注圖像數(shù)據(jù)集ImageNet,補(bǔ)上了深度學(xué)習(xí)的最后一塊拼圖。
通俗地講,好比大人教三齡童認(rèn)識(shí)事物的基本概念。大人掌握的知識(shí)越多,認(rèn)知水平越高,解釋能力越強(qiáng),小孩的成長(zhǎng)越快,甚至能舉一反三,融會(huì)貫通。
AI的進(jìn)化也是如此,依托算法、算力、數(shù)據(jù)共同驅(qū)動(dòng),背后的支柱分別是少數(shù)頂尖的算法科學(xué)家、海量的算力芯片以及海量的數(shù)據(jù)標(biāo)注員。
隨著算法差距縮小,算力布局更廣,數(shù)據(jù)的質(zhì)與量愈發(fā)成為AI進(jìn)化的關(guān)鍵。
數(shù)據(jù)特色會(huì)形成大模型的獨(dú)特風(fēng)格,比如,美國(guó)公司Anthropic的Claude系列模型“很文科且擅長(zhǎng)古詩(shī)詞”,表達(dá)兼具“信達(dá)雅”;谷歌的Gemini系列模型則更“理工科”,擅長(zhǎng)編程。
與過(guò)去最基礎(chǔ)的數(shù)據(jù)標(biāo)識(shí)工作(比如標(biāo)注道路交通標(biāo)識(shí))相比,安迪們現(xiàn)在更像是給AI上“奧數(shù)課”。他們?yōu)榇竽P途帉懺瓌?chuàng)的數(shù)學(xué)題,并評(píng)估大模型的解題思路與準(zhǔn)確性。要?jiǎng)偃未祟惞ぷ?,至少需要本科水平?/p>
安迪所在的“我們是AI飼養(yǎng)員”百人群里,人們很少再討論“人有沒(méi)有AI聰明”這類話題。
兼職近半年,安迪每完成一個(gè)任務(wù)就會(huì)“小抑郁幾天”,因?yàn)椤昂芎纳瘢浅@邸?。并且出題難度在增加,部分已經(jīng)達(dá)到研究生以上水平。雖然大模型可能不一定完全正確,但進(jìn)步速度太快。
今年以來(lái),安迪發(fā)現(xiàn)平臺(tái)任務(wù)量沒(méi)有以前多了,錯(cuò)過(guò)一個(gè)任務(wù)要等一兩周——AI們可學(xué)的東西正在變少。
過(guò)去,人工智能行業(yè)有“有多少人工,就有多少智能”的說(shuō)法,如今,AI的“飼養(yǎng)員”已經(jīng)變成碩士、博士,讓人聯(lián)想到《三體》里那句話:這是人類的落日。
甲骨文的供養(yǎng)
清華大學(xué)博士后馮聰,從2023年7月開(kāi)始接觸AI標(biāo)注工作。
她的專業(yè)為甲骨文研究,博士后階段交叉學(xué)習(xí)了計(jì)算機(jī)科學(xué)。甲骨文研究是一個(gè)冷門專業(yè),一般會(huì)在考古現(xiàn)場(chǎng)或是某個(gè)博物館工作。
ChatGPT爆火后,AI圈內(nèi)流行一個(gè)說(shuō)法:ChatGPT性能較好的原因之一是他們招聘了50個(gè)領(lǐng)域的專家做標(biāo)注。
在此之前,最常見(jiàn)的數(shù)據(jù)標(biāo)注項(xiàng)目是自動(dòng)駕駛類,標(biāo)注員要為道路標(biāo)識(shí)“拉框”“打標(biāo)”,一天完成幾百個(gè),以分為單位計(jì)件報(bào)酬,部分地區(qū)日薪剛過(guò)100元。
以大模型為代表的生成式AI,要求更高。經(jīng)過(guò)專業(yè)人才“投喂”后,模型數(shù)據(jù)會(huì)變得更干凈,算法會(huì)有更好的血脈,AI生成的內(nèi)容更符合人類審美。
馮聰在清華上學(xué)時(shí)的一位老師創(chuàng)辦了面壁智能,目前這家公司已經(jīng)成為AI領(lǐng)域的頭部公司,去年融資數(shù)億元。
2023年7月,面壁智能組建智能數(shù)據(jù)標(biāo)注團(tuán)隊(duì),大量招聘高學(xué)歷人才,馮聰便加入了。
當(dāng)時(shí),高學(xué)歷的AI標(biāo)注員非常稀缺,沒(méi)有人知道用什么樣的數(shù)據(jù)、如何進(jìn)行標(biāo)注能取得好的效果。即使是同樣的數(shù)據(jù),標(biāo)注的人和方式不同,模型生成效果相差極大。
馮聰從自己最熟悉的古文字著手,一點(diǎn)點(diǎn)找到了生成式AI的標(biāo)注門道。一開(kāi)始,大模型只能學(xué)習(xí)10%的古文字,標(biāo)注半年后,大模型基本能識(shí)別并生成喂進(jìn)去的所有古文字。
“數(shù)據(jù)標(biāo)注就像培養(yǎng)孩子一樣,有人精心培養(yǎng),有人野蠻生長(zhǎng)。這兩年已經(jīng)普遍到了精心培養(yǎng)階段?!瘪T聰告訴經(jīng)濟(jì)觀察報(bào),現(xiàn)在稍微知名些的AI公司,都培養(yǎng)了自己的高學(xué)歷AI標(biāo)注員。
馮聰?shù)母吖鈺r(shí)刻,是2024年斯坦福大學(xué)抄襲事件發(fā)生時(shí)。當(dāng)時(shí)斯坦福大學(xué)一個(gè)AI團(tuán)隊(duì)發(fā)布了新模型,宣稱性能頂尖且成本極低。面壁智能算法工程師發(fā)現(xiàn),該模型與面壁的模型很相似,但這個(gè)懷疑很難被證實(shí),因?yàn)樗惴ùa相似的情況很常見(jiàn)。
馮聰發(fā)現(xiàn)了鐵證。她標(biāo)注的清華簡(jiǎn)(戰(zhàn)國(guó)竹簡(jiǎn))數(shù)據(jù)被上述斯坦福大學(xué)團(tuán)隊(duì)用到模型里,而這一數(shù)據(jù)集屬于面壁智能的獨(dú)家內(nèi)容。最終,這幾個(gè)斯坦福大學(xué)學(xué)生承認(rèn)了抄襲。這件事也讓面壁智能登上熱搜。
做AI標(biāo)注,時(shí)不時(shí)會(huì)讓人感到枯燥乏味。不過(guò)馮聰之前做的甲骨文學(xué)術(shù)研究,同樣是枯燥的?,F(xiàn)在,AI為這種古老文化注入了新的靈魂,令她深受觸動(dòng)。
一位70多歲的甲骨文權(quán)威教授對(duì)她說(shuō),幾千年的東西,與AI結(jié)合起來(lái),更能擦出火花。
數(shù)據(jù)“蟻?zhàn)濉?/strong>
早上10點(diǎn),三水已坐在電腦前,揮舞鼠標(biāo),指揮千里之外的標(biāo)注人員開(kāi)展工作。
三水是某“211”大學(xué)研究生,具有垂類行業(yè)經(jīng)驗(yàn),幾個(gè)月前轉(zhuǎn)行進(jìn)入一家估值幾十億美元的大模型初創(chuàng)公司做數(shù)據(jù)標(biāo)注,他的崗位叫“AI數(shù)據(jù)專家”。
三水告訴經(jīng)濟(jì)觀察報(bào),有上千名標(biāo)注員為這家公司服務(wù),絕大多數(shù)由項(xiàng)目經(jīng)理管理,完成簡(jiǎn)單任務(wù),如標(biāo)注情感傾向、標(biāo)注地名人名、去除無(wú)用信息等。
與三水合作的垂類行業(yè)標(biāo)注員不到10人,多為有相關(guān)行業(yè)工作經(jīng)驗(yàn)的人,他們既具備專業(yè)知識(shí),又懂標(biāo)注和文本編輯。這類人才稀缺,考核標(biāo)準(zhǔn)相對(duì)寬松,每人每天很可能只能完成3—5項(xiàng)任務(wù)。
標(biāo)注員常常像分析師一樣撰寫答案,每條任務(wù)都是一篇專業(yè)作文。這些內(nèi)容不能出絲毫差錯(cuò),微小差異也需查證專業(yè)書籍或由業(yè)內(nèi)專家判斷。
這些標(biāo)注數(shù)據(jù)并非直接展示給用戶,而是作為語(yǔ)料供算法工程師訓(xùn)練,通用類數(shù)據(jù)讓大模型變得更智能,垂直類數(shù)據(jù)則使其更專業(yè)。
劉到閑在一家大廠擔(dān)任語(yǔ)音類產(chǎn)品的AI數(shù)據(jù)專家,她是某“985”大學(xué)語(yǔ)言學(xué)專業(yè)研究生。該產(chǎn)品核心目標(biāo)是“讓AI語(yǔ)音更像人——能共情、情感充沛且理解力強(qiáng)”。
她的工作有三部分:分別是制定標(biāo)注規(guī)則、監(jiān)測(cè)人員效率和完成率、在上千條標(biāo)注數(shù)據(jù)中抽樣10%驗(yàn)收檢查。有時(shí)候,她自嘲自己像一個(gè)“數(shù)據(jù)包工頭”。
劉到閑團(tuán)隊(duì)對(duì)該模型的評(píng)價(jià)維度超過(guò)20個(gè),包括避免字詞錯(cuò)誤,保證文本流暢、上下文關(guān)聯(lián),保證語(yǔ)音自然、無(wú)發(fā)音錯(cuò)誤,以及具備情感表現(xiàn)力等。
如何制定標(biāo)注規(guī)則?以“語(yǔ)音不自然”為例,她需要評(píng)估語(yǔ)音的韻律、節(jié)奏、音質(zhì)、聲音抖動(dòng),甚至用工具查看聲音波形圖;而解決“情感不足”問(wèn)題,最基礎(chǔ)的要求是語(yǔ)氣一致性,比如不能用悲傷的語(yǔ)氣說(shuō)“我很開(kāi)心”,更深入的要求是能識(shí)別用戶情感,AI的回復(fù)要表達(dá)共情和安慰。
相比醫(yī)療等垂類的專業(yè)難度,這類音頻標(biāo)注工作更簡(jiǎn)單,但考核也更為嚴(yán)格。如果標(biāo)注員亂打分,誤差大或者人效低,AI公司會(huì)更換供應(yīng)商。
標(biāo)注員的工作類似“工蟻”。任務(wù)分發(fā)后,他們會(huì)在系統(tǒng)上看到兩條持續(xù)5秒到2分鐘不等的音頻,需反復(fù)聽(tīng)并按要求打分評(píng)價(jià)。這類中等難度的工作,每天需至少完成200條;如果是更簡(jiǎn)單的任務(wù),一天要完成超過(guò)1000條。
服務(wù)這兩家公司的全職標(biāo)注員,都有上千人,他們絕大部分來(lái)自外部數(shù)據(jù)供應(yīng)商。這些數(shù)據(jù)供應(yīng)商大多分布在河南、湖南、山西等省份的三四線城市。從十年前的智駕、智慧城市類AI標(biāo)注開(kāi)始做起,隨著最近幾年生成式AI標(biāo)注需求陡增,這些數(shù)據(jù)供應(yīng)商也開(kāi)始轉(zhuǎn)行。
入行久、信譽(yù)好的數(shù)據(jù)供應(yīng)商,其員工素質(zhì)相對(duì)較高。據(jù)三水了解,這些標(biāo)注員在當(dāng)?shù)氐墓べY相對(duì)較高,有些能拿到5000元以上,也吸引當(dāng)?shù)夭簧俦究粕?、碩士生。
中國(guó)信通院報(bào)告指出,隨著人工智能巨頭的崛起,數(shù)據(jù)標(biāo)注和采集需求激增,市場(chǎng)在2015年開(kāi)始形成。此后,谷歌的AlphaGo橫空出世,人工智能開(kāi)始商業(yè)化探索,數(shù)據(jù)標(biāo)注等服務(wù)也迎來(lái)了一個(gè)發(fā)展高峰。
2020年,數(shù)據(jù)標(biāo)注師被正式納入國(guó)家職業(yè)分類目錄。2021年,《人工智能訓(xùn)練師國(guó)家職業(yè)技能標(biāo)準(zhǔn)(2021年版)》發(fā)布,數(shù)據(jù)標(biāo)注員是人工智能訓(xùn)練師的工種之一。
馮聰稱,事實(shí)上,普通用戶也在無(wú)形中成為AI的訓(xùn)練者。目前國(guó)內(nèi)已經(jīng)有多個(gè)產(chǎn)品的月活用戶在3000萬(wàn)以上,用戶每次的修正或者反饋,就是一次標(biāo)注。
看得見(jiàn)的天花板
三水所在公司的AI數(shù)據(jù)專家分為醫(yī)學(xué)類、金融、法律等領(lǐng)域,此外還有一類叫生活類專家。招聘要求一般是985和211研究生及以上水平。
如果有豐富的垂類經(jīng)驗(yàn),也會(huì)適當(dāng)放寬學(xué)歷標(biāo)準(zhǔn),三水說(shuō):“其實(shí)是看你有沒(méi)有積累。”
DeepSeek在Boss直聘上也有類似的崗位,名為“AGI數(shù)據(jù)百曉生”,崗位介紹中的一條是“涉獵廣泛、博聞強(qiáng)識(shí),對(duì)各行各業(yè)的知識(shí)都擁有強(qiáng)烈的興趣”。這一崗位的正式工資在1.5萬(wàn)元/月—3萬(wàn)元/月之間。
三水說(shuō),這個(gè)工作吸引他的原因有兩方面,一是比以前的工資高,每月在2萬(wàn)元左右;二是氛圍較好,想法會(huì)被尊重,團(tuán)隊(duì)愿意放手讓員工去嘗試。
在大公司中,經(jīng)常會(huì)出現(xiàn)歧視外包標(biāo)注員的情況。但在這家公司,創(chuàng)始人對(duì)數(shù)據(jù)極為看重,會(huì)和標(biāo)注員一樣坐在電腦前做標(biāo)注。
雖然如此,三水對(duì)這份工作的前景并不樂(lè)觀。
他和劉到閑都把自己比做一塊電池,把數(shù)據(jù)標(biāo)注的工作比作“持續(xù)放電”。三水說(shuō):“即便人充電的速度再快,也趕不上AI消耗你的速度?!?/p>
在三水看來(lái),AI的智能水平已經(jīng)超越了大多數(shù)普通人。從技術(shù)角度來(lái)看,垂類數(shù)據(jù)有限,這一領(lǐng)域的從業(yè)者會(huì)更快觸到天花板。他已經(jīng)做好再次轉(zhuǎn)行的心理準(zhǔn)備。
劉到閑最近的崗位調(diào)整驗(yàn)證了這一點(diǎn),她回到了基座模型團(tuán)隊(duì)。很大的原因是公司的大模型能力發(fā)展迅速,在數(shù)據(jù)上沒(méi)有太多探索空間。今年以來(lái),她的領(lǐng)導(dǎo)每一次周會(huì)都會(huì)反復(fù)質(zhì)問(wèn):數(shù)據(jù)專家的價(jià)值是什么?
高學(xué)歷AI標(biāo)注員或許不缺轉(zhuǎn)行機(jī)會(huì)。他們?cè)谝患褹I公司真正工作過(guò),與算法工程師、產(chǎn)品經(jīng)理每天打交道,會(huì)很清晰地知曉AI生成的邏輯與流程。目前,熟悉AI行業(yè)的人才仍是稀缺的,馮聰帶過(guò)的AI標(biāo)注員,不少人跳槽到字節(jié)跳動(dòng)、百度等互聯(lián)網(wǎng)大廠,直到現(xiàn)在,仍有不少獵頭私信挖人。
在進(jìn)入AI行業(yè)前,三水和劉到閑都長(zhǎng)期思考過(guò)“AI與人類的關(guān)系”。劉到閑在本科期間就對(duì)AI產(chǎn)生了較大的興趣,曾經(jīng)想攻讀計(jì)算語(yǔ)言學(xué)方向的博士,一度相信語(yǔ)言學(xué)的訓(xùn)練方式會(huì)讓智能涌現(xiàn)。
工作近2年后,劉到閑更多感覺(jué)到被瑣碎的工作、復(fù)雜的人際溝通“困住”,自比“流水線”上的女工、建筑工地的“包工頭”。有時(shí),她意識(shí)到自己正身處AI最靠近未來(lái)的地方,會(huì)生發(fā)感慨。但這種念頭轉(zhuǎn)瞬即逝,她還得回到現(xiàn)實(shí)。
“這只是一份工作而已?!比f(shuō),“我不擔(dān)心‘教會(huì)AI,餓死人類’,AI和人類已經(jīng)不在同一維度了。即使不被AI替代,也會(huì)被年輕人替代。人們到底在焦慮什么、擔(dān)心什么?”
(應(yīng)受訪者要求,安迪、三水、劉到閑為化名)
?