国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

  • 首頁 > 云計算頻道 > 云計算

    科技云報道:AI自動化標注崛起,數據標注員要失業了?

    2024年01月24日 14:25:13 來源:科技云報道

      科技云報道原創。

      在數據標注行業流行著一句話:“有多少智能,就有多少人工”。

      由于需要標注的數據規模龐大且成本較高,一些互聯網巨頭及一些AI公司很少自己設有標注團隊,大多交給第三方數據服務公司或者數據標注團隊來做。

      這也衍生出了專為AI而生的人力密集型的數據標注產業鏈。

      例如,眾包平臺Mechanical Turk上的20萬名AI數據標注員,就分布在人力成本低廉的非洲和東南亞。印度甚至涌現了不少數據標注村,他們為美國、歐洲、澳洲和亞洲的AI公司服務。

      在中國,上百萬名 AI 數據標注員分布在貴州、山西、山東、河南等省份的二三線城市,并逐步向人力成本更低的縣城滲透。

      但諷刺的是,數據標注員正在被自己服務的AI所替代,已經有企業開始采用AI進行數據標注。

      據彭博社1月14日報道,蘋果公司將關閉圣地亞哥一個與人工智能業務相關的121人團隊,這將導致數據標注員面臨被解雇的風險。

      那么,人工數據標注能否真的被AI全面替代,我們又是否會進入“AI訓練AI”的時代呢?

      AI自動化標注崛起

      訓練一個高效的大模型必不可少的是高質量的數據。OpenAI正是借助基于人類標注的數據,才一舉從眾多大模型企業中脫穎而出,讓ChatGPT成為了大模型競爭中階段性的勝利者。

      但同時,OpenAI也因為使用非洲廉價的人工進行數據標注,被各種媒體口誅筆伐。

      對于數據標注,一定需要找到一個新的方法,才能避免大量使用人工標注帶來的包括道德風險在內的其他潛在麻煩。

      因此,全球各大AI巨頭和大型獨角獸,都在進行數據標注自動化的探索。

      蘇黎世大學研究發現,ChatGPT平均每個標注成本低于0.003美元,比眾包平臺便宜20倍;在相關性、立場、主題等任務中,ChatGPT也是以4:1的效率優勢“碾壓”人類。

      來自卡耐基梅隆大學、耶魯大學和加州大學伯克利分校的一組研究人員更是發現:GPT-4在數據集標注表現上優于他們雇用的最熟練的眾包員工。

      這一突破為研究人員節約了超過50 萬美元和2萬個工時。

      論文發出后,有網友評論稱“這是直接端了平臺工作者的飯碗”。

      目前在自動駕駛領域,已經有車企開始采用AI進行自動化標注。

      例如,特斯拉一直在積極推進自動化標注的進展,從2018至今,特斯拉的標注經歷了4個階段:

      第1階段(2018):只有純人工的二維的圖像標注,效率非常低;

      第2階段(2019):開始有3D label,但是是單趟的人工的;

      第3階段(2020):采用BEV空間進行標注,重投影的精度明顯降低;

      第4階段(2021):采用多趟重建去進行標注,精度、效率、拓撲關系都達到了極高的水準。

      2022年6月,特斯拉裁撤了200名為特斯拉標注視頻以改進輔助系統的美國員工。

      目前,特斯拉的自動標注能力大幅改善,標注10000個不到60秒的視頻,大模型只需要運行一周即可,而同樣的工作量人工標注卻需要幾個月的時間。

      在國內,理想汽車董事長兼CEO李想曾在2023年4月份舉行的一場論壇上表示,當理想汽車使用軟件2.0的大模型,通過訓練的方式進行自動化標定,過去需要用一年做的事情,基本上3個小時就能完成,效率是人的1000倍。

      不僅如此,自動化標注工具也在飛速發展。

      國外AI初創公司refuel推出了一個名為Autolabel的開源工具,可以使用市面上主流的大模型來對數據集進行標注。

      該公司的測試結果稱,Autolabel的標注效率相比人工標注提高了100倍,成本僅為人工成本的1/7。

      國內一家名為視智未來的公司也在打造標注大模型。他們表示,有些項目已經用GPT交付了,準確率方面達到了80%多,與人工接近。

      不得不說,在AI面前,無論成本還是效率,人類可以說是毫無優勢。

      RLAIF:AI標注訓練方法

      話說回來,ChatGPT是怎么搶了數據標注員的“飯碗”的?

      以往數據標注員要干的事情,是將標注好的數據用作AI模型的訓練集或評估標準,這個過程叫做RLHF(Reinforcement Learning from Human Feedback),即基于人類反饋的強化學習。

      RLHF也是被ChatGPT、Bard和LLaMA等新興大模型帶火的模型訓練方法,它最大的好處就在于能夠將模型和人類的偏好對齊,讓大模型給出更符合人類表達習慣的回答。

      不過發布在arXiv的一份論文表明,這份看起來只有人類能做的工作,也能被AI取代。AI取代了RLHF中的“H”,誕生了一種叫做“RLAIF”的訓練方法。

      這份由谷歌研究團隊發布的論文顯示,RLAIF能夠在不依賴數據標注員的情況下,表現出能夠與RLHF相媲美的訓練結果——

      如果拿傳統的監督微調(SFT)訓練方法作為基線比較,比起SFT,1200個真人“評委”對RLHF和RLAIF給出答案的滿意度都超過了70%(兩者差距只有2%);另外,如果只比較RLHF和RLAIF給出的答案,真人評委們對兩者的滿意度也是對半分。

      具體而言,研究人員主要就“根據一段文字生成摘要”這一任務,展示了RLAIF的標記方法。

      首先是序言(Preamble),用來介紹和描述手頭任務的說明。給定一段文本和兩個可能的摘要,輸出1或2來指示哪個摘要最符合上述定義的連貫性、準確性、覆蓋范圍和整體質量。

      其次是樣本示例(1-Shot Exemplar)。給到一段文本,接著給到兩個摘要,以及“摘要1更好”的偏好判斷,讓AI學著這個示例對接下來的樣本做標注。

      再次就是給出所要標注的樣本(Sample to Annotate),包括一段文本和一對需要標記的摘要。

      最后是結尾,用于提示模型的結束字符串。

      就像人類標注員會給不同的回答打分一樣(比如滿分5分),AI也會依據偏好給每個摘要打分,這也是AI和人類標注員發揮作用的關鍵環節,主要是用于訓練獎勵模型(RM)并生成反饋內容。

      論文介紹到,為了讓RLAIF方法中AI標注更準確,研究者也加入了其他方法以獲取更好的回答。

      譬如為了避免隨機性問題,會進行多次選擇,其間還會對選項的順序進行交換;此外還用到了思維鏈(CoT)推理,來進一步提升與人類偏好的對齊程度。

      需要說明的是,谷歌的這篇論文也是第一個證明了RLAIF在某些任務上能夠產生與RLHF相當的訓練效果的研究。這意味著不用人類指點,AI也能訓練自己的同類了。

      該論文的發布很快收獲了不少關注。比如有從業者評論道,等到GPT-5可能就不需要人類數據標注員了。

      盡管這項工作凸顯了RLAIF的潛力,但依然有一些局限性:

      首先,這項研究僅探討了摘要總結任務,關于其他任務的泛化性還需要進一步研究。

      其次,研究人員沒有評估LLM推理在經濟成本上是否比人工標注更有優勢。

      此外,還有一些有趣的問題值得研究,例如RLHF與RLAIF相結合是否可以優于單一的一種方法,使用LLM直接分配獎勵的效果如何,改進AI標注器對齊是否會轉化為改進的最終策略, 以及是否使用LLM與策略模型大小相同的標注器可以進一步改進策略(即模型是否可以“自我改進”)。

      重人力轉向重技術

      盡管AI自動化標注技術在快速發展,但第三方數據標注服務商并沒那么樂觀。

      河南一家眾包平臺的項目經理認為,自動化標注還不能取代60%以上的標注需求,只能作為輔助標注工具處理單一或特定數據,提升人效。

      另一家數據標注公司的產品經理認為,自動化標注只能過濾簡單的基礎數據,還不能像人一樣從復雜有爭議的場景中精確識別物體。

      如果說簡單的標注可以用AI來完成,那么人工參與的將是難度更高的數據篩選和標準工作,這也意味著數據標注行業的門檻將會不斷提高。

      作為對照,早在ChatGPT走紅前,OpenAI就組建十幾位博士生來“打標”。

      而百度在海口的數據標注基地擁有數百名專職大模型數據標注師,標注師的本科率達到100%,需要具備一定的知識儲備和邏輯分析能力。

      不過大家也認同,未來的數據標注將從重人力轉向重技術的趨勢。

      一家眾包平臺的創始人在和同行交流時說,未來不能堆人力,要有研發能力。也有從業者認為,人工標注對于泛化仍然極其重要,而RLHF+RLAIF混合方法比任何單一方法都要好。

      總之,不是被同行“卷死”,就是被技術“卷死”。數據標注公司已做好了隨時裁員的準備,同時向做自動化標注工具的方向發展。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    91美女片黄在线观看| 欧美亚洲动漫精品| 亚洲大尺度视频在线观看| 最新日韩在线视频| 中文字幕五月欧美| 中文字幕精品一区二区精品绿巨人| 日韩午夜三级在线| 日韩欧美精品三级| 精品国产自在久精品国产| 日韩一区二区在线看片| 日韩欧美国产系列| 精品成人一区二区| 欧美国产国产综合| 亚洲日本一区二区| 午夜精品国产更新| 麻豆精品一二三| 国产一区二区三区四区五区入口 | 曰韩精品一区二区| 一区二区三区四区亚洲| 午夜影视日本亚洲欧洲精品| 免费成人结看片| 国产精品一级在线| www.日韩精品| 欧美日精品一区视频| 欧美一区二区三区四区高清 | 亚洲第一会所有码转帖| 免费视频一区二区| 国产麻豆成人精品| 色综合咪咪久久| 欧美电影一区二区| 国产亚洲午夜高清国产拍精品| 国产精品美女久久久久久久网站| 亚洲午夜一区二区三区| 精品亚洲国内自在自线福利| 成人一级视频在线观看| 欧美自拍丝袜亚洲| 精品国产乱码久久久久久浪潮| 亚洲国产精品成人综合| 亚洲午夜在线视频| 国模一区二区三区白浆| 91免费观看国产| 精品sm在线观看| 亚洲国产美女搞黄色| 国产精品一区二区三区乱码| 在线观看日产精品| 国产欧美精品国产国产专区| 丝袜美腿亚洲综合| 91在线视频免费91| 久久亚洲精品国产精品紫薇| 亚洲高清不卡在线观看| 成人av电影在线网| 精品国产乱码久久久久久图片| 一区二区三区四区视频精品免费| 国精品**一区二区三区在线蜜桃| 色婷婷激情久久| 国产精品久久毛片a| 久久66热re国产| 4438x成人网最大色成网站| 一区在线中文字幕| 国产一区二区三区视频在线播放| 欧美日韩精品欧美日韩精品一| 国产精品亲子伦对白| 激情图区综合网| 日韩天堂在线观看| 奇米色一区二区| 欧美精品久久99久久在免费线 | 正在播放一区二区| 亚洲一区二区在线视频| 不卡视频一二三| 中文字幕成人在线观看| 国产美女视频91| 精品国产一二三| 日韩av一区二区三区四区| 欧美日韩一区不卡| 亚洲成人资源在线| 欧美三级午夜理伦三级中视频| 亚洲人xxxx| 91在线你懂得| 亚洲欧美另类小说视频| 色婷婷综合在线| 一区二区三区四区在线播放| 在线一区二区三区四区五区 | 亚洲第一电影网| 欧美色图第一页| 亚洲成人手机在线| 欧美日韩国产精品成人| 亚洲成av人影院| 欧美一区二区在线看| 久久疯狂做爰流白浆xx| 欧美mv日韩mv国产网站| 国产一区二区毛片| 中文在线一区二区| 91理论电影在线观看| 亚洲国产日韩在线一区模特| 欧美日韩视频不卡| 另类人妖一区二区av| 久久精品亚洲乱码伦伦中文 | av色综合久久天堂av综合| 亚洲精品一二三| 欧美日韩一区二区三区高清| 另类人妖一区二区av| 久久久蜜桃精品| 99国产精品国产精品久久| 亚洲一区二区美女| 日韩一区和二区| 成人一区二区三区| 亚洲444eee在线观看| xnxx国产精品| 日本黄色一区二区| 久久精品免费观看| 亚洲欧美在线观看| 欧美一区二区三区不卡| 成人av在线一区二区三区| 亚洲一区电影777| 精品国产欧美一区二区| 91捆绑美女网站| 蜜桃精品视频在线观看| 中文字幕欧美一区| 日韩久久久精品| 色呦呦国产精品| 国内成+人亚洲+欧美+综合在线| 亚洲色图20p| 精品电影一区二区| 欧美在线免费视屏| 国产老妇另类xxxxx| 亚洲国产视频直播| 国产欧美在线观看一区| 欧美肥妇free| 91视频国产资源| 国产精品一区二区男女羞羞无遮挡| 一区二区三区av电影| 久久久99精品久久| 337p亚洲精品色噜噜狠狠| 成人激情综合网站| 麻豆成人免费电影| 一区二区三区四区亚洲| 中文字幕第一页久久| 欧美成人精品3d动漫h| 欧美日韩免费观看一区二区三区| 国产成人免费视频精品含羞草妖精| 日韩精品午夜视频| 亚洲一区二区三区在线看| 中文字幕精品三区| 26uuu欧美日本| 欧美一级xxx| 欧美日本一道本在线视频| 91丨九色porny丨蝌蚪| 国产成a人亚洲精品| 国内偷窥港台综合视频在线播放| 亚洲成人综合视频| 亚洲国产视频一区二区| 亚洲摸摸操操av| 国产精品国模大尺度视频| 国产欧美一区二区精品性色超碰| 久久综合九色综合欧美亚洲| 日韩精品一区二区三区在线播放| 欧美浪妇xxxx高跟鞋交| 欧美日韩国产成人在线91| 欧美日韩一区二区在线视频| 在线观看一区不卡| 欧美无砖专区一中文字| 欧美在线色视频| 欧美三级午夜理伦三级中视频| 欧美自拍偷拍一区| 欧美日韩亚洲综合| 欧美日韩视频第一区| 欧美精品在线一区二区| 欧美人与z0zoxxxx视频| 欧美久久久久久久久| 91精品国产手机| 欧美v日韩v国产v| 久久免费偷拍视频| 国产精品久久久久一区二区三区共| 国产农村妇女精品| 亚洲天堂中文字幕| 亚洲成a人片在线观看中文| 日本不卡123| 国产精品资源在线| www.欧美日韩国产在线| 91高清视频在线| 欧美一区二区在线免费播放| 精品美女一区二区| 中文字幕成人网| 亚洲一区二区三区四区中文字幕| 天天影视网天天综合色在线播放| 蜜臀a∨国产成人精品| 国产成人综合在线观看| 色婷婷激情综合| 日韩一区二区三区av| 久久亚洲一区二区三区明星换脸 | 亚洲电影第三页| 蜜臀久久99精品久久久久宅男| 久久不见久久见中文字幕免费| 国产精品亚洲第一| 色88888久久久久久影院按摩| 欧美二区三区的天堂| 国产欧美一区在线| 亚洲成人av免费| 国产精品白丝av| 欧美日韩在线免费视频|