8月31日,上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)宣布開(kāi)源發(fā)布多模態(tài)大模型書生·萬(wàn)象InternVL5。該模型通過(guò)創(chuàng)新的級(jí)聯(lián)式強(qiáng)化學(xué)習(xí)(CascadeRL)、動(dòng)態(tài)視覺(jué)分辨率路由與解耦部署架構(gòu),實(shí)現(xiàn)了推理能力、部署效率與通用能力的全面升級(jí)。
8月13日,在FORCELinkAI創(chuàng)新巡展·青島站,火山引擎宣布旗下產(chǎn)品AI數(shù)據(jù)湖服務(wù)LAS上線“算子廣場(chǎng)”,該功能進(jìn)一步增強(qiáng)了企業(yè)對(duì)文本、圖像及音視頻的處理能力,加速企業(yè)知識(shí)資產(chǎn)的自動(dòng)化流通與增值。
在虛擬現(xiàn)實(shí)、元宇宙技術(shù)快速發(fā)展的背景下,三維虛擬內(nèi)容創(chuàng)作的高成本與低效率問(wèn)題一直是行業(yè)痛點(diǎn)。近日,浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院博士研究生、魔芯科技陳天潤(rùn)帶領(lǐng)團(tuán)隊(duì),依托浙江大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心提供的算力支持,實(shí)現(xiàn)了基于昇騰平臺(tái)NPU的首個(gè)三維模型生成算法模型Img2CAD的開(kāi)發(fā)。
把這個(gè)活兒都交給扣子空間!24小時(shí)為你服務(wù),手把手教學(xué):從零生成專業(yè)PPT3步生成專業(yè)PPT的極簡(jiǎn)流程
近日,Inclusion AI 與 螞蟻集團(tuán)聯(lián)合推出了一款名為 “Ming-Omni” 的先進(jìn)多模態(tài)模型,標(biāo)志著智能技術(shù)的新突破。
今天,無(wú)線藍(lán)牙耳機(jī)(TWS)已經(jīng)成為人人都用得起的產(chǎn)品。
多模態(tài)推理技術(shù)的發(fā)展正助力智能駕駛能力升階。
今年2月初,谷歌發(fā)布的Gemini2.0Pro支持200萬(wàn)上下文,震驚了整個(gè)大模型領(lǐng)域。
在多模態(tài)人工智能領(lǐng)域,智源研究院與多所高校合作推出了全新的多模態(tài)向量模型 BGE-VL,標(biāo)志著多模態(tài)檢索技術(shù)的一次重大突破。
開(kāi)年放大招!階躍星辰重磅升級(jí) Step 系基座模型全家桶,一口氣連更上新6款模型。作為業(yè)內(nèi)公認(rèn)的「多模態(tài)卷王」,這家 AI 明星公司目前已擁有業(yè)內(nèi)最全模型矩陣。
谷歌云(Google Cloud)日前發(fā)布了《2025年AI商業(yè)趨勢(shì)》報(bào)告,預(yù)測(cè)了AI在未來(lái)一年將如何重塑商業(yè)格局。
揚(yáng)州無(wú)界矩陣最近以億級(jí)估值成功完成了超過(guò)千萬(wàn)元的天使輪融資,投資方為力合金融。
在科技領(lǐng)域,多模態(tài)模型的決策能力一直是研究的熱點(diǎn)。最近,UC伯克利等高校的研究團(tuán)隊(duì)提出了一種名為RL4VLM的全新強(qiáng)化學(xué)習(xí)框架,成功地提升了多模態(tài)大模型在決策任務(wù)上的表現(xiàn)。該模型在無(wú)需人類反饋的情況下,通過(guò)強(qiáng)化學(xué)習(xí)微調(diào),已經(jīng)學(xué)會(huì)了看圖玩撲克、算“12點(diǎn)”等任務(wù),并且其表現(xiàn)超越了GPT-4v。
在科技領(lǐng)域,類人機(jī)器人Ameca的最新進(jìn)化令人矚目。通過(guò)擁有視覺(jué)能力和多模態(tài)AI功能,Ameca不僅能夠觀察周圍環(huán)境,還能模擬人類的情感和反應(yīng)。這種進(jìn)化背后涉及了多領(lǐng)域技術(shù)的融合,包括語(yǔ)言模型、圖像生成和語(yǔ)音識(shí)別等。
2月28日,界面新聞從多個(gè)知情人士處獲悉,字節(jié)跳動(dòng)正在AI大模型領(lǐng)域秘密研發(fā)多個(gè)產(chǎn)品,其中包括多模態(tài)數(shù)字人產(chǎn)品以及AI生圖、AI生視頻產(chǎn)品等。
Adept Fuyu-Heavy是一種新型的多模態(tài)模型,專為數(shù)字代理設(shè)計(jì)。據(jù)稱,它是世界上第三大能力超強(qiáng)的多模態(tài)模型,僅次于GPT4-V和Gemini Ultra。
多模態(tài)大模型將是AI下一個(gè)爆點(diǎn)。最近,通義千問(wèn)VLM模型換新升級(jí),超大杯性能堪比GPT-4V。最最重要的是,還能限時(shí)免費(fèi)用。
最近一段時(shí)間,先是 OpenAI 推出 GPT-4V,讓大模型擁有了前所未有的圖像語(yǔ)義理解能力。
1月26日 消息:在最新的研究中,百度提出了一項(xiàng)名為UNIMO-G的統(tǒng)一圖像生成框架,旨在克服現(xiàn)有文本到圖像擴(kuò)散模型面臨的挑戰(zhàn)。傳統(tǒng)模型主要根據(jù)簡(jiǎn)潔的文本提示生成圖像,但文本描述的簡(jiǎn)潔性限制了生成復(fù)雜細(xì)節(jié)圖像的能力。
騰訊研究院發(fā)布了影響2024年的十大科技應(yīng)用趨勢(shì)。
近日,摩根大通推出了DocLLM,這是一種為多模態(tài)文檔理解而設(shè)計(jì)的生成式語(yǔ)言模型。DocLLM作為L(zhǎng)LM的輕量級(jí)擴(kuò)展,用于分析企業(yè)文檔,涵蓋了形式、發(fā)票、報(bào)告、合同等在文本和空間模態(tài)交匯處具有復(fù)雜語(yǔ)義的文檔。
企業(yè)成長(zhǎng)能力是隨著市場(chǎng)環(huán)境的變化,企業(yè)資產(chǎn)規(guī)模、盈利能力、市場(chǎng)占有率持續(xù)增長(zhǎng)的能力,反映了企業(yè)未來(lái)的發(fā)展前景。
海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過(guò)80萬(wàn)個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開(kāi)“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬(wàn)臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。