谷歌昨日在發(fā)布 Gemini 2.0 的同時,還發(fā)布了全新的多模態(tài)直播(Multimodal Live)API,幫助開發(fā)人員開發(fā)具有實時音頻和視頻流功能的應(yīng)用程序。
該 API 實現(xiàn)了低延遲、雙向的文本、音頻和視頻交互,以音頻和文本形式輸出,帶來更自然流暢、如同人類對話般的交互體驗。用戶可以隨時打斷模型,并通過共享攝像頭輸入或屏幕錄像與其進(jìn)行互動,就內(nèi)容提問。
該模型的視頻理解功能擴展了通信模式,用戶能夠使用攝像頭實時拍攝或共享桌面并提出相關(guān)問題。該 API 已經(jīng)向開發(fā)者開放,同時也向用戶提供了一個多模態(tài)實時助手的演示應(yīng)用。
該 API 支持集成多種工具,開發(fā)者只需一次 API 調(diào)用,即可完成復(fù)雜的用例。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。