借助創新的視覺分辨率路由(ViR)與解耦部署框架(DvD),38B模型在896分辨率下的響應速度大幅提升,單次推理延遲由369ms縮短至91ms(提升約4倍)。與此同時,輕量化的InternVL3.5-Flash在將視覺序列長度減少50%的情況下,仍能保持接近100%的性能水平。
InternVL3.5還加強了GUI智能體、具身智能體、SVG圖形理解與生成等智能體核心能力,在ScreenSpot GUI定位(92.9分)、VSI-Bench空間推理(69.5分)、SGP-Bench矢量圖理解(70.6分)等任務中超越主流開源模型。
InternVL3.5提供10億至2410億參數共九種尺寸模型,覆蓋不同資源需求場景,包含稠密模型和專家混合模型(MoE),是首個支持GPT-OSS語言模型基座的開源多模態大模型。官方提供了使用`transformers`運行`InternVL3.5-8B`的示例代碼,模型最多可以部署在單張A100GPU上,而38B模型需要2張A100GPU,235B模型則需要8張A100GPU。
ms-swift已經支持對InternVL3.5系列模型進行訓練。ms-swift是魔搭社區官方提供的大模型與多模態大模型訓練部署框架。用戶可以將數據準備成特定格式進行自定義數據集微調。訓練完成后,可以使用相應命令進行推理,并將模型推送到ModelScope。
InternVL3.5的發布標志著多模態大模型技術的又一重要進展,為研究人員和開發者提供了強大的工具,推動了多模態人工智能的發展。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。