近年來,基于大語言模型(LLM)的多模態任務處理能力取得了顯著進展,特別是在將視覺信息融入語言模型方面。
據外媒Bleeping Computer報道,OpenAI正在為GPT-4o圖像生成模型測試水印功能。
今天凌晨,OpenAI聯合創始人兼首席執行官Sam Altman發布在線急購GPU的消息:如果有人能提供10萬單位的GPU資源并能盡快交付,請馬上聯系我們!
今天凌晨,微軟研究院開源了目前最強小參數模型——phi-4。
在2025年CES消費電子展上,閃極正式推出其全新海外品牌loomos,并發布了搭載GPT-4o語音助手的AI眼鏡。
VITA-MLLM團隊最近推出了VITA-1.5,這是對VITA-1.0的重大升級,旨在提升多模態交互的實時性和準確性。
近期的研究表明,市場上最先進的 AI 聊天機器人竟然對一些簡單的技巧十分敏感,甚至可以被輕易 “越獄”。
微軟下一代14B小模型Phi-4出世了!僅用了40%合成數據,在數學性能上擊敗了GPT-4o,最新36頁技術報告出爐。
多模態大模型在聽覺上,居然也出現了「9.11>9.8」的現象,音量大小這種簡單問題都識別不了!港中文、斯坦福等大學聯合發布的AV-Odyssey基準測試,包含26個視聽任務,覆蓋了7種聲音屬性,跨越了10個不同領域,確保測試的深度和廣度。
近日,上海 AI 實驗室宣布推出書生·萬象InternVL2.5模型。
微軟于 11 月 26 日發布博文,宣布在其 LlamaParse 中集成 Azure OpenAI 端點,利用 GPT-4o 系列模型,增強提取非結構化數據和解析多模態文檔,并無縫銜接 Azure AI Search 向量數據庫,構建完整的檢索增強生成(RAG)工作流程。
OpenAI 宣布對其旗艦模型 GPT-4o 進行了重大升級,提升了推理、跨媒體和對話能力。
以全面提升的創意寫作、技術支持和文件處理能力,再次奪回 Chatbot Arena 的榜首寶座。
今天凌晨,法國著名開源大模型平臺Mistral.ai,開源了超大多模態模型——Pixtral Large。
最近,一項由 OpenAI 進行的研究顯示,盡管人工智能技術飛速發展,當前最先進的語言模型在回答事實問題時的成功率卻遠低于預期。
實時語音通話早已不是什么新奇功能了,ChatGPT、智譜清言、字節豆包、百度文小言、訊飛星火等海內外友商陸續發布,只不過效果各有千秋。
全球AI領導者英偉達(Nvidia)開源了超強大模型——Llama-3.1-Nemotron-70B-Instruct。
最新版本的ChatGPT GPT-4o正在進行灰度發布,可能會更名為GPT-auto。新版本的UI界面設計有了大改進,更簡潔現代化。
今天凌晨,阿里巴巴官宣了史上最大規模的開源發布,推出了基礎模型Qwen2.5、專用于編碼Qwen2.5-Coder和數學的Qwen2.5-Math。
今年8月19日,科大訊飛發布了星火極速超擬人交互技術,在響應和打斷速度、情緒感知情感共鳴、語音可控表達、人設扮演四個方面實現巨大突破。這項技術將于今年8月底在訊飛星火App上全民開放使用,普通用戶也能親自感知。
Gemini Live是谷歌推出的一款生成式AI助手,提供了更高度的便捷性和人性化互動體驗。
Transformer大模型尺寸變化,正在重走CNN的老路!
OpenAI宣布開始向小部分ChatGPT Plus用戶,測試GPT-4o的高級語音模式。
OpenAI宣布從今天開始到9月23日,免費為4級、5級用戶提供GPT-4o mini微調服務,幫助開發者打造特定業務用例的生成式AI應用。
據機器之心報道,剛剛,OpenAI 突然宣布了「Mini」版本的 GPT-4o 模型。該公司表示,新的輕量級版本旨在讓更多公司和項目能夠獲得最先進的技術。
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。