首次參與打榜,Grok取得第一名,MiroMind為開源模型的第一。馬斯克為此興奮發文,稱之為最好的benchmark

  FutureX與Prophet Arena:AI智能體未來預測基準的誕生

  不久前,字節跳動 SEED 團隊聯合斯坦福大學、復旦大學、普林斯頓大學共同推出Future X,是全球首個動態實時 LLM 智能體未來預測基準。它從全球200多個高質量網站精選只有下周才會有明確結果的問題,讓AI直面正的未來事件:股票價格的漲跌、體育比賽的勝負、政治選舉的結果、科技公司的戰略走向等。

  這種評估方式的核心優勢非常顯著。AI 必須像人類分析師一樣,基于當前可獲得的信息,運用邏輯推理、趨勢分析和概率計算來做出預測。這一機制極大地推動了 AI 智能體在真實世界復雜場景中的實用能力提升,也成為衡量智能體系統核心智能水平的重要標桿。

  Prophet Arena則是另一個AI預測能力評估平臺,通過實時收集和分析真實世界事件,考察AI模型在不確定性推理、信息整合和概率預測等方面的表現。

  MiroMind如何成功預測未來

  MiroMind 在 FutureX 榜單上表現驚艷。8 月第 3 周,首次參與即獲得第六名的成績。而在 9 月的提交中,更實現了雙重突破:搭載 GPT-5 的 MiroFlow 智能體框架在第 1 周和第 2 周連續奪得榜首,同時搭載自研模型 MiroThinker 的 MiroFlow 均位列前五,力壓眾多國際頂尖機構和閉源商業模型。

1758520209545027.jpg

  在測試中,MiroMind 成功預測了 2025 年 9 月 9 日ATP 男子單打排名第 4-6 位的選手,其難點在于網球排名系統極為復雜,涉及積分計算、比賽結果、時間窗口等多個變量。

  MiroMind 的模型在預測中制定了五步策略:

  1. 制定詳細預測計劃:模型首先展現了戰略規劃能力,制定了系統性的預測方案。

  2. 獲取基礎數據:通過網絡檢索獲取 9 月 1 日的男子網球 TOP 10 排名數據,建立預測基準線。

  3. 理解積分規則:深入研究比賽排名與積分的對應關系,特別對比了 2024 年與 2025 年的 dropping 規則,確保計算一致性。

  4. 動態信息更新:搜索 9 月 1 日之后的比賽成績,并分類處理:對已有結果的比賽,直接更新對應選手排名;對尚未結束的比賽,識別其可能影響。

  5. 概率分析與綜合判斷:多情景分析,針對尚未出結果的比賽,模型分析了6種可能情況;引入博彩網站概率數據,作為外部驗證基準;最終基于 outcome 和 probability 加權計算,得出最可能排名結果。

  MiroMind 還成功預測了 2025 年 9 月 11 日 數字加密貨幣 Solana 將突破的一系列關鍵價格檔位,體現了模型在處理價格波動類問題上的系統建模能力與風險控制水平。這輪預測中,MiroMind 則是制定了六步策略:

  1. 構建市場基準線:聚合 CoinGecko、Coinbase、Binance、Kraken 等多平臺實時數據,明確 Solana 當前價格區間及近期價格走勢,建立精準預測起點;

  2. 量化短期波動空間:基于歷史數據計算年化波動率、平均日內振幅等關鍵指標,評估 Solana 在一天內可能達到的價格區間,判斷各檔位的突破概率;

  3. 梳理外部影響因素:系統檢索 9 月 10 日的宏觀經濟事件(如美國 PPI 發布)、Solana 鏈上動態和潛在生態活動,評估是否存在可能引發劇烈波動的催化因素;

  4. 分析市場情緒信號:提取 OKX、Kraken 等平臺的永續合約資金費率與基差數據,判斷市場是否存在明顯的多空傾斜,作為重要情緒指標參考;

  5. 挑選穩健價格檔位:結合價格分布、風險容差與市場結構,挑選那些在大多數行情路徑下都有可能成立的價格檔位,避開臨界邊緣值,確保預測結果穩健可靠;

  6. 交叉驗證與最終判斷:對比統計結果、衍生品信號與第三方市場預期,最終確定最優預測選項,兼顧穩健性與覆蓋率。

  MiroMind 的登頂并非偶然,而是基于AI預測未來的幾項核心能力:

  · 信息洞察力:能快速抓取、理解和整合海量數據——從股市行情到新聞動態,再到社交輿情。沒有全面信息,預測就是空想。

  · 邏輯推理與趨勢感知:能發現模式、識別因果、判斷趨勢。未來不是憑直覺,而是建立在嚴密邏輯和數據分析之上。

  · 概率與不確定性管理:能量化可能性、權衡風險,在不確定環境下做出最優判斷。未來充滿變數,聰明的預測是概率化的決策。

  · 跨領域整合能力:能把金融、政治、科技、社會等多領域信息融會貫通。未來事件往往是多因素交織,單一視角難以洞察全局。

  建設最好預測大模型和創新者平臺

  MiroFlow 框架在 GAIA-Validation 上也取得了 82.4% 的優異成績,并在 HLE、BrowseComp 以及 xBench-DeepSearch 等基準測試中領先眾多國際對手。更值得關注的是,MiroFlow 提供了完全開源、可復現的框架和配置,致力于建設一個創新者平臺。這個平臺為研究者和開發者提供從基礎框架、模型到工具鏈的完整支持,使大家能夠自由實驗、快速迭代,并在多 Agent 協作、多模態理解等前沿領域進行探索。

1758520126919740.png

  MiroFlow 框架之外,MiroMind 團隊推出的自研旗艦基礎智能體模型(Agent Foundation Model)——MiroThinker,不僅具備強大的推理、決策和多模態理解能力,還能在多 Agent 協作中發揮核心作用,在各類榜單中已成為開源模型的引領者,并不斷縮小與閉源商業模型的差距。MiroThinker 很快將以完全開源的形式向全球開發者和研究者開放,提供可復現的模型和實驗環境。

  陳天橋:持續投入,誠邀全球AI人才

  從盛大,到天橋腦科學研究院,再到All in AI,陳天橋四分之一個世紀以來持續探索人類未來科技的邊界:

  · 虛擬世界的創造者,1999年創辦盛大,開創了中國網絡游戲與網絡文學行業。

  · 人類大腦的探索者,2016年創辦全球最大的私人腦科學機構天橋腦科學研究院,在腦機接口等基礎、前沿研究領域碩果累累。

  · 未來世界的塑造者,開展AI+長期記憶、AI預測未來等全新前沿探索。目前MiroMind 正在探索將長期記憶模塊深度嵌入模型,在復雜、多變的環境中做出更精準可靠的預測,實現真正的時間維度智能。

  陳天橋說:“我們正在全力打造一個全球最好的預測大模型,讓AI記住過去,洞察未來。我們持續歡迎全球志同道合的AI優秀人才加入,共同創造未來。”

中文科技資訊微信二維碼logo

  文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

海報生成中...

[No.X026]
瀏覽

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

新聞

市場占比高達35.8%,阿里云引領中國AI云增長

9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
成人性色生活片免费看爆迷你毛片| 国产成人精品三级麻豆| 欧美电影免费观看高清完整版在线 | 亚洲免费观看高清完整| 国产精品网站在线观看| 亚洲国产成人私人影院tom | 天天爽夜夜爽夜夜爽精品视频 | 粉嫩av一区二区三区粉嫩| 成人性生交大合| 色94色欧美sute亚洲线路二 | 久久久久国产免费免费 | 成人免费视频播放| www..com久久爱| 91捆绑美女网站| 欧美群妇大交群中文字幕| 日韩欧美一级在线播放| 久久免费午夜影院| 中文字幕亚洲欧美在线不卡| 亚洲久本草在线中文字幕| 夜夜爽夜夜爽精品视频| 日本最新不卡在线| 国产精品2024| 在线观看视频91| 精品三级在线观看| 1000部国产精品成人观看| 亚洲成人动漫在线免费观看| 久久99精品久久只有精品| 国产99精品视频| 欧美三级在线播放| 欧美精品一区男女天堂| 综合欧美亚洲日本| 久久狠狠亚洲综合| 色婷婷av一区| 久久久精品黄色| 一区二区三区资源| 国产一区二区伦理| 欧美三级欧美一级| 中文字幕不卡在线播放| 婷婷久久综合九色综合绿巨人| 精品一区二区三区免费观看| 一道本成人在线| 久久久www成人免费毛片麻豆| 亚洲美腿欧美偷拍| 国产精品资源在线看| 91久久一区二区| 国产色产综合产在线视频| 亚洲高清免费视频| 99在线视频精品| 日韩欧美亚洲国产另类| 亚洲免费在线视频| 国产福利一区二区三区视频| 欧美色图12p| 1024国产精品| 国产精品一区二区不卡| 日韩美女视频一区二区在线观看| 一二三四区精品视频| 午夜免费久久看| 欧美午夜免费电影| 一区二区三区在线影院| 99国产精品久久久久| 久久久久久亚洲综合影院红桃| 日日噜噜夜夜狠狠视频欧美人| 91久久精品一区二区三区| 国产精品久久久久桃色tv| 国产精品69毛片高清亚洲| 91精品福利在线一区二区三区 | 久久先锋资源网| 视频一区在线播放| 欧美日韩精品二区第二页| 一区二区三区中文在线| 成人性生交大片免费| 国产亚洲婷婷免费| 国产精品99久久久久久似苏梦涵 | 99re热视频这里只精品| 久久久久久久综合| 国内精品嫩模私拍在线| 精品日产卡一卡二卡麻豆| 久久电影国产免费久久电影 | 亚洲一区二区精品3399| 色综合久久综合| 亚洲一区视频在线| 在线观看国产91| 午夜私人影院久久久久| 欧美巨大另类极品videosbest| 亚洲v日本v欧美v久久精品| 欧美网站大全在线观看| 视频一区视频二区在线观看| 91精品国产综合久久久久| 麻豆精品久久精品色综合| 精品福利一区二区三区免费视频| 国产精品一区二区久久不卡| 欧美国产日韩一二三区| 91蜜桃婷婷狠狠久久综合9色| 亚洲精品国产无天堂网2021| 欧美体内she精高潮| 日韩av电影免费观看高清完整版| 日韩欧美美女一区二区三区| 国产精品一二三四| 亚洲精品免费电影| 日韩一区二区在线看片| 粉嫩av亚洲一区二区图片| 亚洲欧洲美洲综合色网| 欧美唯美清纯偷拍| 精品一二三四区| 亚洲色大成网站www久久九九| 欧美日韩精品欧美日韩精品 | 91碰在线视频| 日韩精品一卡二卡三卡四卡无卡| 欧美精品一区二| 91蝌蚪porny九色| 蜜桃精品视频在线| 1区2区3区欧美| 欧美本精品男人aⅴ天堂| 成人精品电影在线观看| 五月天亚洲精品| 国产欧美日韩中文久久| 欧美日韩国产免费一区二区| 国产一区二区视频在线播放| 一区二区三区自拍| 2020国产成人综合网| 在线观看免费亚洲| 国产黄色精品网站| 欧美大片日本大片免费观看| 91视频.com| 国产色综合久久| 99re视频这里只有精品| 亚洲精品中文字幕乱码三区 | 亚洲一卡二卡三卡四卡| 欧美精品99久久久**| 成人在线综合网| 琪琪久久久久日韩精品| 亚洲精品免费电影| 国产欧美一区二区三区沐欲| 欧美日韩另类国产亚洲欧美一级| 国产麻豆成人传媒免费观看| 一区二区三区av电影| 亚洲国产精品t66y| 精品免费视频.| 91精品国产综合久久精品app | 99国产精品久| 精东粉嫩av免费一区二区三区| 亚洲伦理在线免费看| 国产精品视频看| 欧美精品一区二区在线播放| 欧美日韩亚洲综合一区| 成人精品在线视频观看| 国产自产高清不卡| 奇米一区二区三区| 日本美女一区二区三区视频| 一区二区三区日韩欧美| 亚洲视频在线观看一区| 中文字幕精品在线不卡| 久久久一区二区三区捆绑**| 欧美xxxxx裸体时装秀| 91精品国产综合久久精品图片| 欧美视频完全免费看| 日本韩国欧美国产| 97se亚洲国产综合自在线不卡| 国产精品一区不卡| 国产大陆a不卡| 成人少妇影院yyyy| 成人免费高清视频在线观看| 成人免费毛片app| aaa欧美色吧激情视频| 99热这里都是精品| 日本韩国精品在线| 欧美日韩国产综合视频在线观看| 欧美日韩视频一区二区| 欧美久久一区二区| 欧美变态tickling挠脚心| 久久婷婷国产综合精品青草| 国产欧美一区二区精品性| 国产精品久久一卡二卡| 亚洲免费观看视频| 午夜精品一区在线观看| 蜜桃av噜噜一区二区三区小说| 蜜臀99久久精品久久久久久软件| 蜜桃一区二区三区四区| 国产一区美女在线| 成人的网站免费观看| 一本在线高清不卡dvd| 欧美美女直播网站| 日韩精品一区二区三区中文不卡| 久久这里只有精品6| 亚洲欧洲www| 日韩激情一区二区| 国模套图日韩精品一区二区| 成人三级伦理片| 欧美性受极品xxxx喷水| 日韩免费在线观看| 国产精品色哟哟| 亚洲va天堂va国产va久| 国产在线不卡一卡二卡三卡四卡| 成人av电影观看| 欧美剧情电影在线观看完整版免费励志电影| 91精品久久久久久蜜臀| 国产精品欧美久久久久一区二区| 亚洲精品va在线观看| 久久精品二区亚洲w码| 99r国产精品|