" />

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

  • 首頁 > 云計算頻道 > 大模型

    首個千億生物醫藥ChatGPT來了!清華AIR聶再清:這個行業未來的“Killer APP”

    2023年09月22日 17:19:00 來源:微信公眾號量子位

      本文來自于微信公眾號 量子位 (ID:QbitAI),作者:蕭蕭 。

      制藥行業的“專家版ChatGPT”,終于來了!

      就在這兩天,首個生物醫藥的千億參數大模型產品ChatDD發布,不僅制藥各階段知識“樣樣通”,還能和藥學專家進行對話,瞬間秒懂一些行業神秘“黑話”。

    圖片

      這和AlphaFold2直接加個Chat功能還不太一樣——

      現階段大模型雖然能在藥物發現上做得不錯,但要么只涉及單個模態,要么不具備直接對話能力。

      ChatDD則兼具多模態和對話雙重特點,順便還能給醫藥界學生“解個惑”。

      做出這個產品背后的水木分子,是今年6月新成立的一家公司。清華大學智能產業研究院院長張亞勤院士指出:

      ChatDD通過人機協作對話方式有效地將專家知識與大模型知識相聯結,開拓了繼傳統藥物研發TMDD、CADD、AIDD之后的第四代藥物研發新模式。

      所以,它究竟在什么功能上做到“劃時代”?

      我們和清華AIR教授、水木分子首席科學家聶再清聊了聊,詳細了解了ChatDD的來龍去脈。ChatDD是一個什么樣的產品?

      先來看看ChatDD能做哪些事兒,具體又能用在哪里。

      它的外觀和ChatGPT有點像,是一個網頁版,同樣能通過對話來實現各種功能。

      對話能力上,不僅英文總結不錯,中文對話也來得,直接hold住“疾病畫像”這樣的專業黑(術)話(語):

    圖片

      如果有看不懂的分子,可以直接一鍵上傳相關文件,讓它來負責解讀這種分子的作用:

    圖片

      試試更復雜一點的任務,例如計算親和力問題,大模型竟然直接“推薦”了一個工具,并快速計算出結果:

    圖片

      此外,也不用擔心問答內容超出ChatDD訓練數據截止日期,畢竟它還學會了自己聯網、或是從數據庫中查找答案。

    圖片

      總結來看,ChatDD雖然用法上像ChatGPT,但在生物醫藥這塊是“專業的”。

      無論是掌握的多模態(小分子+大分子+文本)醫藥專業知識量,還是對行業的理解程度、完成任務的能力,ChatDD都要比ChatGPT“更像個學醫藥的人”。

      與同行AI不同的是,ChatDD的“業務范圍”,涵蓋了制藥的前、中、后期三個階段。

      此前的醫藥行業AI,即使是大模型,往往也只能用于制藥的部分階段,例如前期的藥物發現,或是中期的臨床前研究。占研發成本大部頭的后期臨床試驗,幾乎無人問津。

      而ChatDD不僅能參與藥物發現、立項、商業智能(BI,Business Inteligence)、臨床試驗各環節,還能幫助提升成功率。

      聶再清介紹表示,ChatDD用于后期臨床試驗設計,也是大伙兒最期待的功能。

      首先,藥物在臨床試驗階段的通過率,往往并不高。

      尤其二期到三期臨床,通過率只有34%,三期到四期通過率也不高。但臨床試驗加上前中期的費用往往又極高,一旦不通過,就是幾億美元成本“打水漂”。

      其次,藥物通過率不高的原因,(除非藥物本身不行)很大程度上是因為沒找到適合“對癥下藥”的患者。

      藥廠通常會從臨床信息數據庫中,篩選適合用藥的病人。

      假設這個藥物對數據庫中5%的患者有效,那么從這5%的患者中挑選進行臨床試驗,肯定比剩下95%的患者有效率高。

      在綜合各方面信息做判斷這件事上,ChatDD往往比人類更適合篩選出“對癥下藥”的患者。

      聶再清特意舉了一個例子,來表明ChatDD的能力:

    圖片

      注意這里未來會是“私有化部署的合作伙伴的單細胞RNA測序數據”,現在因為沒有,所以我們用了水木分子收集到的公開數據計算出來的。

      這樣的ChatDD,背后功能究竟是怎么實現的? 醫學院博士后負責數據構建

      ChatDD背后的底座,取名ChatDD-FM,參數量達到千億級別。

      這次推出的ChatDD-FM-100B,是全球首個千億參數多模態生物醫藥對話大模型,其在C- Eval評測中達到全部醫學4項專業第一、也是唯一平均分超過90分的模型。

      聯想到團隊前不久發的BioMedGPT-10B,其自然語言模態的大模型同樣基于LLaMA2架構,這二者是否有什么聯系?

      聶再清表示,ChatDD-FM和BioMedGPT,在受眾和用途上都不太一樣,“有點像ChatGPT和GPT-3.5的區別,前者在對話和意圖對齊能力上有更大提升”。

      BioMedGPT主要用于科研領域,更擅長英文生物醫藥科研任務,適合直接拿來作為生物醫藥領域的相關科研任務的基礎模型。

      ChatDD-FM主要給國內醫藥行業“打輔助”,側重中文對話能力,融入了更多專家的對話模式和經驗。

      技術上,ChatDD-FM相比BioMedGPT,主要增強了三大方面,模態、訓練數據和參數量級——

      模態上,增加了蛋白質結構數據;訓練上,增加了用于中文、專家對話和調用工具能力的數據;參數量級上,從百億增加到千億。

      讓ChatDD-FM提升“專業度”、說話像“行內人”的秘訣,依舊在于高質量數據上。

      這些數據主要分為兩部分。

      第一部分,是預訓練用的醫藥知識數據,主要目的是讓ChatDD-FM提升專業素養,幾個月內掌握行業知識。

      由于之前業內缺少相關(大小分子等多個模態和自然語言對齊)數據集、尤其是中文數據,所以團隊又自己收集整理了一系列訓練數據集。

      首先,和廠商合作翻譯專業英文期刊、整理中文期刊,收集帶有中文專業名詞的大量數據,降低大模型沒見過的專業詞匯比率;

      然后,找來一批醫學院博士和博士后,設計一套系統對這些數據進行整理,直到它們可以被喂給大模型使用。

      聶再清強調,這些博士不是在做數據標注,畢竟相比有監督學習,自監督學習更重要的是清洗、查找數據的工作:

      這些期刊數據當然不是一個人一篇一篇地看,那絕對不行,也不是一個字一個字敲進去,也肯定不行。

      畢竟大模型最主要的能力還是來源于自監督學習,所以更多是讓他們進行數據清洗和查找的工作。

      當然,醫藥界期刊總是在更新,因此這部分的工作也會持續進行。

      第二部分,是“專家數據集”,專門用于提升ChatDD-FM的對話能力。

      ChatDD的用戶,會有不少醫藥領域的專業用戶,為了讓它能無縫讀懂業內人的“專言專語”,就必須要先了解專家們平時都會怎么說話。

      團隊為此找了一些專家,“觀察”他們平時是怎么提問的,根據這些問題整理了一套數據集,專門喂給ChatDD。

      這樣醫藥專業的用戶在使用時,不僅能像和同事聊天一樣直接提問,也能選擇“提示詞模板”直接換詞填充。

      此外,為了進一步增強模型解決實際醫藥任務的能力,團隊也接入了不少實用工具和開源算法,解決用戶遇到的問題,主要分為查詢和計算兩大類,如知識庫查詢工具、或靶點親和力計算工具。

      但,ChatDD-FM作為大模型,總歸繞不過幻覺這個問題。

      此前發布BioMedGPT時,聶再清就曾表示過不用害怕科研、藥物發現等階段的“幻覺”。現在發布商業版ChatDD-FM,是否還這么想?

      聶再清表示,現階段ChatDD-FM可以根據不同的需求,調整大模型出現幻覺的情況。

      例如在做商業智能的時候,就盡可能降低大模型的幻覺,做到每一句話都有來源可追溯;

      但在做藥物發現的時候,只要有實驗人員把關,都可以去適當提升幻覺,增加一部分模型想象力來“換換思路”,或許能試出有意思的結果。

      后期,ChatDD-FM理論上甚至能做到“一鍵更改回答出現幻覺的比率”。

    圖片

      “對制藥行業有劃時代意義”

      ChatDD背后的公司水木分子,目前已完成千萬級種子輪融資。

      水木分子自定義為“大模型時代的CRO公司”,即利用大模型或AI技術,幫助別人更好更快地制藥。

      公司的盈利方式目前有三種,包括ToB付費會員(按使用次數收費)、私有化部署和制藥分成。

      已經有制藥廠商找來合作了——復星醫藥計劃對ChatDD進行私有化部署,用于輔助藥物立項等階段。

      藥物立項,涉及大量資料查找和判斷,包括查找有無藥物相關(官能團、分子結構保護等)專利,還要根據大量文獻和實時市場信息等資料判斷是否值得立項。ChatDD能通過整合文獻和相關專利,生成一個完整的參考報告。

      ChatDD的出現,聶再清認為對于行業而言有跨時代意義:

      它真正將專家的經驗和直覺、以及大模型的“智力涌現”能力融會貫通了起來。

      此前,制藥行業經歷了三個階段,分別是TMDD(Traditional Manual Drug Design)、CADD(Computer-Aided Drug Design)和AIDD(AI Drug Design)。

      但無論是人工試驗,還是計算或AI輔助藥物研發設計,都需要大量人力去“學會如何使用”模型,尚未出現一個能和科研人員直接對話的系統。

      現在,ChatDD的出現真正改變了這一現狀。

      它不僅能將制藥的知識經驗集成到大模型中,通過提示詞就能激發調用出來,還能通過學習專家對話方法掌握專業溝通能力,“相當于把人和機器最powerful的地方做了個融合。”

    圖片

      不過,要完全實現ChatDD的全部潛能,真正進入比較成熟的階段,聶再清認為至少還有10年的黃金時代。

      一方面,對于生物醫藥行業來說,人類對于蛋白質、細胞、小分子之類的理解也還遠遠不夠,在這個學科方面仍然可以做出很多成績和進展;

      另一方面,對AI行業來說,無論是數據還是算法,也都還沒發展到足夠成熟的階段。

      數據上,目前生物醫藥領域內各模態和自然語言對齊的數據還很少。

      (就像圖文一樣,雖然文字和圖像各自的數據很多,但圖文對齊如VQA的數據卻相對要少很多)

      對此依舊需要不斷收集整理出PQA(蛋白質問答)、MQA(小分子問答)等模態的數據,來讓多模態大模型的效果變得更好。

      模型上,大模型目前的效果還不是最好的,無論是單模態還是多模態,都值得繼續去探索。

      所以,公司的下一步計劃,就是繼續優化模型、增加更多模態,并找到更多的場景落地需求。

      對于ChatDD最終形態的設想,聶再清表示:

      它會成為一個各模態(大小分子、蛋白質結構、DNA、單細胞等)和自然語言全部對齊的生物醫藥基礎大模型產品。

      他也在發布會上預言,這個產品會成為生物醫藥行業的大模型“Killer APP”。

      到那時候,才會真正打破醫藥界的“雙十定律”,高性價比的實現人機協作新藥研發。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    美洲天堂一区二卡三卡四卡视频| 日本不卡视频一二三区| 欧美电影一区二区| 欧美在线观看视频一区二区| 色婷婷av一区二区三区大白胸| 成人高清视频在线| av不卡免费电影| 色偷偷久久一区二区三区| 91在线看国产| 欧美性高清videossexo| 欧美少妇bbb| 欧美一级高清大全免费观看| 精品捆绑美女sm三区| 国产视频一区不卡| 亚洲欧美电影一区二区| 亚洲成av人片| 精品一区二区在线观看| 不卡的av中国片| 欧美丰满嫩嫩电影| 久久久高清一区二区三区| 亚洲图片欧美激情| 免费久久99精品国产| 不卡一区二区三区四区| 在线观看91精品国产麻豆| 国产偷国产偷精品高清尤物| 亚洲黄色小说网站| 久久精品国产精品青草| 粉嫩高潮美女一区二区三区 | 国产一区二区三区免费看| 国产高清精品在线| 91论坛在线播放| 精品噜噜噜噜久久久久久久久试看| 亚洲国产成人在线| 日韩国产精品91| 99久久伊人久久99| 日韩女优视频免费观看| 亚洲欧美日韩在线| 国产一区中文字幕| 欧美性受xxxx| 国产精品日产欧美久久久久| 日本中文一区二区三区| 波多野结衣中文一区| 欧美一区二区三区免费观看视频 | 亚洲猫色日本管| 精品一二三四区| 欧美三级乱人伦电影| 国产精品久久久久毛片软件| 麻豆国产精品官网| 欧美色老头old∨ideo| 国产日韩欧美精品在线| 免费av网站大全久久| 91久久久免费一区二区| 亚洲国产成人自拍| 国产乱人伦精品一区二区在线观看| 欧美日韩免费观看一区二区三区| 国产精品毛片久久久久久久| 精品无码三级在线观看视频| 在线电影国产精品| 亚洲超碰精品一区二区| 在线看国产一区| 亚洲天堂免费看| jlzzjlzz亚洲女人18| 国产丝袜美腿一区二区三区| 国产在线麻豆精品观看| 欧美一卡在线观看| 日韩成人伦理电影在线观看| 色综合久久88色综合天天 | 欧美精品一二三区| 亚洲午夜成aⅴ人片| 色老汉一区二区三区| 亚洲天堂免费看| 不卡av免费在线观看| 国产精品美日韩| av高清不卡在线| 成人欧美一区二区三区白人| 成人激情免费网站| 国产精品理论在线观看| 97久久久精品综合88久久| 国产精品国产精品国产专区不蜜| 成人性生交大片免费看视频在线 | 色久综合一二码| 中文字幕在线观看一区二区| 高清免费成人av| 亚洲欧美在线另类| 在线观看一区二区精品视频| 偷拍日韩校园综合在线| 日韩免费性生活视频播放| 国产伦精品一区二区三区免费迷 | 一区二区不卡在线播放 | 69精品人人人人| 日韩va亚洲va欧美va久久| 欧美一级免费观看| 国产一区二三区好的| 国产精品久久毛片av大全日韩| 91亚洲精品久久久蜜桃网站| 亚洲国产综合色| 精品少妇一区二区三区在线播放| 国产精品白丝jk黑袜喷水| 亚洲欧洲99久久| 制服.丝袜.亚洲.中文.综合| 国产综合色产在线精品| 亚洲欧美另类图片小说| 538在线一区二区精品国产| 国产精品一级在线| 亚洲综合另类小说| 2023国产一二三区日本精品2022| www.性欧美| 免费成人在线视频观看| 国产精品国产三级国产aⅴ入口 | 国产一区日韩二区欧美三区| 国产精品免费看片| 欧美精品色综合| 丰满亚洲少妇av| 偷窥少妇高潮呻吟av久久免费| 国产亚洲一区字幕| 欧美性xxxxx极品少妇| 国产精品自拍一区| 一区二区三区四区国产精品| 久久久亚洲国产美女国产盗摄| 在线免费观看不卡av| 国产成人一区二区精品非洲| 亚洲aⅴ怡春院| 亚洲欧洲日韩在线| 欧美精品一区二区高清在线观看| 91久久精品一区二区| 国产一区二区精品久久99| 亚洲午夜在线观看视频在线| 国产日韩欧美一区二区三区乱码| 欧美精品高清视频| 97精品久久久午夜一区二区三区 | 日韩亚洲欧美在线| 99久久综合国产精品| 久久99蜜桃精品| 亚洲国产欧美日韩另类综合| 国产精品进线69影院| 精品粉嫩超白一线天av| 欧美猛男超大videosgay| zzijzzij亚洲日本少妇熟睡| 韩国三级在线一区| 日韩国产精品久久久久久亚洲| 亚洲精品成人a在线观看| 国产精品丝袜久久久久久app| 精品少妇一区二区三区在线视频| 欧美日韩国产免费一区二区| 91美女在线视频| av亚洲精华国产精华精| 成人在线一区二区三区| 国产精品资源站在线| 激情综合色播激情啊| 美女被吸乳得到大胸91| 男男视频亚洲欧美| 日产国产高清一区二区三区 | 日韩毛片精品高清免费| 日本一区二区动态图| 国产日韩欧美电影| 久久久国产精品麻豆| 久久综合国产精品| 久久久久国产一区二区三区四区 | 午夜伦理一区二区| 亚洲成人黄色小说| 亚洲国产综合在线| 亚洲午夜在线电影| 亚州成人在线电影| 日韩一区精品视频| 蜜臀精品一区二区三区在线观看 | 国产精品中文字幕欧美| 国产一区二区三区四| 国产一区二区电影| 成人性生交大片免费看中文网站| 成人精品小蝌蚪| 91美女片黄在线观看91美女| 91国产免费观看| 91麻豆精品久久久久蜜臀| 欧美一级精品大片| 久久综合狠狠综合| 亚洲成a人v欧美综合天堂下载 | 午夜精品久久久久久| 国产精品自拍三区| 精品写真视频在线观看| 国产一区二区三区四| 福利一区福利二区| 日本高清不卡一区| 337p亚洲精品色噜噜| 精品精品国产高清a毛片牛牛| 国产视频一区二区三区在线观看| 国产精品久久国产精麻豆99网站| 亚洲欧美一区二区三区极速播放| 亚洲伊人伊色伊影伊综合网| 蜜桃视频第一区免费观看| 国产激情视频一区二区在线观看 | 精品视频全国免费看| 91精品欧美福利在线观看 | 日欧美一区二区| 国产成人丝袜美腿| 欧美在线观看一区二区| 26uuu欧美| 亚洲一区二区黄色| 国产精品一区二区久久不卡 | 亚洲人午夜精品天堂一二香蕉| 亚洲综合男人的天堂|