著名大模型開源平臺Stability AI,開源了超強文生圖模型——Stable Diffusion3.5。
Stable Diffusion3.5一共有Large、Large Turbo和Medium三個版本,可根據不同的商業環境提供高度定制功能,同時對這些模型進行了大幅度優化可在消費級GPU就能輕松推理運行。
今年6月Stability AI首次開源了Stable Diffusion3Medium,但效果未達到預期,在聽取了社區用戶的反饋后,Stability AI花費大量時間進一步開發,便有了最新的3.5版本。
Large、Turbo、Medium簡單介紹
在這次發布中,Stable Diffusion3.5提供了多種模型,以滿足不同用戶群體的需求。Stable Diffusion3.5Large模型擁有80億參數,提供了卓越的圖片質量和高度文本語義還原,是Stable Diffusion家族中最強大的模型,非常適合專業使用,尤其是在100萬像素分辨率的圖片。
而Stable Diffusion3.5Large Turbo模型則是一個蒸餾版本,它能夠在僅僅4步之內生成高質量的圖像,并且對提示的遵循性非常好,速度比Stable Diffusion3.5Large快得多。
Stable Diffusion3.5Medium模型將在10月29日發布,這個模型有25億參數,采用了改進的MMDiT-X架構和訓練方法,能在消費級硬件上即開即用,可生成0.25—200萬像素之間生成圖像,兼顧了質量和易定制性。
在開發這些模型的過程中,Stability AI優先考慮了可定制性,提供了一個靈活的基礎來構建。
將Query-Key歸一化集成到了變換器塊中,這不僅穩定了模型訓練過程,還簡化了進一步的微調和開發。
為了支持這種下游的靈活性,Stability AI不得不做出一些權衡,例如,同一個提示使用不同種子可能會產生更大的輸出變化,這是有意為之的,以幫助在基礎模型中保留更廣泛的知識庫和多樣化的風格。
此外,Stable Diffusion3.5在可定制性、高效的性能以及多樣化的輸出方面表現出色,使其成為市場上最可定制和最易訪問的文生圖像模型之一,同時在提示遵循性和圖像質量方面保持了頂級性能。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。