
第一部分:市場需求
性能問題是各大金融企業的“難言之隱”,家家都有這本難念的經!!
在以數據化運營為基礎的金融行業,結構化的數據動輒上億,甚至幾十億、上百億,然而客戶沿用的傳統關系數據庫以及報表軟件越來越不能滿足及時性數據分析需求。雖然Self-service(自助BI)被賦予了歷史使命——讓業務人員自己完成統計分析,但也同樣難以解決效率的難題,從來沒有得到相對理想的解決(低成本、高性能)!
第二部分:必要性
沒有高性能作為前提,自助式BI只能是“看上去很美”!
自助式BI近2年來逐漸興起,越來越多的客戶希望靠自助式BI控制IT人員成本,同時提高數據分析的效率。可是這看上去很美好的解決方案,卻一直遭受著源于性能的疑慮,無論數據平臺的建設方案是數千萬的老牌MPP數據倉庫,還是數百萬的Hadoop集群。
我們(Smartbi)一直努力提供給客戶高性能的數據分析解決方案,終于在7月份與Vertica的戰略合作后,結出了令人激動的碩果——Smartbi Insight V7.1高性能版。從這個版本開始,Smartbi的自助分析服務將邁入秒級階段,讓業務人員的數據分析更高效,讓科技人員不再為性能調優而苦惱!
第三部分:事實證明
超越想象,普通筆記本分析億級數據只要幾秒鐘!
Smartbi只做最真實的測試,用事實來證明V7.1的高性能,這將是你難得一見的時刻。

如圖所示,我們測試的電腦是一臺2013年的thinkpad筆記本,售價不到6000,用魯大師檢測硬件配置如下:

而用于測試的數據包括1份數據2個模型——星型和寬表,其中星型包括產品、客戶、地理三個維度,事實表0.98億條記錄,維度表數百條記錄。做過性能測試的朋友一看就知道,這樣一個星型模型,如果交給業務人員自己拖拽分析數據,性能是很有問題的,數據庫配置不好的情況下還能直接跑死系統,更別說是一臺這么普通的一臺筆記本電腦了!

接下來,我們基于這個數據模型,考慮到自助分析的場景,構建了三大類22個測試案例,以確保客觀合理的測試案例覆蓋度。比如用戶會以年為條件,進行同期增長率的計算等等。
交代好性能測試的基本情況,我們不兜圈,直接來看測試結果:

簡言之,星型模型因為要進行關聯操作,平均響應時間為13.3秒(6.7秒——17.1秒),寬表模型沒有關聯操作,平均響應時間為4.5秒(2.7秒——6.3秒),總體平均為9秒!是的,你沒看錯,無論怎樣拖拽的自助分析,平均9秒!!測試結果后,我們和你一樣感到興奮,Smartbi Insight V7.1居然可以在一臺幾年前的普通筆記本電腦上對1億大數據量的自助探索在區區幾秒完成分析查詢!!
第四部分:性能總結
如果你還對這個測試結果有一絲絲疑慮,是不是這臺電腦的配置作弊了,是不是數據庫做特別優化了!別擔心,我們很嚴謹的找了3臺公司筆記本電腦進行了更多性能測試,都使用的默認安裝(數據庫還是在虛擬機里運行的)。所以,我們可以很負責任的大聲說:筆記本探索億級數據分析,確實可以做到!!
大數據時代,得性能者得天下,尤其是提供自助分析功能的BI工具,數據分析的響應速度一定要能跟上業務人員的思維。Smartbi順勢而為,希望能為大數據分析行業貢獻新的起點,創造新的價值!
如果你對大數據分析的性能感興趣,愿意加入我們一起進行測試、調優和研討,請關注我們的公眾號或者官網,后續的活動等著你!當然我們也不怕挑戰,Come on!
2017年9月 秋分 Smartbi老麥
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。