2025 年 4 月 19 日,由酷克數據與中啟乘數聯合舉辦的 Apache Cloudberry? (Incubating) Meetup · 杭州站在浙江省杭州市濱江區濱江會展中心成功舉辦。本次活動邀請了 Cloudberry PPMC 團隊成員、活躍內核貢獻者以及中興 EBASE-A、阿里云 ADB-PG、網易、中啟乘數等多家團隊的頂尖技術專家,共同探討 Cloudberry / Greenplum 內核前沿進展、一線生產實踐和周邊生態工具。活動現場氣氛熱烈,干貨滿滿,為社區開發者與用戶搭建了自由交流的平臺,吸引線上線下近千名開發者與用戶參與。
讓我們一起回顧整場活動的議題干貨吧!
Apache Cloudberry 簡介與路線圖展望
演講嘉賓:楊瑜(Cloudberry PPMC 成員,酷克數據研發 VP,前 Greenplum 全球研發總監)
活動伊始,酷克數據研發 VP、Apache Cloudberry PPMC 成員楊瑜從項目背景、技術架構到未來規劃,全面解讀了 Apache Cloudberry 的發展藍圖。作為基于 Greenplum 和 PostgreSQL 的開源 MPP 數據庫,Cloudberry 旨在通過開源模式將企業級優化成果回饋社區,解決閉源帶來的不確定性。目前 Cloudberry 已正式進入 Apache 孵化器進行孵化,經過社區的充分討論,已形成項目發展路線圖;同時,社區正在準備推出第一個 Apache Release —— Cloudberry 2.0。未來,Cloudberry 將聚焦內核升級、執行引擎優化及社區合作,攜手開發者共建開源生態。
酷克數據HashData
Apache Cloudberry 向量化實踐:向量數據重分布性能優化
演講嘉賓:趙熙(Cloudberry 貢獻者,內核研發工程師)
酷克數據內核研發工程師、Apache Cloudberry 貢獻者趙熙聚焦向量化技術在Join+Motion數據重分布中的性能瓶頸,分享了Cloudberry從系統性能分析到優化落地的完整實踐。通過Gandiva表達式優化與分組算法重構,顯著降低CPU負載,512節點下耗時從2004ms降至180ms,提速11倍。結合內存布局優化與性能分析工具,有效提升向量化 Join+Motion 吞吐,為大規模查詢提供高效支撐。這一分享為內核開發者提供了可落地的優化范式。
酷克數據HashData,贊1
EBASE-A 實時流式入庫實現機制及應用實踐
演講嘉賓:柏楠(中興 EBASE-A 團隊工程師)
中興 EBASE-A 團隊工程師柏楠介紹了 EBASE-A 的實時流式入庫架構及核心技術。作為支持多寫多讀、湖倉一體的 OLAP 數據庫,EBASE-A 依托自研向量化引擎與存算分離架構實現 PB級分析。其 APFlow 組件通過零拷貝技術將吞吐推至磁盤極限,結合性能為 Flink 兩倍的 Saturn 流引擎替代 JStorm 架構,資源消耗降低 50%,入庫效率提升 30%,有效支撐通信行業實時數據處理。
酷克數據HashData,贊1
Data+AI 時代下的數據處理分析架構與技術演進
演講嘉賓:印才華(阿里云資深技術專家)
阿里云 ADB-PG 技術負責人、阿里云資深技術專家印才華分享了企業在 Data + AI 背景下的數據分析架構演進,特別介紹了基于 Greenplum 構建的阿里云 ADB-PG 云數倉在高性能實時數倉、向量化,以及 In-Database AI 方面的探索洞察與行業用戶融合實踐。
酷克數據HashData
Greenplum/Cloudberry 第三方管控平臺 APCC 詳解
演講嘉賓:唐成(中啟乘數科技 CTO)
中啟乘數 CTO 唐成分享第三方可視化管控平臺 APCC 的設計理念與實踐路徑。APCC 平臺支持多版本、跨平臺部署,提供可視化集群管理、一鍵擴容、慢 SQL 優化等豐富能力,旨在通過“自動化 + 圖形化”的方式大幅降低 Greenplum 及 Cloudberry 運維門檻,實現高效、智能的數據庫運維。
酷克數據HashData
Apache SeaTunnel 架構解析與 Cloudberry 集成實踐
演講嘉賓:陳虹宇 (Apache SeaTunnel 貢獻者,網易數據集成研發工程師)
最后,網易數據集成研發工程師、Apache SeaTunnel 貢獻者陳虹宇詳細介紹了 SeaTunnel 的核心架構及其與 Cloudberry 的集成方案。Apache SeaTunnel 是一個易用的支持海量數據同步的超高性能分布式數據集成平臺;SeaTunnel 中的 Cloudberry 連接器基于標準 JDBC 構建,繼承了 PostgreSQL 連接器的所有核心邏輯。通過簡單命令,即可實現 Cloudberry 數據庫的讀寫操作,無需復雜配置,使得數據流轉更加輕松高效。未來,計劃引入基于 gpfdist 協議和外部表機制的全新連接器,充分利用 Cloudberry 的并行計算能力,持續提升大規模數據遷移傳輸的性能表現。
酷克數據HashData
本次 Meetup 匯聚了來自社區與企業的一線技術力量,分享內容兼具深度與實戰價值,涵蓋數據庫內核、數據集成、運維、AI 融合等多個關鍵方向,為開發者與用戶搭建了高質量的技術交流平臺。
特別感謝中啟乘數對本次活動的全程支持與協作,也感謝每一位演講嘉賓與參會者的積極投入,感謝 Apache SeaTunnel 等眾多社區合作伙伴的支持!歡迎更多開發者、用戶與企業伙伴加入 Apache Cloudberry 社區,共同打造開源時代的分布式數據基礎設施!