面試題:如何用Flink實時計算QPS

Flink 實時計算 QPS 面試題

題目:
假設某互聯網應用日活用戶 100 萬,每天產生 1 億條數據(日志/事件),要求使用?Apache Flink?實現實時計算系統的?QPS(Queries Per Second),并考慮以下需求:

  1. 實時統計當前 QPS(每秒請求數),并輸出到監控系統(如 Prometheus、Kafka、MySQL 等)。

  2. 處理數據傾斜,某些 key(如熱門用戶或接口)可能產生大量數據,如何優化?

  3. 保證 Exactly-Once 語義,確保 QPS 計算不丟不重。

  4. 應對高峰流量,假設瞬時 QPS 可能達到 10,000,如何保證 Flink 作業的穩定性和低延遲?

問題:

  1. 請設計 Flink 作業的數據流(Source → Transformation → Sink),并說明關鍵算子(如?windowkeyByaggregate)的作用。

  2. 如何實現 QPS 的滑動窗口(如每 1s 計算一次最近 10s 的 QPS)?

  3. 如果某些 key 的數據量遠高于其他 key(數據傾斜),你會如何優化?

  4. 如何保證 Exactly-Once 語義?請結合 Checkpoint 和 StateBackend 說明。

  5. 如果 QPS 突增導致反壓(Backpressure),你會如何調整 Flink 作業配置?


考察點

??Flink 核心概念:Window、KeyedStream、State、Checkpoint
??性能優化:數據傾斜處理、反壓調優
??容錯機制:Exactly-Once 實現方式
??生產經驗:監控、Sink 適配、資源分配


參考答案(簡要版)

1. Flink 作業設計
DataStream<LogEvent> source = env.addSource(new KafkaSource<>(...)); // 從 Kafka 消費日志  
DataStream<Tuple2<String, Long>> mapped = source  .map(event -> Tuple2.of(event.getEndpoint(), 1L)) // 轉換為 (endpoint, 1)  .returns(Types.TUPLE(Types.STRING, Types.LONG));  // 按接口名分組,計算每 10s 滑動窗口(每 1s 輸出一次)  
DataStream<QpsResult> qpsStream = mapped  .keyBy(t -> t.f0) // 按接口分組(可能數據傾斜)  .window(SlidingProcessingTimeWindows.of(Time.seconds(10), Time.seconds(1)))  .aggregate(new QpsAggregator()) // 自定義聚合函數  .addSink(new PrometheusSink()); // 輸出到監控系統  
2. 數據傾斜優化
  • 方案 1:加隨機前綴,如?hot_key?→?hot_key_1,?hot_key_2,聚合后再合并。

  • 方案 2:使用?rebalance()?強制均勻分發,犧牲局部有序性。

3. Exactly-Once 保證
  • Checkpoint 機制:開啟?enableCheckpointing(5000),設置?CheckpointingMode.EXACTLY_ONCE

  • StateBackend:使用?RocksDBStateBackend(大狀態)或?FsStateBackend(低延遲)。

  • Sink 端:Kafka 事務 / 冪等寫入(如 MySQL 用?INSERT ON DUPLICATE KEY UPDATE)。

4. 反壓調優
  • 增加并行度setParallelism(4)?分散負載。

  • 調整緩沖區taskmanager.network.memory.floating-buffers-per-gate

  • 啟用 RocksDB 本地 SSD:減少 State 訪問延遲。


進階問題

  • 如果 QPS 計算需要區分成功/失敗請求(如 HTTP 200 vs 500),如何修改?

  • 如何用 Flink SQL 實現相同的 QPS 計算?

(面試者可選擇繼續深入討論~)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/93354.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/93354.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/93354.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Pytest項目_day12(yield、fixture的優先順序)

yield yield可以用作fixture的后置操作 yield的執行位置和scope的范圍設置有關 當我們將scope設置為function時&#xff0c;yield就會在方法結束時執行yield后的代碼yield還可以返回數據&#xff0c;類似于return&#xff0c;不過yield之后的代碼會執行&#xff0c;而return不會…

面試實戰 問題三十二 Java中創建對象的幾種方式

Java中創建對象的幾種方式 在Java中&#xff0c;創建對象是面向對象編程的核心操作。對象創建不僅涉及直接實例化&#xff0c;還包括通過設計模式、反射機制等間接方式來實現。以下我將逐步解釋Java中常見的對象創建方式&#xff0c;每種方式都基于Java語言規范和相關設計原則。…

ToDesk云電腦 vs 順網云 vs 海馬云:誰才是5090顯卡云電腦的真王者?

文章目錄一、引言二、產品介紹三、硬件配置對比3.1 處理器3.2 顯卡四、云電腦性能實測對比4.1 網絡優化4.1.1 海馬云4.1.2 ToDesk云電腦4.1.3 順網云4.2 魯大師硬件測評4.3 3DMark4.4 系統穩定性測試4.4.1 海馬云4.4.2 順網云4.4.3 ToDesk云電腦4.5 為什么這么看重平臺優化&…

.NET 在鴻蒙系統(HarmonyOS Next)上的適配探索與實踐

目錄 1. 前言 2. 項目狀態 3. 運行時環境選擇 4. NativeAOT 適配原理 4.1 底層兼容性 4.2 技術實現方案 5. 已知問題及解決方案 5.1 syscall 限制&#xff08;已解決&#xff09; 5.2 mmap 申請虛擬內存過大&#xff08;已解決&#xff09; 5.3 第三方庫缺失問題&…

圖像處理--圖像模板匹配NCC算法-->Fast NCC算法的解讀

目錄 前言 一、基礎知識 二、NCC基本公式以及解決問題 1. NCC基本公式 2. 基本公式解讀 三、簡化分母 fuv 1. 要簡化的分母 2. 積分圖 3. 分母拆開化簡 四、簡化分子 1. 要簡化的分子 2. 模板函數的近似 3. 基函數簡單解釋 五、Fast NCC歸一化互相關值 1. 最終公…

短劇小程序系統開發:賦能創作者,推動短劇藝術創新發展

短劇作為一種新興的藝術形式&#xff0c;具有獨特的魅力和發展潛力。然而&#xff0c;在傳統的發展模式下&#xff0c;短劇創作者面臨著諸多限制和挑戰。短劇小程序系統的開發&#xff0c;為創作者提供了強大的賦能&#xff0c;推動了短劇藝術的創新發展。創作工具豐富&#xf…

Redis知識點+項目+面試八股

基礎篇&#xff1a;講解Redis常用數據結構實戰篇&#xff1a;黑馬點評實戰高級篇&#xff1a;Redis高級知識點原理篇&#xff1a;Redis原理面試篇&#xff1a;Redis八股??第一章&#xff1a;基礎篇??1. Redis介紹Redis是一個key-value的數據庫&#xff0c;key一般是String類…

WPS文字和Word文檔如何選擇多個不連續的行、段

要選擇Word或WPS文字中不連續的多行、多段&#xff0c;使用鼠標加鍵盤即可快速搞定。Word和WPS文字中選擇多行的操作一樣&#xff0c;選擇多段的方法略有不同。選中以后&#xff0c;可以對這些內容進行刪除、復制、剪切、查找、替換、設置格式等操作。一、在Word和WPS文字中選擇…

嵌入式C/C++面試大全

基礎語法 1.在main執?之前和之后執?的代碼可能是什么&#xff1f; main函數執?之前&#xff0c;主要就是初始化系統相關資源&#xff1a; 設置棧指針&#xff0c;其中棧存放的局部變量、函數參數、函數調用的返回地址初始化靜態 static 變量和 global 全局變量&#xff0c;即…

Java應用架構實戰指南:主流模式解析與Spring落地實踐

在Java開發的世界里,選對應用架構不是紙上談兵,而是項目成敗的關鍵。 今天,我想和大家聊聊四種主流架構模式——分層、微服務、事件驅動和六邊形架構。這些模式在實戰中各有千秋,我會結合代碼示例和架構圖,帶大家看清它們的內核。無論你是新手還是老手,這篇文章都能幫你…

重學JS-002 --- JavaScript算法與數據結構(二)JavaScript 基礎知識

文章目錄加入jsjs 的位置控制臺變量關鍵字DOMbutton注釋CSS轉義函數參數對象屬性屬性訪問數組Math加入js 首先創建一個 script 元素。 此元素用于將 JavaScript 加載到 HTML 文件中。 <script src"./script.js"></script>js 的位置 script 標簽位于 HTML…

計算機視覺--opencv(代碼詳細教程)(二)

一、圖片的邊界填充在 OpenCV 中&#xff0c;cv2.copyMakeBorder()是用于給圖像添加邊框&#xff08;邊緣&#xff09;的核心 API&#xff0c;其完整語法和參數說明如下&#xff1a;函數完整定義cv2.copyMakeBorder(src, top, bottom, left, right, borderType, valueNone)參數…

FPGA實現Aurora 64B66B視頻點對點傳輸,基于GTX高速收發器,提供4套工程源碼和技術支持

目錄 1、前言Aurora 64B66B是啥&#xff1f;官方有Example&#xff0c;為何要用你這個&#xff1f;工程概述免責聲明 2、相關方案推薦我已有的所有工程源碼總目錄----方便你快速找到自己喜歡的項目我這里已有的 GT 高速接口解決方案本方案在Aurora 8B10B上的應用 3、工程詳細設…

【軟件安裝|1】CentOS7最新可用國內 yum 鏡像源配置和Linux版MySQL8.0安裝及其相關知識

文章目錄一.更換yum鏡像源二.安裝并配置MySQL8.0安裝配置相關知識什么是yum&#xff1f;什么是鏡像源&#xff1f;相關知識請看最后&#xff0c;首先來更換yum鏡像源 更換前需要準備好VmwareWorkstation和Finalshell&#xff0c;開啟虛擬機&#xff0c;切換到root用戶 Vmware和…

【深度學習】深度學習的四個核心步驟:從房價預測看機器學習本質

文章目錄基礎概念與原理第一步&#xff1a;準備數據 - 構建學習的基礎數據生成與特征工程&#xff08;選擇對預測有用的特征&#xff09;數據集劃分的重要性第二步&#xff1a;設計模型 - 建立數學表達線性回歸模型的數學表達損失函數的設計哲學第三步&#xff1a;訓練優化 - 自…

Java使用Apache POI讀取Excel文件

一、下載jar包 Apache POI有提供下載地址&#xff1a;Apache Archive Distribution Directory&#xff0c;直接打開鏈接并選擇所需的版本下載即可(雙擊last modified可按最新更新時間排序)&#xff0c;本文章以poi-bin-4.1.1-20191023.zip為例&#xff0c;進入官網下載鏈接后&…

VLMs開發——基于Qwen2.5-VL 實現視覺語言模型在目標檢測中的層級結構與實現方法

概述 目標檢測作為計算機視覺領域的核心任務&#xff0c;傳統方法依賴于 YOLO 等視覺模型對預定義類別進行位置預測。然而&#xff0c;此類方法受限于預訓練類別體系&#xff0c;難以實現靈活的視覺交互。視覺語言模型&#xff08;Vision-Language Models, VLMs&#xff09;的…

Spring Boot + Redis + 布隆過濾器防止緩存穿透

? 項目概述 在高并發系統中&#xff0c;緩存穿透 是一個經典問題&#xff1a;當惡意請求或業務邏輯查詢一個數據庫中不存在的 Key&#xff0c;由于緩存中也沒有&#xff0c;請求會直接打到數據庫&#xff0c;導致數據庫壓力激增&#xff0c;甚至宕機。 本項目使用 Spring Bo…

電子電路學習日記

這里的 K 表示 千歐&#xff08;kilo-ohm&#xff09;&#xff0c;而 F 在很多國產 EDA 軟件&#xff08;比如立創EDA、Altium 的一些中文封裝庫&#xff09;里用來標注精度&#xff08;公差&#xff09;&#xff0c; F 代表 1% 精度&#xff08;英文 Fine tolerance&#xff0…

oracle 怎么實現讀一致性

? Oracle 數據塊讀一致性判斷流程&#xff08;正確版&#xff09; 假設&#xff1a;Query SCN 查詢開始的 SCN&#xff08;Query SCN&#xff09; lastSubbmit SCN 行中最新的提交scn Row SCN 行最后修改的 SCN&#xff08;存儲在行頭&#xff0c;通過 ITL 推導&#xff09…