3.4 安全-分布式-數據庫-挖掘

一、數據庫的安全

數據庫里面的安全措施:

  1. 用戶標識和鑒定:用戶的賬戶口令等
  2. 存取控制:對用戶操作進行控權,有對應權限碼才能操作。
  3. 密碼存儲和傳輸:加密存儲。
  4. 視圖的保護:視圖需要授權
  5. 審計:專門的文件或者數據庫記錄所有操作記錄。

數據庫里面的故障:看下圖

數據庫備份

數據庫備份的形式如下:

1、冷備份(靜態轉儲)轉儲期間不能對數據庫進行任何操作,優點是快速備份,容易存檔(直接物理復制)


2、熱備份(動態轉儲)轉儲期間允許對數據庫進行存取、修改操作。此時轉儲和用戶事務是并發執行。

優點是表空間或者數據庫文件級別備份,數據庫仍然可以使用,可達到秒級恢復;

缺點:不能出錯

3、完全備份:備份所有數據

4、差量備份:僅備份上一次完全備份之后變化的數據

5、增量備份:備份上一次備份之后變化的數據。(不管上一次是什么備份????????)

6、日志文件:事務每一次對數據庫的操作寫入日志文件,發生故障,利用日志文件撤銷事務對數據庫的改變,回退到四五的初始狀態。

數據故障恢復

數據庫故障恢復的技術:

  1. 事務故障的恢復:由系統自動完成,對用戶是透明的(不需要DBA的參與)。步驟就是把更新操作全部還原回去,直到事務的開始標記。
  2. 系統故障的恢復:系統重新啟動時自動完成,不需要用戶的干預。掃描日志文件,已提交的時候加入重做隊列,未完成的事務家務撤銷隊列。
  3. 介質故障與病毒破壞的恢復。硬盤壞了,裝入最新的數據庫副本,已提交的事務進入重做隊列,不用管未提交的事務
  4. 有檢查點的恢復技術:檢查點記錄的內容可包括建立檢查點時刻所有正在執行事務清單,以及這些事務最近一個日志記錄的地址類似ctrl+S。

數據庫性能優化

性能優化:

  1. 硬件升級:涉及處理器、內存、磁盤子系統和網絡
  2. 數據庫設計:從邏輯設計和物理設計入手

    邏輯設計:常用的計算屬性(平均值、最大值)存儲到數據庫實體中。重新定義實體減少外部數據數據的開支

    物理設計:給數據分配合適的存儲空間。頻繁使用的表分割開,這樣可以并行使用。文本和圖像存儲在單獨的物理設備上。
  3. 索引優化:索引類似目錄,索引能提高數據庫查詢速度,建立索引時應該選用不常更新經常查詢的屬性作為索引。索引過多會影響到增刪改。
  4. 查詢優化:sql語句優化,建立物化視圖(已經查好的數據),減少多表查詢;只檢索需要的屬性;用帶IN的條件子句等價替換OR;經常commit 釋放鎖。

二、分布式數據庫

????????局部數據庫位于不用的物理位置,使用一個全局DBMS(數據庫管理系統)將所有局部數據庫聯網管理,這就是分布式數據庫

分布式數據庫特點

  1. 數據獨立性
  2. 集中于自治共享結合的控制結構:
  3. 適當增加數據冗余度
  4. 全局的一致性、可串行和可恢復性

分布式數據庫各個模式

圖示:

分片方式

優點

  1. 解決企業部門分散而數據需要相互聯系的問題。
  2. 靈活增加新的相對自主的部門。
  3. 靈活組建全局應用下的多數據庫系統。
  4. 故障僅影響局部應用,可靠性更高。

數據倉庫

概要

數據倉庫是:面相主題的、集成的、非易失的、且隨時間變化的數據集合,用于管理決策(大數據決策)。

  1. 面相主題:用于特定品類大數據。
  2. 集成的:對分散數據庫數據抽取、清理、加工等操作。消除數據的不一致性,保證信息的主題性。
  3. 相對穩定:長期保留,包含大量的查詢操作,只需定義的加載、刷新。
  4. 反映歷史變化:包含歷史信息,是各個階段的信息,通過這些信息進行定量分析與預測。

四個層次(重要)

層次

  1. 數據源:數據倉庫的基礎,整個系統的數據源泉。
  2. 數據的存儲和管理:數倉的核心。
  3. OLAP(聯機分析處理)服務器:
    將原本不可能實時完成的深度分析變為可行——如同用天文望遠鏡替代肉眼觀星 ?
  4. 前端工具:報表工具等,呈現olap的結果。

商業智能

BI系統的4個階段:數據預處理、建立數據倉庫、數據分析、數據展現。

數據倉庫分類

數據倉庫的分類:企業倉庫、數據集市、虛擬倉庫

數據倉庫設計方法

數據倉庫的設計方法:

  1. 自頂向下:用于企業級,建立數據倉庫后,各個部分再從數據倉庫中獲取部門所需的數據,形成數據集市。
  2. 自底向上:從企業中最關鍵的部門開始,最少投資完成當前需求,最先產生獨立數據集市。
  3. 混合.

數據挖掘

結構

發現非直覺的信息。

流程

數據挖掘常用技術(記住)

數據挖掘的常用技術

  1. 決策樹:利用信息論中互信息(信息增益)尋找數據庫中具有最大信息量的屬性,建立決策樹的節點,再根據屬性的不同取值建立樹的分支。
  2. 分類:按照翻譯劃分成組
  3. 粗糙集:基于分類,一種類別對應于一個概念,知識由概念組成。粗糙集通過近似概念表示不精確的概念。
  4. 神經網絡:神經網絡通過學習待分析數據中的模式來構建模型。
  5. 關聯規則:搜索業務系統中所有細節和事務,找出重復出現的模式。
  6. 概念樹方法:按歸類的方式進行抽象,放大建立起來的層次結構稱為概念樹。
  7. 遺傳算法:模擬生物進化過程
  8. 依賴性分析:在數據倉庫的條目和對象之間抽取依賴性。
  9. 公式發現:進行數學運算
  10. 統計分析方法:找出數據庫屬性的函數關系相關關系
  11. 模糊論:模糊性是客觀存在的,系統越復雜,精確度越低,越模糊
  12. 可視化分析:通過圖形化分析數據。

數據挖掘分析方法(了解)

  1. 關聯分析
  2. 序列分析
  3. 分類分析:首先為每個記錄設置一個標記,然后對這個分類進行分析,有監督。
  4. 聚類分析:對無標記的記錄進行相似性聚合,劃分、分析,屬于無監督。
  5. 預測分析
  6. 時間序列分析

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/90635.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/90635.shtml
英文地址,請注明出處:http://en.pswp.cn/web/90635.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

多線程 Reactor 模式

目錄 多線程 Reactor 模式的核心動機 多線程演進方向 多線程 Reactor 模型結構 多線程 EchoServer 實現核心部分 Handler 的多線程化 多線程 Reactor 的三個核心點 本篇文章內容的前置知識為 單線程 Reactor 模式,如果不了解,可點擊鏈接學習 單線程…

[NLP]多電源域設計的仿真驗證方法

多電源域設計的仿真驗證方法 1. 更復雜的 Testbench 例子(多電源域、復雜低功耗場景) 假設有兩個電源域 PD1 和 PD2,分別對應控制信號 pwr_sw_ctrl1、iso_ctrl1、ret_ctrl1 和 pwr_sw_ctrl2、iso_ctrl2、ret_ctrl2,且兩域之間有通信。 RTL 端口聲明(簡化版) module top…

Apache Ignite 中 WHERE 子句中的子查詢(Subqueries in WHERE Clause)的執行方式

這段內容是關于 Apache Ignite 中 WHERE 子句中的子查詢(Subqueries in WHERE Clause)的執行方式 的說明。理解這段內容對于編寫高效的 SQL 查詢、避免性能瓶頸非常重要。下面我將為你 逐句解釋并深入理解這段內容。🧾 原文翻譯 解釋 原文&a…

MySQL(153)如何使用全文索引?

MySQL的全文索引(Full-Text Index)是一種特殊的索引類型,專門用于加速文本數據的搜索。與普通的B樹索引不同,全文索引適用于大文本字段(如TEXT、VARCHAR等)的全文搜索。它通過構建一個倒排索引,…

微分方程入門之入門之入門,純筆記

當描述 相對變化量 比 絕對量 更容易時,微分方程就經常用到了。 比如,描述為什么種群數量增加or減少【相對】,比描述為什么它在某個時間點是某個特定值【絕對】更容易。 物理學中,運動經常用力來描述,力–>代表變化…

【C++】簡單學——vector類(模擬實現)

模擬實現的準備工作 看源碼,了解這個類的大概組成 1.先看成員變量 成員變量的組成是三個迭代器 問:這個iterator內嵌類型究竟是什么?即這個迭代器是什么 迭代器實際就是T* 問:這三個迭代器代表什么意思? 連蒙帶猜…

【WRF】根據自動安裝腳本安裝 WRF / WRF-CHEM等

目錄 GitHub 上 WRF 自動安裝腳本 ?? 腳本的作用 ??? 支持的系統 ?? 可安裝的 WRF 版本及其選項 ? 如何使用(以 WRF 4.6.1 為例) ? 依賴庫的安裝位置 完整安裝腳本分析 參考 GitHub 上 WRF 自動安裝腳本 GitHub 上的 WRF-Install-Script 項目的 Releases(發布版本…

M2IV:面向大型視覺-語言模型中高效且細粒度的多模態上下文學習

MIV: Towards Efficient and Fine-grained Multimodal In Context Learning in Large Vision-Language Models COLM 2025 why 新興的研究方向:上下文學習(ICL)的效果“向量化”,其核心思想是用transformer內部的向量來…

龍迅#LT8711UXD適用于Type-C/DP1.4 /EDP轉 HDMI2.0 功能,分辨率高達4K60HZ,可支持HDCP!

1. 描述LT8711UXD 是一款高性能雙通道 Type-C/DP1.4 轉 HDMI2.0 轉換器,旨在將 USB Type-C 源或 DP1.4 源連接到 HDMI2.0 接收器。該LT8711UXD集成了一個符合 DP1.4 標準的接收器和一個符合 HDMI2.0 標準的發射器。此外,還嵌入了兩個用于CC通信的CC控制器…

《計算機組成原理與匯編語言程序設計》實驗報告一 基本數字邏輯及漢字顯示

目 錄 一、實驗學時 二、實驗目的 三、實驗要求 四、實驗內容 五、實驗步驟 1、打開Logisim軟件,列出異或邏輯電路真值表,并使用與、或、非基本原件實現異或邏輯電路。 2、打開Logisim軟件,列出同或邏輯電路真值表,并使用…

聚焦牛牛道:綠色積分模式如何實現快速發展?

?綠色消費積分政策再次進入大眾視野,這種能為企業減輕庫存負擔、讓咨金周轉更靈活的促銷方式,很快就成了焦點。牛牛道作為積極踐行這一政策的平臺,憑借其獨樹一幟的商業模式和運營思路,在短時間內就取得了顯著發展。一、牛牛道平…

高頻 RFID 賦能工業教學設備教學應用

高頻 RFID 賦能工業教學設備教學應用應用背景傳統工業教學設備側重機械原理、電氣控制等基礎功能演示,缺乏對 RFID 等工業識別技術的具象教學載體。學生在理論學習中難以直觀理解 RFID 技術的工業適配邏輯,實訓中缺乏設備識別系統的部署、調試經驗&#…

Transformer:顛覆NLP的自注意力革命

Transformer:顛覆NLP的自注意力革命 Transformer是自然語言處理領域中極具影響力的深度學習模型架構,以下是對其的詳細介紹: 提出背景與應用:2017年,Vaswani等人在《Attention Is All You Need》論文中首次提出Transformer架構,它主要用于處理序列到序列的任務,如機器翻…

基于 KeepAlived + HAProxy 搭建 RabbitMQ 高可用負載均衡集群

基于 KeepAlived HAProxy 搭建 RabbitMQ 高可用負載均衡集群 基于 KeepAlived HAProxy 搭建 RabbitMQ 高可用負載均衡集群實戰指南 一、前言 在企業級應用中,消息隊列的高可用性是系統穩定性的重要保障。RabbitMQ 作為主流的消息中間件,雖然自身支持…

京東獲得JD商品詳情 API 返回值說明||京東API接入文檔

京東商品詳情API返回值核心字段說明一、商品基礎信息商品ID(skuId/productId)唯一標識符,用于定位具體商品或SKU(如不同顏色、尺寸的變體)。示例:"skuId": "123456789"商品標題&#x…

其他世界的自來水

西歐,北美,亞洲日韓等地區,他們的自來水可以直接飲用以英國為例:自來水的質量可能等同或者有可能超過純凈水,不需要消毒和過濾直接可以飲用。直接從水龍接的水和瓶裝純凈水沒有什么差別,甚至比瓶裝純凈水更…

IO密集型、CPU密集型、負載、負載均衡

0、引入 從宏觀上來講,計算機可以抽象為【輸入 > 計算 > 輸出】這三部分 輸入輸出自然就是io,而計算部分自然歸cpu管 不同的任務,對io和cpu的依賴程度不同,由此有了cpu密集型任務和io密集型任務 1、IO密集型 更依賴輸入…

從甲方的角度看MOM項目成敗的原因

關鍵詞:MOM、數字化轉型、成敗數字化轉型中流行這么一句話:SAP項目加班到晚上8點,MOM項目最少到晚上10點。由此可見,MOM項目實施的難度、復雜度。但,為什么MOM難度大?先引入1個故事:1個價值300萬…

MySQL操作進階

系列文章目錄 MySQL的基礎操作-CSDN博客 目錄 系列文章目錄 前言 一、數據庫的約束 1. 約束類型:not null 2. 約束類型:unique 3. 約束類型:default 4. 約束類型:primary key 5. 約束條件:foreign key 二、表…

表征工程 中怎么 調整參數或比例

表征工程 中怎么 調整參數或比例 在表征工程(Representation Engineering)中,調整參數或比例的核心目標是平衡干預效果與模型基礎能力,避免過度干預導致語義失真或能力退化。以下是幾種常用的方法論及具體案例: 1. 系數縮放法(Scaling Coefficients):通過權重參數控制…