數據庫備份策略 分布式_管理優秀的分布式數據團隊的4種基本策略

數據庫備份策略 分布式

COVID-19 has forced nearly every organization to adapt to a new workforce reality: distributed teams. We share four key tactics for turning your remote data team into a force multiplier for your entire company.

COVID-19迫使幾乎每個組織都適應新的勞動力現實:分散的團隊。 我們分享了四個關鍵策略,可將您的遠程數據團隊變成整個公司的力量倍增器。

It’s month 6 (or is it 72? It’s hard to tell) of the global pandemic, and despite the short commute from your bedroom to the kitchen table, you’re still adjusting to this new normal.

現在是全球大流行的第6個月(或者是72歲?這很難說),盡管從臥室到廚房的通勤時間很短,但您仍在適應這一新常態。

Your team is responsible for all the same tasks (handling ad-hoc queries, fixing broken pipelines, implementing new rules and logic, etc.), but troubleshooting broken data has only gotten harder. It’s difficult enough to identify the root cause of a data downtime incident when you’re all 5 feet away from each other; it’s 10 times harder when you’re working on different time zones.

您的團隊負責所有相同的任務(處理臨時查詢,修復損壞的管道,實現新規則和邏輯等),但是對損壞的數據進行故障排除只會變得更加困難。 當您彼此相距5英尺時,要確定數據停機事件的根本原因已經非常困難。 當您在不同時區工作時,難度會增加10倍。

Distributed teams aren’t novel, in fact, they’ve become increasingly common over the last few decades, but working during a pandemic is new for everyone. While this shift widens the geographic talent pool, collaborating at this scale entails unforeseen hurdles, particularly when it comes to working with real-time data.

分布式團隊并不是什么新奇的事物,事實上,在過去的幾十年里它們已經變得越來越普遍,但是在大流行期間工作對于每個人來說都是新事物。 盡管這種轉變擴大了地理人才庫,但這種規模的協作帶來了不可預見的障礙,尤其是在處理實時數據時。

Your daily standup only gets you so far.

每天的站起來只會讓您走得那么遠。

Here are 4 essential steps to managing a great distributed data team:

以下是管理一個出色的分布式數據團隊的4個基本步驟:

記錄所有東西 (Document all the things)

Information about which tables and columns are “good or bad” breaks down when teams are distributed. One data scientist we spoke with at a leading e-commerce company told us that it takes 9 months of working on a team to develop a spidey-sense for what data lives where, which tables are the ‘right’ ones, and which columns are healthy vs. experimental.

分配團隊時,有關哪些表和列是“好是壞”的信息會分解。 我們在一家領先的電子商務公司與之交談的一位數據科學家告訴我們,一個團隊需要花9個月的時間開發出針對數據存放在何處,哪些表是“正確的”表,哪些列是什么的間諜意識。健康與實驗。

The answer? Consider investing in a data catalog or lineage solution. Such technologies provide one source of truth about a team’s data assets, and make it easy to understand formatting and style guidelines for data input. Data catalogs become particularly important when data governance and compliance come into play, which is top of mind for data teams in financial services, healthcare, and many other industries.

答案? 考慮投資數據目錄或沿襲解決方案 。 此類技術提供了有關團隊數據資產的一個真實來源,并易于理解數據輸入的格式和樣式準則。 當數據治理和合規性發揮作用時,數據目錄就變得尤為重要,這對于金融服務,醫療保健和許多其他行業的數據團隊而言,是最重要的。

設置數據的SLA和SLO (Set SLAs and SLOs for data)

It’s important to ensure alignment not just among data team members but with data consumers (i.e., marketing, executives, or operations teams), too. To do so, we suggest taking a page out of the site reliability engineering book and setting and align clear service level agreements (SLAs) and service level objectives (SLOs) for data. SLAs for expectations around data freshness, volume, and distribution, as well as other pillars of observability, will be crucial here.

重要的是,不僅要確保數據團隊成員之間的一致性,而且還要確保與數據消費者(即市場,執行人員或運營團隊)的一致性。 為此,我們建議從站點可靠性工程手冊中抽出一頁,并為數據設置并調整明確的服務水平協議(SLA)和服務水平目標(SLO)。 關于數據新鮮度,數據量和分布以及其他可觀察性Struts的 SLA在這里至關重要。

Katie Bauer, a Data Science Manager at Reddit, suggests distributed data teams maintain a central document with expected delivery dates for important projects, and review that document weekly.

Reddit的數據科學經理Katie Bauer建議分布式數據團隊維護一個中心文檔,其中包含重要項目的預計交付日期,并每周審查該文檔。

“Instead of pinging my team for updates throughout the week when questions arise from stakeholders, I can easily visit this document for answers,” she said. “This keeps us focused on delivering our work and avoids unnecessary diversions.”

她說:“當利益相關者提出問題時,我不必整周對我的團隊進行更新,而是可以輕松訪問此文檔以獲取答案,”她說。 “這使我們專注于交付工作,避免了不必要的轉移。”

投資自助工具 (Invest in self-serve tooling)

Investing in self-serve data tools (including cloud warehouses like Snowflake and Redshift, as well as data analytics solutions, like Mode, Tableau, and Looker) will streamline data democratization no matter the location or persona of the data user.

投資自助數據工具(包括Snowflake和Redshift之類的云倉庫,以及Mode,Tableau和Looker之類的數據分析解決方案)將簡化數據民主化,無論數據用戶的位置或角色如何。

Similarly, self-serve versioning control systems helps everyone stay on the same page when it comes to collaborating on larger workflows, which becomes extremely important when it comes to leveraging real-time data across time zones.

同樣,自助式版本控制系統可以幫助每個人在較大的工作流程上保持一致,這在跨時區利用實時數據時顯得尤為重要。

優先考慮數據可靠性 (Prioritize data reliability)

Industries that are responsible for managing PII and other sensitive customer information, like healthcare and financial services, have a low tolerance for mistakes. Data teams need confidence that data is secure and accurate across their pipeline, from consumption to output. The right processes and procedures around data reliability can prevent such data downtime incidents and restore trust in your data.

醫療保健和金融服務等負責管理PII和其他敏感客戶信息的行業對錯誤的容忍度較低。 數據團隊需要信心,確保從消費到輸出的整個管道中的數據都是安全和準確的。 圍繞數據可靠性的正確流程和步驟可以防止此類數據停機事件并恢復對數據的信任。

For many years, data quality monitoring was the primary way in which data teams caught broken data, but this isn’t cutting it anymore, particularly when real-time data and distributed teams are the norm. Our remote-first world calls for a more comprehensive solution that can seamlessly track the five pillars of data observability and other important data health metrics tailored to the needs of your organization.

多年來,數據質量監視是數據團隊捕獲損壞的數據的主要方式,但是這種情況已不再減少,尤其是在實時數據和分布式團隊成為常態的情況下。 我們的遠程第一世界需要一個更全面的解決方案,該解決方案可以無縫地跟蹤數據可觀察性的五個Struts以及適合組織需求的其他重要數據健康指標。

記住:沒事也可以 (Remember: it’s OK to not be OK)

We hope these tips help you accept and even embrace the data world’s new normal.

我們希望這些技巧可以幫助您接受甚至接受數據世界的新常態。

On top of this more tactical advice, however, it never hurts to remember that it’s OK to not be OK. Emilie Schario, GitLab’s first data analyst who is now an internal strategy consultant, put it best: “This is not normal remote work. What it takes to be successful during a period of forced remote work in a global pandemic is different from what it means to be remote-as-usual.”

但是,除了這個更具戰術性的建議外,記住“ 不行是可以的”也從未有過任何傷害。 GitLab的第一位數據分析師Emilie Schario現已成為內部戰略顧問,他最好地指出:“這不是正常的遠程工作。 在全球大流行中被迫進行遠程工作期間要取得成功所需要的與不同于通常進行遠程管理意味著什么。”

We’d love to hear your advice for leading distributed teams! Reach out to Barr Moses with your words of wisdom.

我們很想聽聽您對領先的分布式團隊的建議! 用您的智慧之言與 Barr Moses 接觸

This article was written by Will Robins & Barr Moses.

本文由威爾·羅賓斯和巴爾·摩西撰寫。

翻譯自: https://towardsdatascience.com/4-essential-tactics-for-managing-a-great-distributed-data-team-e7df9f85e6fa

數據庫備份策略 分布式

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/392486.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/392486.shtml
英文地址,請注明出處:http://en.pswp.cn/news/392486.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

如何使用阿里云云解析API實現動態域名解析,搭建私有服務器

原文地址:http://www.yxxrui.cn/article/116.shtml 未經許可請勿轉載,如有疑問,請聯系作者:yxxrui163.com 公司的網絡沒有固定的公網IP地址,但是能夠保證的是,每次動態分配的IP地址均為獨立的公網IP&#x…

新手指南:dvwa_如何構建基本的Slackbot:新手指南

新手指南:dvwaBy Vishwa ShahVishwa Shah著 Update: code and tutorial updated on June 28 to reflect Slack API changes.更新:代碼和教程已于6月28日更新,以反映Slack API的更改 。 Slackbots:為什么要使用它們? (Slackbots:…

java 加載class文件路徑_動手實現MVC: 1. Java 掃描并加載包路徑下class文件

背景用過spring框架之后,有個指定掃描包路徑,然后自動實例化一些bean,這個過程還是比較有意思的,抽象一下,即下面三個點如何掃描包路徑下所有的class文件如何掃描jar包中對應包路徑下所有的class文件如何加載class文件…

leetcode 738. 單調遞增的數字(貪心算法)

給定一個非負整數 N&#xff0c;找出小于或等于 N 的最大的整數&#xff0c;同時這個整數需要滿足其各個位數上的數字是單調遞增。 &#xff08;當且僅當每個相鄰位數上的數字 x 和 y 滿足 x < y 時&#xff0c;我們稱這個整數是單調遞增的。&#xff09; 示例 1: 輸入: …

python+[:]+切片_我從C ++到Python的方式:概念上的改變

python[:]切片by asya f由asya f 我從C 到Python的方式&#xff1a;概念上的改變 (How I went from C to Python: a conceptual change) 介紹 (Introduction) People say that coding in Python is so easy that even a 6 year old can do it. This was the thought that I ha…

深度學習 免費課程_2020年排名前三的免費深度學習課程

深度學習 免費課程&#xff03;1 Fastai面向程序員的實用深度學習2020 (#1 Fastai Practical Deep Learning for Coders 2020) On 21 of August 2020, fastai released the new version of the fastai library and of their Deep Learning course!2020年8月21日&#xff0c;fas…

mysql復制主從集群搭建

近期搭了個主從復制。中間出了點小問題&#xff0c;排查搞定&#xff0c;記錄下來1環境&#xff1a;虛擬機&#xff1a;OS:centos6.5Linux host2 2.6.32-431.el6.x86_64 #1 SMP Fri Nov 22 03:15:09 UTC 2013 x86_64 x86_64 x86_64 GNU/LinuxserverIP192.168.18.66192.168.18.6…

java jolt tuxedo_java通過jolt調用tuxedo服務.xls

java通過jolt調用tuxedo服務.xls還剩20頁未讀&#xff0c;繼續閱讀下載文檔到電腦&#xff0c;馬上遠離加班熬夜&#xff01;親&#xff0c;喜歡就下載吧&#xff0c;價低環保&#xff01;內容要點&#xff1a;?private bea.jolt.pool.servlet.ServletSessionPoolManager bool…

你的周末時光是什么樣的?

周末是一個特殊的假日&#xff0c;隔三差五就會有&#xff0c;來的容易去得也容易&#xff0c;即便如此&#xff0c;我們還是應該好好珍惜&#xff0c;周末可以做的事太多了&#xff0c;既可以用來減壓&#xff0c;也可以為下一周的學習和工作充電&#xff0c;不管做什么&#…

leetcode 290. 單詞規律(hash)

給定一種規律 pattern 和一個字符串 str &#xff0c;判斷 str 是否遵循相同的規律。 這里的 遵循 指完全匹配&#xff0c;例如&#xff0c; pattern 里的每個字母和字符串 str 中的每個非空單詞之間存在著雙向連接的對應規律。 示例1: 輸入: pattern “abba”, str “dog…

2019年微博用戶畫像_2019年您需要了解的有關用戶的信息

2019年微博用戶畫像by Yisroel Yakovson通過伊斯洛爾雅科夫森 2019年您需要了解的有關用戶的信息 (What You Need to Know About Your Users in 2019) Users have changed a lot in the last few years. We programmers may have a culture gap to overcome in this area. If …

使用lt;jsp:includegt;,不想寫死URL,動態生成URL的解決的方法

JSP中文件包括有2種方式&#xff0c;靜態包括和動態包括。靜態包括使用<% include file"" %>。動態包括使用<jsp:include page"" />。本文不打算介紹這2種方式的差別和使用場景&#xff0c;主要關注page和file屬性的路徑問題。 假設事先知道被…

java udp ip端口 設置_UDP端口掃描Java只找到1個開放的UDP端口

我對端口掃描有一個分歧.我在Java中掃描一些IP地址的UDP端口.在我的程序中(假設一切正常)我只能找到一個開放的UDP端口.在另一方面端口掃描“nmap”我得到4個開放的UDP端口.有人可以告訴我為什么我不能通過Java代碼找到多個端口&#xff1f;順便說一句,我可以在我的代碼中找到真…

pandas之Seris和DataFrame

pandas是一個強大的python工具包&#xff0c;提供了大量處理數據的函數和方法&#xff0c;用于處理數據和分析數據。 使用pandas之前需要先安裝pandas包&#xff0c;并通過import pandas as pd導入。 一、系列Series Seris為帶標簽的一維數組&#xff0c;標簽即為索引。 1.Seri…

機器學習:分類_機器學習基礎:K最近鄰居分類

機器學習:分類In the previous stories, I had given an explanation of the program for implementation of various Regression models. Also, I had described the implementation of the Logistic Regression model. In this article, we shall see the algorithm of the K…

leetcode 714. 買賣股票的最佳時機含手續費(dp)

給定一個整數數組 prices&#xff0c;其中第 i 個元素代表了第 i 天的股票價格 &#xff1b;非負整數 fee 代表了交易股票的手續費用。 你可以無限次地完成交易&#xff0c;但是你每筆交易都需要付手續費。如果你已經購買了一個股票&#xff0c;在賣出它之前你就不能再繼續購買…

如何在Angular Material中制作自定義主題

by Charlee Li通過李李 如何在Angular Material中制作自定義主題 (How to make a custom theme in Angular Material) Angular Material is a great library that implements Material Design for Angular 2. The official document is sufficient regarding the component us…

最感嘆的莫過于一見如故,最悲傷的莫過于再見陌路。最深的孤獨,是你明知道自己的渴望,卻得對它裝聾作啞。最美的你不是生如夏花,而是在時間的長河里,波瀾不驚。...

最感嘆的莫過于一見如故&#xff0c;最悲傷的莫過于再見陌路。最深的孤獨&#xff0c;是你明知道自己的渴望&#xff0c;卻得對它裝聾作啞。最美的你不是生如夏花&#xff0c;而是在時間的長河里&#xff0c;波瀾不驚。轉載于:https://www.cnblogs.com/dj258/p/7003890.html

java vimrc_.vimrc技巧

-------------------------------------------------------------------" 設置字符編碼。參考&#xff1a;http://www.rainux.org/blog/index.php/2005/10/20/106" encoding: Vim 內部使用的字符編碼方式&#xff0c;包括 Vim 的buffer (緩沖區)、菜單文" 本、消…

將PDF和Gutenberg文檔格式轉換為文本:生產中的自然語言處理

Estimates state that 70%–85% of the world’s data is text (unstructured data). Most of the English and EU business data formats as byte text, MS Word, or Adobe PDF. [1]據估計&#xff0c;全球數據的70&#xff05;–85&#xff05;是文本(非結構化數據)。 大多數…