回歸分析檢驗_回歸分析

回歸分析檢驗

Regression analysis is a reliable method in statistics to determine whether a certain variable is influenced by certain other(s). The great thing about regression is also that there could be multiple variables influencing the variable of interest. Regression analysis can be used for prediction.

回歸分析是統計中確定某個變量是否受某些其他變量影響的可靠方法。 回歸的偉大之處還在于,可能會有多個變量影響目標變量。 回歸分析可用于預測。

You have to understand the two types of variables to get started with regression analysis:

您必須了解兩種類型的變量才能開始回歸分析:

Dependent variable — the variable that you want to examine, understand or predict.

因變量-您要檢查,理解或預測的變量。

Independent variable(s) — all the other variables that you hypothisize to influence the dependent variable.

自變量—您假設的所有其他變量都會影響因變量。

In order to start the regression analysis, the dependent variable should be chosen. Then the independent variable or variables should be chosen which you hypothesize to affect the dependent variable.

為了開始回歸分析,應選擇因變量。 然后應選擇一個或多個您假設會影響因變量的自變量。

The next step is obtaining data for the regression analysis. This is usually a dataset that has the identified dependent and independent variables. As an instance, if there are separate datasets available for each of the variables, the variables of interest can be extracted and combined into a new dataset.

下一步是獲取用于回歸分析的數據。 這通常是具有已標識的因變量和自變量的數據集。 例如,如果每個變量都有單獨的數據集,則可以提取感興趣的變量并將其合并到新的數據集中。

A scatter plot where the points are are scattered but follow a positive slope

After that, the data should be plotted. The dependent variable always goes on the x-axis and the independent variable on the y-axis.

之后,應繪制數據。 因變量始終在x軸上 ,而自變量始終在y軸上

From the plot, initial trends and correlation can be observed that suggest what kind of relationship the dependent and independent variables have. In the example to the left, the hypothetical data points have an increasing trend. As the independent variable increases the dependent increases as well.

從圖中可以觀察到初始趨勢和相關性,它們表明因變量和自變量具有什么樣的關系。 在左側的示例中,假設的數據點呈上升趨勢。 隨著自變量的增加,因變量也隨之增加。

A trend could be observed from the plot, but what is the precise degree to which the dependent variable is influenced by the independent? A regression line should be calculated. Usually, this can be done in software like STATA or Excel. The regression line is the best approximation of the data points on the plot.

從圖中可以觀察到趨勢,但是因變量在多大程度上受到自變量的影響? 應該計算一條回歸線。 通常,這可以在STATA或Excel之類的軟件中完成。 回歸線是圖中數據點的最佳近似值。

In other words, explains Redman, “The red line is the best explanation of the relationship between the independent variable and dependent variable.”

換句話說,雷德曼解釋說:“紅線是對自變量和因變量之間關系的最好解釋。”

Image for post

計算回歸線 (Calculating the regression line)

Calculating a regression line means finding a best-fit line for all the data points. For simple linear regression analysis, usually, the least-squares method is used.

計算回歸線意味著找到所有數據點的最佳擬合線。 對于簡單的線性回歸分析,通常使用最小二乘法。

The linear regression line is a simple line of the form y=mx+b. In order to find the best-fit line for your data you need to first find the five summary statistics:

線性回歸線是形式為y = mx + b的簡單線 為了找到最適合您的數據的行,您需要首先找到五個匯總統計信息:

  1. Mean of the x values

    x值的平均值

Image for post

2. Mean of the y values

2. y值的平均值

Image for post

3. The standard deviation of the x values (denoted sx)

3. x值的標準偏差(表示為sx )

4. The standard deviation of the y values (denoted sy)

4. y值的標準偏差(表示為sy )

5. The correlation between X and Y (denoted r)

5. XY之間的相關性(表示為r )

The formula for calculating the slope m of the regression line is the following:

回歸線的斜率m的計算公式如下:

Image for post

This formula calculates the slope for the regression line equation of the form y=mx+b. Now the last part to calculate is the y-intercept b. It can be calculated using the formula below:

該公式計算形式為y = mx + b的回歸線方程的斜率。 現在要計算的最后一部分是y截距 b 。 可以使用以下公式計算:

Image for post

are the means of the x values and y values respectively and m is the already calculated slope.

分別是x值和y值的均值, m是已經計算出的斜率。

The regression line that Excel will produce for example will look something like y=6x+70+error_term. This is different from the simple regression line that we calculated in that it has an error_term.

例如,Excel將產生的回歸線將類似于y = 6x + 70 + error_term 。 這與我們計算的簡單回歸線不同,它具有error_term

Regression lines always consider an error term because in reality, independent variables are never precisely perfect predictors of dependent variables.

回歸線總是考慮一個誤差項,因為實際上,自變量從來都不是因變量的精確預測器。

In reality, the dependent term might be determined by a number of different factors. The regression line is only an estimate based on the data available to you and the larger the error term is the less definitely certain your regression line is.

實際上,從屬項可能由許多不同的因素決定。 回歸線只是基于您可用數據的估計值,誤差項越大,確定線越不確定。

結論 (Conclusion)

Regression analysis helps determine effect of some variables on another. It is widely used in business analysis for determining different factors that influence the target variable and predict its future values.

回歸分析有助于確定某些變量對另一個變量的影響。 它廣泛用于業務分析中,以確定影響目標變量并預測其未來價值的不同因素。

We’ve discussed what regression analysis is and how to calculate the regression line.

我們已經討論了什么是回歸分析以及如何計算回歸線。

翻譯自: https://medium.com/swlh/regression-analysis-86e6a8bee0b7

回歸分析檢驗

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/389190.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/389190.shtml
英文地址,請注明出處:http://en.pswp.cn/news/389190.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

是什么樣的騷操作讓應用上線節省90%的時間

優秀的程序員 總會想著 如何把花30分鐘才能解決的問題 在5分鐘內就解決完 例如在應用上線這件事上 通常的做法是 構建項目在本地用maven打包 每次需要clean一次,再build一次 部署包在本地ide、git/svn、maven/gradie 及代碼倉庫、鏡像倉庫和云平臺間 來回切換 上傳部…

QQ API

QQ API設計說明書目錄一、引言 31.1 編寫目的 31.2 更新時間 3二、總體設計 3三、注冊的系統消息 33.1 WM_QQAPI_REGISTER 33.2 WM_QQAPI_REGISTER_RESP 43.3 WM_QQAPI_AVAILABLE 4四、從設備到QQ的自定義事件 54.1 EVENT_QQAPI_SET_AUDIODEVICE …

Ubuntu 18.04 下如何配置mysql 及 配置遠程連接

首先是大家都知道的老三套,啥也不說上來就放三個大招: sudo apt-get install mysql-serversudo apt isntall mysql-clientsudo apt install libmysqlclient-dev 這三步下來mysql就裝好了,然后我們偷偷檢查一下 sudo netstat -tap | grep mysq…

數據科學與大數據技術的案例_主數據科學案例研究,招聘經理的觀點

數據科學與大數據技術的案例I’ve been in that situation where I got a bunch of data science case studies from different companies and I had to figure out what the problem was, what to do to solve it and what to focus on. Conversely, I’ve also designed case…

導致View樹遍歷的時機

遍歷View樹意味著整個View需要重新對其包含的子視圖分配大小并重繪,導致重新遍歷的原因主要有三個 1.視圖本身內部狀況變化引起重繪。 2.第二個是View樹內部添加或者刪除了View。 3.View本身的大小及可見性發生變化。 能引起View樹重新遍歷的操作,總…

什么是Hyperledger?Linux如何圍繞英特爾的區塊鏈項目構建開放平臺?

訪問區塊鏈會議并關注區塊鏈新聞時,不可避免地,您會遇到Linux基金會的Hyperledger。理解像比特幣、以太坊這樣的加密貨幣還算相對容易的,Hyperledger卻不然。但如果你多研究研究,你會發現一些令人興奮的非貨幣、工業區塊鏈的應用項…

隊列的鏈式存儲結構及其實現_了解隊列數據結構及其實現

隊列的鏈式存儲結構及其實現A queue is a collection of items whereby its operations work in a FIFO — First In First Out manner. The two primary operations associated with them are enqueue and dequeue.隊列是項目的集合,由此其操作以FIFO(先進先出)的方…

安裝

、添加一個新項目->選擇類庫模板->命名為DBCustomAction 2、單擊項目右鍵->添加新項->選擇安裝程序類(命名為DBCustomAction.cs) 3、在 服務器資源管理器中添加->連接到 數據庫->指定用戶密碼(選擇允許保存密碼)-> 數據庫選擇master 4、切換到DBCustomAct…

cad2016珊瑚_預測有馬的硬珊瑚覆蓋率

cad2016珊瑚What’s the future of the world’s coral reefs?世界珊瑚礁的未來是什么? In February of 2020, scientists at University of Hawaii Manoa released a study addressing this very question. The models they developed forecasted a 70–90% worl…

EChart中使用地圖方式總結(轉載)

EChart中使用地圖方式總結 2018年02月06日 22:18:57 來源:https://blog.csdn.net/shaxiaozilove/article/details/79274772最近在仿照EChart公交線路方向示例,開發表示排水網和污水網流向地圖,同時地圖上需要疊加排放口、污染源、污水處理廠等…

android mvp模式

越來越多人討論mvp模式,mvp在android應用開發中獲得更多的重視,這里說一下對MVP的簡單了解。 什么是 MVP? MVP模式使邏輯從視圖層分開,目的是我們在屏幕上怎么表現,和界面如何工作的所有事情就完全分開了。 View顯示數據&…

Node.js REPL(交互式解釋器)

2019獨角獸企業重金招聘Python工程師標準>>> Node.js REPL(交互式解釋器) Node.js REPL(Read Eval Print Loop:交互式解釋器) 表示一個電腦的環境,類似 Window 系統的終端或 Unix/Linux shell,我們可以在終端中輸入命令,并接收系統…

中國移動短信網關CMPP3.0 C#源代碼:使用示例

中國移動短信網關CMPP3.0 C#源代碼:使用示例 中國移動短信網關CMPP3.0 C#源代碼使用,在上一篇文章中我介紹過cmpp3.0,這段時間因為也做關于移動短信網關的開發,在這里給大家一個演示如何使用cmpp3.0開發移動短信網關。Using Tiray.SMS... Ti…

用python進行營銷分析_用python進行covid 19分析

用python進行營銷分析Python is a highly powerful general purpose programming language which can be easily learned and provides data scientists a wide variety of tools and packages. Amid this pandemic period, I decided to do an analysis on this novel coronav…

名稱

命名規則:Go中函數、變量、常量、類型、語句標簽和包的名稱都遵循一個規則,開頭是一個字母或下劃線,后面跟任意字符、數字和下劃線,并區分大小寫。例如:heapSort和HeapSort是不同名稱。關鍵字:Go有25個關鍵…

Alpha沖刺第二天

Alpha第二天 1.團隊成員 鄭西坤 031602542 (隊長) 陳俊杰 031602504陳順興 031602505張勝男 031602540廖鈺萍 031602323雷光游 031602319蘇芳锃 0316023302.項目燃盡圖 3.項目進展 時間工作內容11月18日UI設計、初步架構搭建11月19日UI設計、服務器的進一…

Tiray.SMSTiray.SMSTiray.SMSTiray.SMSTiray.SMSTiray.SMS

這是2005年6月云南移動短信網關升級到3.0時寫的,在SP那穩定運行了很長時間的。因為SP倒閉了,貼出來給有興趣的朋友參考。優點:支持多線程、滑動窗口、異步發送、全事件模式、自動識別ASCII、GBK、UCS-2缺點:不支持長短信自動分頁、…

水文分析提取河網_基于圖的河網段地理信息分析排序算法

水文分析提取河網The topic of this article is the application of information technologies in environmental science, namely, in hydrology. Below is a description of the algorithm for ranking rivers and the plugin we implemented for the open-source geographic…

請不要更多的基本情節

“If I see one more basic blue bar plot…”“如果我再看到一個基本的藍色條形圖……” After completing the first module in my studies at Flatiron School NYC, I started playing with plot customizations and design using Seaborn and Matplotlib. Much like doodl…

Powershell-獲取DHCP地址租用信息

需求&#xff1a;業務需要獲取現階段DHCP服務器所有地址租用信息。 1.首先查看DHCP相關幫助信息&#xff1a;2.確定執行命令并獲取相關幫助信息&#xff1a;help Get-DhcpServerv4Scope 名稱 Get-DhcpServerv4Scope 語法 Get-DhcpServerv4Scope [[-ScopeId] <ipaddress[]>…