python線性回歸算法簡介_Python實現的簡單線性回歸算法實例分析

本文實例講述了Python實現的簡單線性回歸算法。分享給大家供大家參考,具體如下:

用python實現R的線性模型(lm)中一元線性回歸的簡單方法,使用R的women示例數據,R的運行結果:

> summary(fit)

Call:

lm(formula = weight ~ height, data = women)

Residuals:

Min 1Q Median 3Q Max

-1.7333 -1.1333 -0.3833 0.7417 3.1167

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -87.51667 5.93694 -14.74 1.71e-09 ***

height 3.45000 0.09114 37.85 1.09e-14 ***

---

Signif. codes: 0 ‘***' 0.001 ‘**' 0.01 ‘*' 0.05 ‘.' 0.1 ‘ ' 1

Residual standard error: 1.525 on 13 degrees of freedom

Multiple R-squared: 0.991, Adjusted R-squared: 0.9903

F-statistic: 1433 on 1 and 13 DF, p-value: 1.091e-14

python實現的功能包括:

計算pearson相關系數

使用最小二乘法計算回歸系數

計算擬合優度判定系數R2R2

計算估計標準誤差Se

計算顯著性檢驗的F和P值

import numpy as np

import scipy.stats as ss

class Lm:

"""簡單一元線性模型,計算回歸系數、擬合優度的判定系數和

估計標準誤差,顯著性水平"""

def __init__(self, data_source, separator):

self.beta = np.matrix(np.zeros(2))

self.yhat = np.matrix(np.zeros(2))

self.r2 = 0.0

self.se = 0.0

self.f = 0.0

self.msr = 0.0

self.mse = 0.0

self.p = 0.0

data_mat = np.genfromtxt(data_source, delimiter=separator)

self.xarr = data_mat[:, :-1]

self.yarr = data_mat[:, -1]

self.ybar = np.mean(self.yarr)

self.dfd = len(self.yarr) - 2 # 自由度n-2

return

# 計算協方差

@staticmethod

def cov_custom(x, y):

result = sum((x - np.mean(x)) * (y - np.mean(y))) / (len(x) - 1)

return result

# 計算相關系數

@staticmethod

def corr_custom(x, y):

return Lm.cov_custom(x, y) / (np.std(x, ddof=1) * np.std(y, ddof=1))

# 計算回歸系數

def simple_regression(self):

xmat = np.mat(self.xarr)

ymat = np.mat(self.yarr).T

xtx = xmat.T * xmat

if np.linalg.det(xtx) == 0.0:

print('Can not resolve the problem')

return

self.beta = np.linalg.solve(xtx, xmat.T * ymat) # xtx.I * (xmat.T * ymat)

self.yhat = (xmat * self.beta).flatten().A[0]

return

# 計算擬合優度的判定系數R方,即相關系數corr的平方

def r_square(self):

y = np.mat(self.yarr)

ybar = np.mean(y)

self.r2 = np.sum((self.yhat - ybar) ** 2) / np.sum((y.A - ybar) ** 2)

return

# 計算估計標準誤差

def estimate_deviation(self):

y = np.array(self.yarr)

self.se = np.sqrt(np.sum((y - self.yhat) ** 2) / self.dfd)

return

# 顯著性檢驗F

def sig_test(self):

ybar = np.mean(self.yarr)

self.msr = np.sum((self.yhat - ybar) ** 2)

self.mse = np.sum((self.yarr - self.yhat) ** 2) / self.dfd

self.f = self.msr / self.mse

self.p = ss.f.sf(self.f, 1, self.dfd)

return

def summary(self):

self.simple_regression()

corr_coe = Lm.corr_custom(self.xarr[:, -1], self.yarr)

self.r_square()

self.estimate_deviation()

self.sig_test()

print('The Pearson\'s correlation coefficient: %.3f' % corr_coe)

print('The Regression Coefficient: %s' % self.beta.flatten().A[0])

print('R square: %.3f' % self.r2)

print('The standard error of estimate: %.3f' % self.se)

print('F-statistic: %d on %s and %s DF, p-value: %.3e' % (self.f, 1, self.dfd, self.p))

python執行結果:

The Regression Coefficient: [-87.51666667 3.45 ]

R square: 0.991

The standard error of estimate: 1.525

F-statistic: 1433 on 1 and 13 DF, p-value: 1.091e-14

其中求回歸系數時用矩陣轉置求逆再用numpy內置的解線性方程組的方法是最快的:

a = np.mat(women.xarr); b = np.mat(women.yarr).T

timeit (a.I * b)

99.9 μs ± 941 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

timeit ata.I * (a.T*b)

64.9 μs ± 717 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

timeit np.linalg.solve(ata, a.T*b)

15.1 μs ± 126 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

更多關于Python相關內容感興趣的讀者可查看本站專題:《Python數學運算技巧總結》、《Python數據結構與算法教程》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》及《Python入門與進階經典教程》

希望本文所述對大家Python程序設計有所幫助。

本文標題: Python實現的簡單線性回歸算法實例分析

本文地址: http://www.cppcns.com/jiaoben/python/248466.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/276643.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/276643.shtml
英文地址,請注明出處:http://en.pswp.cn/news/276643.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Object/Relation Mapping 對象關系映射

對象-關系映射(Object/Relation Mapping,簡稱ORM),是隨著面向對象的軟件開發方法發展而產生的。面向對象的開發方法是當今企業級應用開發環境中的主流開發方法,關系數據庫是企業級應用環境中永久存放數據的主流數據存儲…

FastReport使用方法(C/S版)

前言 這兩天群里一直有群友問一些關于FastReport的問題,結合他們的問題,在這里做一個整理,有不明白的可以加 FastReport 交流群 群 號:554714044 工具 VS2017 FastReport 開始 1.新建項目,添加三個按鈕。預覽、設計、…

如何設置Linux時區為東八區

當我們購買美國VPS或服務器的時候,默認情況下是美國時間。對于我們定時執行某些任務會帶來麻煩,所以需要設置時區為東八區。登錄SSH后,執行tzselect命令。我們這里選擇亞洲5.這里選擇china 9。一般選東八區(北京,廣東&…

python刪除兩個excel表中的相同元素_python篩選出兩個文件中重復行的方法

查找A文件中&#xff0c;與B文件中內容不重復的內容#!usr/bin/python import sys import os字符串查找函數&#xff0c;使用二分查找法在列表中進行查詢def binarySearch(value, lines): right len(lines) - 1 left 0 a value.strip() while left < right: middle int((…

求解:nhibernate2.0操作oralce提交事務時報錯

代碼如下: Configuration config new Configuration(); config.AddAssembly("TestCleanSnow"); ISessionFactory factory config.BuildSessionFactory(); ISession session f…

python畫楓葉_python-文件的操作

一、異常 程序在運行的過程中&#xff0c;不可避免出現一些錯誤&#xff0c;這些錯誤成為異常 異常以后的代碼都不會被執行 try 語句 代碼塊&#xff08;可能出現錯誤的語句&#xff09; except 異常類型 as 異常名: 代碼塊(出錯以后執行的語句&#xff09; except 異常類型 as…

記2018年技術人一次短暫的創業

背景 2018年8月底&#xff0c;我全職加入了一家創業公司&#xff0c;具體做什么我暫時先不說吧&#xff0c;我是產品和技術負責人&#xff0c;自己出資了50w&#xff0c;大股東&#xff08;下面簡稱T)也就是ceo是早期阿里出身的中供銷售&#xff0c;從2017年11月開始成立此公司…

如何在Apache環境下配置Rewrite規則

原文鏈接&#xff1a;http://faq.comsenz.com/viewnews-12 URL 靜態化是一個利于搜索引擎的設置&#xff0c;通過 URL 靜態化&#xff0c;達到原來是動態的 PHP 頁面轉換為靜態化的 HTML 頁面&#xff0c;當然&#xff0c;這里的靜態化是一種假靜態&#xff0c;目的只是提高搜…

情 人 節 快 樂

我不善于用詞匯修飾我的句子&#xff0c; 我不善于用表情表達我的心情&#xff0c; 我不善于解讀你那黯然的情緒&#xff0c; 我不善于去響應你小小的呼應&#xff0c; 雖然&#xff0c;你了解我&#xff0c; 你寬容于我&#xff0c; 你聽我訴說&#xff0c; 你陪伴著我…

Windows 10系統安裝JDK1.8與配置環境

第一步&#xff1a;下載JDK1.8 地址:https://www.oracle.com/index.html 第二步&#xff1a; 安裝分兩次&#xff0c;第一次是安裝 jdk &#xff0c;第二次是安裝 jre 。安裝jdk默認的安裝地址為C盤&#xff0c;安裝目錄 \java 之前的目錄修改成你想放的目錄&#xff1b;安裝jr…

python3函數調用時間_Python3 time clock()方法

Python3 time clock()方法 描述 Python 3.8 已移除 clock() 方法 可以使用 time.perf_counter() 或 time.process_time() 方法替代。 Python time clock() 函數以浮點數計算的秒數返回當前的CPU時間。用來衡量不同程序的耗時&#xff0c;比time.time()更有用。 這個需要注意&am…

給apache安裝mod_rewrite模塊

給apache安裝mod_rewrite模塊 原文鏈接&#xff1a;http://opkeep.com/system/linux/apache_mod_rewrite.html 只是用來做參考,相關情況可跟據自己的需求進行修改 如果你的服務器apache還沒有安裝&#xff0c;那很簡單&#xff0c;在編譯apache時將mod_rewrite模塊編譯進去就可…

Oracle9i 問題匯總--不斷更新中

1.創建數據表時&#xff0c;用戶表空間不足&#xff0c;解決方法 ALTER USER USERNAME QUOTA UNLIMITED ON USERS 2.避免在On條件上使用字符串串連 或者 函數。 如&#xff1a;ON 0||S.LIST_NOMS.EXTEND_FIELD 以上SQL語句會造成查詢嚴重變慢&#xff0c;如果非要使用請使用&…

武漢區塊鏈軟件公司:區塊鏈游戲和普通的游戲有什么區別?

武漢區塊鏈軟件公司:區塊鏈游戲和普通的游戲有什么區別&#xff1f;最近&#xff0c;各公鏈DAPP的開發呈迸發之勢&#xff0c;其中有虛擬財物使用的游戲就天然有上鏈的優勢。區塊鏈游戲也被認為是繼金融范疇之后第二個取得區塊鏈落地使用場景范疇。為什么游戲類DAPP能得到快速展…

git安裝與配置_git 安裝及基本配置

git 基本上來說是開發者必備工具了&#xff0c;在服務器里沒有 git 實在不太能說得過去。何況&#xff0c;沒有 git 的話&#xff0c;面向github編程 從何說起&#xff0c;如同一個程序員斷了左膀右臂。你對流程熟悉后&#xff0c;只需要一分鐘便可以操作完成原文地址: 服務器 …

Apache偽靜態學習

原文鏈接&#xff1a;http://www.benben.cc/blog/?p305 Apache中有著這樣一個模塊&#xff0c;它默默無聞&#xff0c;卻是URL操作的瑞士軍刀&#xff01;有人這樣評價它&#xff1a;“盡管它的例子和文檔數量可以以噸來計算&#xff0c;但它仍然是巫術&#xff0c;該死的巫術…

不同的容器里實現 RadioButton的單選

請教一個各位牛人一個問題&#xff0c;如圖&#xff1a; &#xff08;問題解決&#xff0c;見后面的解決方案~~&#xff09; 怎么在不同的winform容器(GroupBox)里實現 RadioButton &#xff08;如圖中兩個“詳細照會”&#xff09;的單選&#xff0c;請各位牛人給出實現的思…

html調用接口_搜狗ocr識別接口

詳細情況在代碼中說明&#xff0c;如果不想自己使用TensorFlow&#xff0c;可使用下面接口這是要識別的圖片&#xff1a;最終識別的結果&#xff1a;This is a lot of 12 point text to test theocr code and see if it works on all typesof file format.The quick brown dog …

CSAcademy Or Problem

傳送門 一口大鍋&#xff08; 斜率的確是有單調性 并且可以進行凸優化的 明明是證出來的 為什么自己就不相信呢&#xff08; 我們發現對于當前點作為擴展的右端點 那么他前面至多有20個點會影響到這一段區間的或值 我們可以預處理記錄出來這些節點的位置 很明顯 答案隨著右端點…

apache的rewrite模塊實例操作

原文鏈接&#xff1a;http://blog.5ilinux.com/archives/2006/01/apacherewrite.html 我們的目標是把http://www.bulknews.cn/show.php?id1014700通過rewrite的url重寫&#xff0c;使可以直接http://www.bulknews.cn/1014700.html訪問 1.首先配置apache的httpd.conf&#xf…