sklearn 加州房價數據集 fetch_california_housing 出錯 403: Forbidden 修復方案

問題

加載加州房價數據時出現 403 錯誤 HTTP Error 403: Forbidden

from sklearn.datasets import fetch_california_housingcalifornia = fetch_california_housing()
print(california.target.shape) 

解決方案

運行下述代碼,然后再運行上述的 fetch_california_housing() 可成功運行

import requests
import os
import tarfile
import numpy as np
from types import SimpleNamespacefrom sklearn import datasets
# 參考: 
# https://blog.csdn.net/getalong/article/details/141201658
# https://inria.github.io/scikit-learn-mooc/python_scripts/datasets_california_housing.htmlfetch_california_housing_manual_desc = '''
.. _california_housing_dataset:California Housing dataset
--------------------------**Data Set Characteristics:**:Number of Instances: 20640:Number of Attributes: 8 numeric, predictive attributes and the target:Attribute Information:- MedInc        median income in block group- HouseAge      median house age in block group- AveRooms      average number of rooms per household- AveBedrms     average number of bedrooms per household- Population    block group population- AveOccup      average number of household members- Latitude      block group latitude- Longitude     block group longitude:Missing Attribute Values: NoneThis dataset was obtained from the StatLib repository.
https://www.dcc.fc.up.pt/~ltorgo/Regression/cal_housing.htmlThe target variable is the median house value for California districts,
expressed in hundreds of thousands of dollars ($100,000).This dataset was derived from the 1990 U.S. census, using one row per census
block group. A block group is the smallest geographical unit for which the U.S.
Census Bureau publishes sample data (a block group typically has a population
of 600 to 3,000 people).A household is a group of people residing within a home. Since the average
number of rooms and bedrooms in this dataset are provided per household, these
columns may take surprisingly large values for block groups with few households
and many empty houses, such as vacation resorts.It can be downloaded/loaded using the
:func:`sklearn.datasets.fetch_california_housing` function... rubric:: References- Pace, R. Kelley and Ronald Barry, Sparse Spatial Autoregressions,Statistics and Probability Letters, 33 (1997) 291-297
'''def download_file(url, directory, filename):# 確保目錄存在os.makedirs(directory, exist_ok=True)# 完整文件路徑filepath = os.path.join(directory, filename)# 下載文件response = requests.get(url, stream=True)response.raise_for_status()  # 檢查請求是否成功# 將內容寫入文件with open(filepath, 'wb') as file:for chunk in response.iter_content(chunk_size=8192):file.write(chunk)print(f"文件已下載到: {filepath}")def fetch_california_housing_manual():data_home = datasets.get_data_home()archive_path = os.path.join(data_home, 'cal_housing.tgz')if not os.path.exists(archive_path):download_file("https://www.dcc.fc.up.pt/~ltorgo/Regression/cal_housing.tgz", data_home, 'cal_housing.tgz')with tarfile.open(mode="r:gz", name=archive_path) as f:cal_housing = np.loadtxt(f.extractfile("CaliforniaHousing/cal_housing.data"), delimiter=",")# Columns are not in the same order compared to the previous# URL resource on lib.stat.cmu.educolumns_index = [8, 7, 2, 3, 4, 5, 6, 1, 0]cal_housing = cal_housing[:, columns_index]feature_names = ["MedInc","HouseAge","AveRooms","AveBedrms","Population","AveOccup","Latitude","Longitude",]target_names = ['MedHouseVal']target, data = cal_housing[:, 0], cal_housing[:, 1:]# avg rooms = total rooms / householdsdata[:, 2] /= data[:, 5]# avg bed rooms = total bed rooms / householdsdata[:, 3] /= data[:, 5]# avg occupancy = population / householdsdata[:, 5] = data[:, 4] / data[:, 5]# target in units of 100,000target = target / 100000.0result = {'data': data,'target': target,'feature_names': feature_names,'target_names': target_names,'DESCR': fetch_california_housing_manual_desc,}obj = SimpleNamespace(**result)return objcalifornia = fetch_california_housing_manual()
print(california.data)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/96652.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/96652.shtml
英文地址,請注明出處:http://en.pswp.cn/web/96652.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

嵌入式學習---(硬件)

1、在LED實驗中,在對Soc引腳配置時都做了哪些工作?復用功能配置操作寄存器:IOMUXC_SW_MUX_CTL_PAD_GPIO1_IO03將引腳的低 4 位設置為 0101,將引腳復用為 GPIO 功能電氣特性配置操作寄存器:IOMUXC_SW_PAD_CTL_PAD_GPIO1…

微信小程序開發教程(十一)

目錄:1.上拉觸底案例-初步實現上拉觸底效果2.上拉觸底案例-添加loading效果3.上拉觸底案例-節流處理4.擴展-自定義編譯模式1.上拉觸底案例-初步實現上拉觸底效果頁面加載的時候調用這個方法:設置樣式:下拉觸底后繼續調用獲取顏色的方法2.上拉…

Android相機API2,基于GLSurfaceView+SurfaceTexture實現相機預覽,集成的相機算法采用GPU方案,簡要說明

Android相機API2,基于GLSurfaceViewSurfaceTexture實現相機預覽,集成的相機算法采用GPU方案,簡要流程如下(不疊加相機算法的預覽顯示流程也大體如此,只是去掉了算法部分):進入相機:1,新建實現了…

[code-review] 日志機制 | `LOG_LEVEL`

第6章:日志機制(調試) 歡迎來到我們了解ChatGPT-CodeReview項目的最后一章 在第5章:文件過濾邏輯(范圍管理器)中,我們學習了機器人如何智能地決定哪些文件需要發送給AI審查。 但一旦機器人開…

n8n工作流平臺入門學習指南

目錄 1、基礎背景 2、核心概念 2.1 節點(Nodes) 2.2 連接(Connections) 2.3 工作流(Workflows) 3、常用節點說明 4、基于Docker快速部署 5、學習資料 6、常見問題 強烈推薦,大家不懂的直接問:N8N大師(GPT),科…

【Oracle經驗分享】字符串拼接過長問題的解決方案 —— 巧用 XMLAGG

📑 目錄🔍 問題背景?? 常見拼接方式的限制💡 XMLAGG 的解決方案📝 示例代碼📌 注意事項? 總結🔍 問題背景在日常開發中,我們經常需要把多行數據拼接成一個字符串。例如將某個字段的多條記錄拼…

AJAX入門-URL、參數查詢、案例查詢

本系列可作為前端學習系列的筆記,代碼的運行環境是在VS code中,小編會將代碼復制下來,大家復制下來就可以練習了,方便大家學習。 HTML、CSS、JavaScript系列文章 已經收錄在前端專欄,有需要的寶寶們可以點擊前端專欄查…

【SpringBoot】24 核心功能 - Web開發原理 -Spring Boot 異常處理機制

前言 在開發 Web 應用程序時,異常處理是一個至關重要的部分。Spring Boot 提供了一套強大的異常處理機制,使得開發者能夠輕松地處理和響應各種異常情況。本文將深入探討 Spring Boot 中的異常處理機制,包括默認的錯誤處理規則、定制錯誤處理邏…

JVM第一部分

PC寄存器:存儲的是數字 0, 3, 6, 10, 17 這樣的字節碼偏移量。 LineNumberTable:是一個映射表,它將上述的偏移量“翻譯”成我們程序員能看懂的源代碼行號。 JVM堆 JVM堆由兩部分組成:年輕代老年代 年輕代包括三部分:ed…

IDEA使用Maven和MyBatis簡化數據庫連接(配置篇)

目錄: Maven:簡化項目構建 MyBatis:簡化Jdbc Maven:是一款項目構建與依賴管理工具,核心作用是自動化項目編譯、打包等流程,并統一管理項目所需的第三方 Jar 包(如 MyBatis 的 Jar 包)。 MyBatis&#xf…

Java 泛型詳解:從基礎到高級應用

目錄 一、泛型的基本概念 為什么需要泛型? 二、泛型類與泛型接口 【1】定義泛型類 【2】定義泛型接口 三、泛型方法 四、泛型通配符 【1】無界通配符(?) 【2】上界通配符(? extends T) 【3】下界通配符&am…

嵌入式 Linux 啟動機制全解析:從 Boot 到 Rootfs

🚀 嵌入式 Linux 啟動機制全解析:從 Boot 到 Rootfs 在嵌入式系統中,Linux 的啟動流程不僅是內核加載的過程,更是 bootloader、設備樹、初始根文件系統、啟動配置文件等多個組件協同工作的結果。不同的文件系統和啟動方式會影響系…

Python 操作Office的PPT、Word、Excel,同時兼容WPS

文章目錄概要一、環境準備1. 安裝必要的Python庫2. 系統要求二、核心實現原理1. 檢測已安裝的Office類型2. 初始化對應的應用程序三、完整代碼實現四、使用示例五、WPS兼容處理詳解1. 形狀和文本框訪問兼容處理2. PPT圖片粘貼兼容處理3. 資源釋放的重要性六、圖片操作實現詳解1…

ISP之DHCPv6-PD(前綴代理)為用戶下發前綴

一、組網需求家庭用戶要使用IPv6地址接入互聯網。為方便用戶接入,運營商使用DHCPv6-PD的方式給家用路由器下發IPv6地址前綴,用戶路由器LAN側不需要手工指定鏈路的IPv6地址前綴,家用路由器可以給用戶終端自動配置IPv6地址和其它網絡參數。本例…

Django全棧班v1.04 Python基礎語法 20250912 上午

rm 刪除命令 注意:刪除操作是不可逆的,一旦刪除就無法撤銷,請謹慎使用。刪除文件: rm file.py遞歸刪除目錄: rm -r demo/強制刪除: rm -f file.py交互式刪除: rm -i *.txt課程定位 “學習Python…

Java 21 虛擬線程高并發落地:中間件適配、場景匹配與細節優化的技術實踐

作為 Java 21 的核心特性,虛擬線程(Virtual Thread)憑借 “用戶態調度”“輕量級資源占用” 的優勢,成為高并發場景下線程模型優化的重要方向。但在實際落地中,不少團隊會陷入 “技術用了卻沒效果” 的困境 ——QPS 提升有限、中間件調用阻塞、CPU 使用率異常升高。 本文…

數據庫在并發訪問時,不同隔離級別下臟讀幻讀問題

數據庫隔離級別并非安裝后就固定,絕大多數主流數據庫(如MySQL、PostgreSQL、SQL Server)都支持動態調整和運行中自定義,具體調整范圍可分為全局、會話和語句三個層級。 全局級別調整:修改數據庫配置文件(如…

JVM從入門到實戰:從字節碼組成、類生命周期到雙親委派及打破雙親委派機制

摘要:本文圍繞 Java 字節碼與類加載機制展開,詳解字節碼文件組成、類的生命周期,介紹類加載器分類、雙親委派機制及打破該機制的方式,還闡述了線程上下文類加載器與 SPI 機制在 JDBC 驅動加載中的應用,幫助深入理解 Ja…

多源最短路(Floyd算法

多源最短路簡介 多源最短路算法用于解決圖中任意兩節點間最短路徑的問題,廣泛應用于交通網絡、社交關系分析、路由優化等場景。與單源最短路(如Dijkstra)不同,它一次性計算所有節點對的最短距離,適合需要全局路徑規劃的…

【攻防實戰】記一次攻防實戰全流程

那天我向眾神祈禱,最后回答我的卻只有掙扎十年依舊不甘的自己!成功究竟是饋贈還是償還。 前言 網絡安全技術學習,承認??的弱點不是丑事,只有對原理了然于?,才能突破更多的限制。 擁有快速學習能力的安全研究員&…