記一次IP數據處理過程,文本(CSV文件)處理,IP解析

個人博客:無奈何楊(wnhyang)

個人語雀:wnhyang

共享語雀:在線知識共享

Github:wnhyang - Overview


起因

突然接收到XX給的任務,要將一批IP數據處理一下,將IP對應的省市區解析出來,很急!

已知我這邊有一個IP解析接口,提供了IP解析到國家省市區ISP等的能力,而且支持批量查詢,但問題是僅僅有接口的形式,沒有管理應用將接口利用起來,要使用的恐怕也只能是發接口,而且XX提供的數據有極大可能是Excel格式。另外XX沒有說明解析后的數據怎么給出來,如果是Excel最好就是將數據放在一行標記為省市區就好。這么看來只能是臨時開發來完成了,經過分析此時已經有了大致的思路了。

果然!拿到的數據是xls格式,大致如下。共有幾百條。

abcip
123234345127.0.0.1

那就動手開發吧!從接受到任務到結束大概用了40分鐘,這不是炫耀什么,畢竟使用AI可能會更快更好,但這畢竟是臨時做的,完成的也還可以,我還挺欣慰的。

思路

任何臨時緊急的任務,第一目標都應該在時間要求內是完成它,所以總體思路就是先完成后優化。

其實做起來也很簡單

1、整理原始數據,也可以叫做數據清理。

2、讀IP數據

3、整合請求,發接口進行IP解析

4、解析數據補充在原數據上

5、輸出

這里提供了示例數據,IP數據來源于在線ip地址隨機生成器 - JSON中文網,其他數據都是隨機生成,一共270條。

📎示例IP.xlsx

image

關于接口,這里只能用一些開放的IP解析接口了,這里用的是https://api.vvhan.com/api/ipInfo?ip=58.154.0.0。

image

使用如上圖所示。

image

開始

原數據處理

本身數據很完整,所以這個步驟就沒有什么參考意義了。

關于文件格式,不管是xls還是xlsx都屬于微軟Ecxel標準的電子表格格式,或擴展。都已經進行Office文件處理的范疇了,相比于簡單的文本處理還是麻煩了點,這里為了方便將其另存為csv文件,進行文本處理。

image

工具上使用CSV文件處理工具-CsvUtil。

這里需要注意了,使用csv工具處理的文本,需要有行頭,所以在第一行加入了id,ip,用于讀取。

一些實體類

讀取csvJavaBean如下。

@Data
public class IpItem {private String id;private String ip;@Alias("國家")private String country;@Alias("省份")private String prov;@Alias("城市")private String city;
}

以上已將說明了要使用https://api.vvhan.com/api/ipInfo?ip=58.154.0.0作本次示例,響應報文如下。

{"success": true,"ip": "58.154.0.0","info": {"country": "中國","prov": "遼寧省","city": "沈陽市","isp": "教育網"}
}

這里可以使用JSONJavaBean的工具,不管是GsonFormatPlus插件還是其他在線工具都可以。

GsonFormatPlus - IntelliJ IDEs Plugin | Marketplace

JSON轉JAVA實體|在線JSON轉JavaBean工具 - JSON中文網

由此得到IpRespDTOIpInfo

@Data
public class IpRespDTO {private Boolean success;private String ip;private IpInfo info;
}
@Data
public class IpInfo {private String country;private String prov;private String city;private String isp;
}

因為此接口請求比較簡單,所以就沒有額外的請求類了。

請求接口方式

關于方式,之前我有兩篇文章可以參考,這里使用OpenFeign

Spring6.1新特性,四種方式調用REST接口(RestClient、WebClient、RestTemplate、HTTP Interface)

Spring6|Spring Boot3有哪些HTTP客戶端可以選擇

<dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-openfeign</artifactId>
</dependency>
@FeignClient(name = "ipAnalysisFeignService", url = "https://api.vvhan.com/api")
public interface IpAnalysisFeignService {@GetMapping("/ipInfo")IpRespDTO getIpInfo(@RequestParam("ip") String ip);
}

數據處理與輸出

@Slf4j
@SpringBootTest
public class IpAnalysisFeignServiceTest {@Resourceprivate IpAnalysisFeignService ipAnalysisFeignService;@Testvoid getIpInfo() {List<IpItem> ipItemList = CsvUtil.getReader().read(ResourceUtil.getUtf8Reader("示例IP.csv"), IpItem.class);ipItemList.forEach(ipItem -> {IpRespDTO ipRespDTO = ipAnalysisFeignService.getIpInfo(ipItem.getIp());log.info("ip:{},info:{}", ipItem.getIp(), ipRespDTO);if (ipRespDTO.getSuccess()) {IpInfo info = ipRespDTO.getInfo();ipItem.setCountry(info.getCountry()).setProv(info.getProv()).setCity(info.getCity());}});CsvWriter writer = CsvUtil.getWriter("/Users/wnhyang/Downloads/testWrite.csv", CharsetUtil.CHARSET_UTF_8);writer.writeBeans(ipItemList);}
}

日志如下,共花費了43秒,沒辦法這是開放的接口,性能確實差了點,而且是270次請求。

image

輸出文件如下,好吧,一些ip可能解析不到,但也是完成了任務。

image

結束

當時一共用了40分鐘左右,你可能講了,用Java進行數據處理?咋不用Python?能合并請求嗎?能不能再優化一下?

確實有優化的地方,但是開頭我也講了,臨時緊急任務第一目標是在時間要求內完成,在完成后可以再思考優化。

而且,順帶提一點,平常可以做一些積累,在面對復雜的緊急任務時就會很從容了。https://github.com/wnhyang)

寫在最后

拙作艱辛,字句心血,望諸君垂青,多予支持,不勝感激。


個人博客:無奈何楊(wnhyang)

個人語雀:wnhyang

共享語雀:在線知識共享

Github:wnhyang - Overview

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/45509.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/45509.shtml
英文地址,請注明出處:http://en.pswp.cn/web/45509.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

PHP基礎語法

PHP 腳本在服務器上執行&#xff0c;然后將純 HTML 結果發送回瀏覽器。 基本的 PHP 語法 PHP 腳本可以放在文檔中的任何位置。 PHP 腳本以 <?php 開始&#xff0c;以 ?> 結束&#xff1a; <?php // PHP 代碼 ?> PHP 文件的默認文件擴展名是 .php。 PHP 文…

PHP智云物業管理平臺微信小程序系統源碼

?&#x1f3e0;智云物業管理新紀元&#xff01;微信小程序&#xff0c;讓家園管理更智慧&#x1f4f1; &#x1f3e1;【開篇&#xff1a;智慧生活&#xff0c;從物業開始】&#x1f3e1; 在快節奏的現代生活中&#xff0c;我們追求的不僅僅是家的溫馨&#xff0c;更是生活的…

基于hive數據庫的泰坦尼克號幸存者數據分析

進入 ./beeline -u jdbc:hive2://node2:10000 -n root -p 查詢 SHOW TABLES; 刪除 DROP TABLE IF EXISTS tidanic; 上傳數據 hdfs dfs -put train.csv /user/hive/warehouse/mytrain.db/tidanic 《泰坦尼克號幸存者數據分析》 1、原始數據介紹 泰坦尼克號是當時世界上…

達夢數據庫系列—28. 主備集群高可用測試

目錄 監視器關閉 監視器啟動&#xff0c;Detach備庫 主備正常&#xff0c;手動switchover 主庫故障&#xff0c;自動switchover 主庫故障&#xff0c;手動Takeover 主庫故障&#xff0c;備庫強制takeover 主庫重啟 備庫故障 公網連接異常 主庫私網異常 備庫私網異常…

實現給Nginx的指定網站開啟basic認證——http基本認證

一、問題描述 目前我們配置的網站內容都是沒有限制&#xff0c;可以讓任何人打開瀏覽器都能夠訪問&#xff0c;這樣就會存在一個問題&#xff08;可能會存在一些惡意訪問的用戶進行惡意操作&#xff0c;直接訪問到我們的敏感后臺路徑進行操作&#xff0c;風險就會很大&#xff…

云原生周刊:Score 成為 CNCF 沙箱項目|2024.7.15

開源項目 Trident Trident 是由 NetApp 維護的全面支持的開源項目。它從頭開始設計&#xff0c;旨在通過行業標準接口&#xff08;如容器存儲接口 CSI&#xff09;幫助您滿足容器化應用程序對持久性存儲的需求。 Monokle Monokle 通過提供用于編寫 YAML 清單、驗證策略和管…

淺談微服務

技術方法論&#xff1a;向微服務邁進&#xff1a; 理論&#xff1a;“軟件研發中任何一項技術、方法、架構都不可能是銀彈"—Fred Brooks 哪些場景適合用微服務&#xff0c;呢些不適用&#xff1f;&#xff08;微服務存在哪些理解誤區、應用前提&#xff09; 一些被驗證過…

Why can‘t I access GPT-4 models via API, although GPT-3.5 models work?

題意&#xff1a;為什么我無法通過API訪問GPT-4模型&#xff0c;盡管GPT-3.5模型可以工作&#xff1f; 問題背景&#xff1a; Im able to use the gpt-3.5-turbo-0301 model to access the ChatGPT API, but not any of the gpt-4 models. Here is the code I am using to tes…

【雷豐陽-谷粒商城 】【分布式高級篇-微服務架構篇】【22】【RabbitMQ】

持續學習&持續更新中… 守破離 【雷豐陽-谷粒商城 】【分布式高級篇-微服務架構篇】【22】【RabbitMQ】 Message Queue 消息隊列異步處理應用解耦流量控制 消息中間件概念RabbitMQ概念MessagePublisherExchangeQueueBindingConnectionChannelConsumerVirtual HostBroker圖…

Django prefetch_related()方法

prefetch_related的作用 prefetch_related()是 Django ORM 中用于優化查詢性能的另一個重要方法&#xff0c;尤其在處理多對多&#xff08;ManyToMany&#xff09;關系和反向關系時非常有用。它允許你預加載相關對象&#xff0c;從而減少數據庫查詢次數。 1&#xff0c;創建應…

【香橙派】Orange pi AIpro開發板使用之一鍵部署springboot項目

前言 最近有幸收到一份新款 OrangePi AIpro 開發板&#xff0c;之前手里也搗鼓過一些板子&#xff0c;這次嘗試從零開始部署一個簡單的后端服務。OrangePi AIpro 采用昇騰AI技術路線&#xff0c;具體為4核64位處理器AI處理器&#xff0c;可配16GB內存容量&#xff0c;各種復雜應…

數字化賦能,加油小程序讓出行更便捷高效

在快節奏的現代生活中&#xff0c;每一次加油不僅是車輛續航的必要步驟&#xff0c;也成為了人們日常生活中不可或缺的一環。隨著科技的飛速發展&#xff0c;傳統加油模式正逐步向智能化、便捷化轉型&#xff0c;其中&#xff0c;加油小程序作為這股浪潮中的佼佼者&#xff0c;…

el-date-picker手動輸入日期,通過設置開始時間和階段自動填寫結束時間

需求&#xff1a;根據開始時間&#xff0c;通過填寫階段時長&#xff0c;自動填寫結束時間&#xff0c;同時開始時間和節數時間可以手動輸入 代碼如下&#xff1a; <el-form ref"ruleForm2" :rules"rules2" :model"formData" inline label-po…

B樹與B+樹的區別

B樹和B樹都是用于數據庫和文件系統的平衡樹數據結構&#xff0c;但它們有一些顯著的區別&#xff1a; 節點結構&#xff1a; B樹&#xff1a;每個節點存儲數據和指向子節點的指針。葉子節點也包含數據。 B樹&#xff1a;內部節點只存儲索引值&#xff0c;不存儲實際數據。所有…

yolov5 上手

0 介紹 YOLO(You Only Look Once)是一種流行的物體檢測和圖像分割模型&#xff0c;由華盛頓大學的約瑟夫-雷德蒙&#xff08;Joseph Redmon&#xff09;和阿里-法哈迪&#xff08;Ali Farhadi&#xff09;開發。YOLO 于 2015 年推出&#xff0c;因其高速度和高精確度而迅速受到…

人工智能算法工程師(中級)課程13-神經網絡的優化與設計之梯度問題及優化與代碼詳解

大家好&#xff0c;我是微學AI&#xff0c;今天給大家介紹一下人工智能算法工程師(中級)課程13-神經網絡的優化與設計之梯度問題及優化與代碼詳解。 文章目錄 一、引言二、梯度問題1. 梯度爆炸梯度爆炸的概念梯度爆炸的原因梯度爆炸的解決方案 2. 梯度消失梯度消失的概念梯度…

vue2中父組件向子組件傳值不更新視圖問題解決

1. 由于父組件更新了props里面的值, 但是子組件第一次接收后再修改沒有監聽到. 父組件修改值的時候使用this$set解決問題. 在 Vue 2 中&#xff0c;this.$set 通常用于更新數組中的特定元素。如果你想更新整個數組&#xff0c;可以直接賦值一個新的數組&#xff0c;或者你可以…

powerdesigner導出表數據庫設計文檔excel

1、連接數據庫&#xff0c;導出表結構的sql腳本 2、打開powerdesigner&#xff0c;生成項目空間表 sql腳本用第一步的腳本 3、用script腳本生成excel 腳本信息 Option Explicit Dim rowsNum rowsNum 0 -------------------------------------------------------------…

CV12_ONNX轉RKNN模型(諦聽盒子)

暫時簡單整理一下&#xff1a; 1.在邊緣設備上配置相關環境。 2.配置完成后&#xff0c;獲取模型中間的輸入輸出結果&#xff0c;保存為npy格式。 3.將onnx格式的模型&#xff0c;以及中間輸入輸出文件傳送到邊緣設備上。 4.編寫一個python文件用于轉換模型格式&#xff0c…

Git---git本地配置commit_template提交模板,規范開發

如何在Git中配置Commit Template以規范開發 在軟件開發過程中&#xff0c;規范化的提交信息&#xff08;commit messages&#xff09;對于項目的可維護性和協作效率至關重要。Git 提供了配置 commit template 的功能&#xff0c;允許開發者預設一個模板&#xff0c;用于在提交…