Java讀取HTML傳人文件,java讀取html文件并獲取body中所有的標簽及內容的案例.pdf

java讀讀取取html文文件件,并并獲獲取取body中中所所有有的的標標簽簽及及內內容容的的案案例例

這里的獲取的是html文件中body 中的所有標簽以及內容

package com.lmt.service.file;

import java.io.BufferedReader;

import java.io.File;

import java.io.FileInputStream;

import java.io.InputStreamReader;

import java.io.Reader;

import org.springframework.stereotype.Component;

import com.lmt.config.UrlConstants;

Component

public class ParseFile {

/**

* 解析html文件

* param file

* return

*/

public String readHtml(File file){

String body = "";

try {

FileInputStream iStream = new FileInputStream(file);

Reader reader = new InputStreamReader(iStream);

BufferedReader htmlReader = new BufferedReader(reader);

String line;

boolean found = false;

while (!found && (line = htmlReader.readLine()) != null) {

if (line.toLowerCase().indexOf("

的前面可能存在空格

found = true;

}

}

found = false;

while (!found && (line = htmlReader.readLine()) != null) {

if (line.toLowerCase().indexOf("

found = true;

} else {

// 果存在圖片,則將相對路徑轉換為絕對路徑

String lowerCaseLine = line.toLowerCase();

if (lowerCaseLine.contains("src")) {

//這里是定義圖片的訪問路徑

String directory = "D:/test";

// 果路徑名不以反斜杠結尾,則手動添加反斜杠

/*if (!directory.endsWith("\\")) {

directory = directory + "\\";

}*/

// line = line.substring(0, lowerCaseLine.indexOf("src") + 5) + directory +

line.substring(lowerCaseLine.indexOf("src") + 5);

/*String filename = extractFilename(line);

line = line.substri

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/538111.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/538111.shtml
英文地址,請注明出處:http://en.pswp.cn/news/538111.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

插件translator_Zotero Jasminum 插件的更新記錄

Jasminum 插件發布后 林知:簡單的Zotero CNKI 中文插件?zhuanlan.zhihu.com受到一些同學的關注,同時也收到許多反饋。我寫這個插件的初衷就是想讓大家在Zotero上能更方便的使用知網,尤其是人文社科相關專業的同學,他們尤其依賴中…

Tomcat的三個端口

8005 <Server port"8005" shutdown"SHUTDOWN"> 關閉tomcat通信接口 8009 <Connector port"8009" protocol"AJP/1.3" redirectPort"8443"/> 與其他http服務器通信接口&#xff0c;用于http服務器集合 8080…

計算機一級考試word題主要,2017年計算機一級考試word題及答案

1 / 7 2017 年計算機一級考試 及答案 計算機還是人們的學習工具和生活工具。借助家用計算機、個人計算機、計算機網、數據庫系統和各種終端設備&#xff0c;那么 2017 年計算機一級考試 及答案有哪一些 ?下面是 才小編收集整理的 2017 年計算機一級考試 及答案&#xff0c;歡迎…

ubuntu18.04 用xhell連接失敗

ifconfig命令有用之后&#xff0c;又發現xhell連接不上ubuntu18.04版本的虛擬機&#xff0c;原因是ubuntu18.04默認沒有安裝ssh服務。 使用以下命令安裝 sudo apt-get install openssh-server 安裝完成后,啟動ssh服務 sudo /etc/init.d/ssh start 查看ssh進程&#xff0c;若出現…

extjs中元數據_json – 如何配置ExtJS 4 Store(代理和閱讀器)來讀取元數據

我的問題是除了totalRecords之外如何獲取元數據,在我的例子中它是版本,代碼,searchquery(請查看json).{"result": {"version":"1","code":"200","searchquery": "false","totalRecords": &qu…

伍德里奇計量經濟學第五版第四章計算機操作,伍德里奇計量經濟學第四章

伍德里奇計量經濟學第四章2016年10?25? 星期? 下午10:21 Page 1User: ?建英name: log: /Users/wangjianying/Desktop/Chapter 4 Computer exercise.smcllog type: smclopened on: 25 Oct 2016, 22:20:411. do "/var/folders/qt/0wzmrhfd3rb93j2h5hhtcwqr0000gn/T//SD1…

2018百度之星程序設計大賽 - 資格賽 1002 子串查詢

子串查詢 Accepts: 1262 Submissions: 5335 Time Limit: 3500/3000 MS (Java/Others) Memory Limit: 262144/262144 K (Java/Others) Problem Description 度度熊的字符串課堂開始了&#xff01;要以像度度熊一樣的天才為目標&#xff0c;努力奮斗哦&#xff01; 為了檢驗你是否…

mysql sleep詳解_MySQL中sleep函數的特殊現象示例詳解

前言MySQL中的系統函數sleep&#xff0c;實際應用的場景不多&#xff0c;一般用來做實驗測試&#xff0c;昨天在測試的時候&#xff0c;意外發現sleep函數的一個特殊現象。如果在查詢語句中使用sleep函數&#xff0c;那么休眠的時間跟返回的記錄有關。如下測試所示&#xff1a;…

使用maven構建dubbo服務的可執行jar包

maven 項目結構 <build><!-- 使用dubbo推薦的方法&#xff0c;打包成jar&#xff0c;調用main方法啟動 --><finalName>admin-service-user</finalName><resources><resource><targetPath>${project.build.directory}/classes</ta…

計算機網絡安全應具備的功能,2016計算機專業知識:網絡系統安全體系具備功能攻擊方法...

【導讀】為了幫助廣大考生更好的備考&#xff0c;中公事業單位考試網提供2016年計算機專業知識《網絡系統安全體系具備功能攻擊方法》學習&#xff0c;為考生定制計算機基礎知識復習計劃。一、網絡系統安全體系具備功能1.訪問控制;2.檢查安全漏洞;3.攻擊監控;4.加密通訊;5.認證…

Linux的標準I/O和管道

標準輸入輸出與管道 1、標準輸入和輸出程序&#xff1a;指令數據指令&#xff1a;計算、加減乘除數據&#xff1a;輸入數據、輸出數據2、在Linux中每一個打開的文件都會分配一個當前進程中唯一的文件描述符&#xff0c;用來標識文件的狀態fd:file descripor3、Linux提供給程序…

頁面url帶參數_微信小程序云開發教程微信小程序的JS高級頁面間數據傳遞

同學們大家好&#xff0c;我是小伊同學&#xff0c;上一節課我們講解了全局數據的讀寫方法&#xff0c;那么在頁面間同樣需要數據交互&#xff0c;今天我們就來學習這部分內容。在微信小程序中&#xff0c;我們常常需要將數據在頁面之間進行傳遞&#xff0c;比如用戶的身份信息…

軟件測試員對英語,軟件測試工程師英語面試題

以下是軟件測試工程師部分英語面試中的參考回答&#xff0c;僅提參考&#xff1a;Interview English&#xff1a;一&#xff0c;Why are you interested in working for our company?1。Because your company has a good sales record.2。Because your operations are global,…

OpenGL——二維幾何變換

平移、旋轉、縮放的實現 #include<iostream> #include <math.h> #include<Windows.h> #include <GL/glut.h>using namespace std;GLsizei winWidth 600, winHeight 600;GLfloat xwcMin 0.0, xwcMax 225.0; GLfloat ywcMin 0.0, ywcMax 225.0;cla…

在Eclipse 中打開當前文件夾

原文連接&#xff1a;https://www.cnblogs.com/panie2015/p/5985053.html ------------------------------------------------------------------------ 最近試過好多次&#xff0c;安裝插件來 在Eclipse 中打開當前文件所在文件夾&#xff0c;結果總是不甚如意。 煩躁了&…

清華大學計算機系主任應明生,清華大學計算機科學與技術系導師簡介:應明生...

對考生而言&#xff0c;充分了解高校、專業以及師資情況是一項最基礎、最關鍵的工作。以下是中公考研小編為大家整理的“清華大學計算機科學與技術系導師簡介&#xff1a;應明生”的相關信息&#xff0c;希望對同學們有所幫助。姓名&#xff1a;應明生職稱&#xff1a;教授郵件…

在VS2013平臺下如何快速解決c++代碼內存泄漏問題

在學習FPS3000人臉關鍵點定位算法時&#xff0c;發現github上的源碼&#xff0c;存在大量的內存泄漏問題&#xff0c;在訓練的時發現內存一直在增長&#xff0c;測試的時候也存在內存無法徹底釋放的問題。 一直以為是存放模型參數vector<class>結構的問題&#xff0c; 采…

python請簡述構造函數和析構函數的作用_python – 構造函數和析構函數如何工作?...

我正在嘗試理解這段代碼&#xff1a;class Person:Represents a person population 0def __init__(self,name)://some statements and population 1def __del__(self)://some statements and population - 1def sayHi(self):grettings from personprint Hi My name is %s % s…

服務器應用日志清理,Linux下Tomcat日志定期清理

服務器上的tomcat的catalina.out文件越來越大&#xff0c;查看起來很不方便&#xff0c;以前每次都是想起來的時候手工清理一下(cat /dev/null > catalina.out)&#xff0c;后來發現了logratate這個工具&#xff0c;Ubuntu下的mysql,nginx好像也是用的這個工具還定期整理log…

dubbo簡易監控中心安裝

dubbo簡易監控中心也是dubbo服務應用。 為什么叫“簡易”&#xff1f;這是阿里巴巴定義的&#xff0c;意思是功能不多但夠用&#xff0c;可以自己擴展。 1、下載dubbo源碼&#xff0c;要與使用的dubbo版本一致。 https://github.com/alibaba/dubbo/releases 2、maven instal…