Html轉Word文檔,解決無法保存網絡圖片的問題

  最近項目中需要這個功能,網上有很多word轉html的方法,但是html轉word的方法很少,因為html中的圖片轉換到本地比較麻煩;

  開始的時候只能轉換不帶圖片的html內容,但是不符合要求,將html頁面中的圖片改成絕對路徑后在斷網之后無法查看,將圖片下載下來改成絕對路徑后,換臺機器無法觀看,問題干擾了一天;

  當然有一種實現方式是將外鏈樣式和外鏈圖片全部一個個請求下來再放到word中排版,這個貌似非常麻煩,跟做一個瀏覽器一樣。

  后來發現,在網站中直接復制網頁然后到word文檔中粘貼,可以把圖片和樣式全部拿過來,于是想到一種方法是否可以利用剪切板來取數據,模擬復制粘貼,最終發現可行,唯一的不足是由于寬度原因,拿來的東西在word中呈現會把格局變掉。

  代碼還是非常簡單,比較好理解的,下面上代碼:

  

 1      public void HtmlToWordByUrl(string url)
 2         {
 3             WebBrowser WB = new WebBrowser();//新建內置瀏覽
 4             WB.Navigate(url);//加載頁面
 5             //加載完成
 6             while (WB.ReadyState != WebBrowserReadyState.Complete)
 7             {
 8                 System.Windows.Forms.Application.DoEvents();
 9             }
10             //對加載完成的頁面進行全選和復制操作
11             HtmlDocument doc = WB.Document;
12             doc.ExecCommand("SelectAll", false, "");//全選
13             doc.ExecCommand("Copy", false, "");//復制
14             //放入剪切板
15             IDataObject iData = Clipboard.GetDataObject();
16             SaveWord();//保存為word文檔
17             //讀取文檔,下載文檔
18             FileStream fs = new FileStream(Server.MapPath("~/UploadFile/test.doc"), FileMode.Open);
19             byte[] bytes = new byte[(int)fs.Length];
20             fs.Read(bytes, 0, bytes.Length);
21             fs.Close();
22             Response.ContentType = "application/octet-stream";
23             //通知瀏覽器下載文件而不是打開 
24             Response.AddHeader("Content-Disposition", "attachment; filename=htmlfile.doc");
25             Response.BinaryWrite(bytes);
26             WB.Dispose();
27             Response.Flush();
28             Response.End();
29 
30         }
31 
32         public void SaveWord()
33         {
34             object path;                      //聲明文件路徑變量
35             //string wordstr = wdstr;                   //聲明word文檔內容
36             MSWord.Application wordApp;       //聲明word應用程序變量
37             MSWord.Document worddoc;          //聲明word文檔變量    
38 
39             //初始化變量
40             object Nothing = Missing.Value;                       //COM調用時用于占位
41             object format = MSWord.WdSaveFormat.wdFormatDocument; //Word文檔的保存格式
42             wordApp = new MSWord.ApplicationClass();              //聲明一個wordAPP對象
43             worddoc = wordApp.Documents.Add(ref Nothing, ref Nothing,
44                 ref Nothing, ref Nothing);
45 
46             //頁面設置
47             worddoc.PageSetup.PaperSize = Microsoft.Office.Interop.Word.WdPaperSize.wdPaperA4;//設置紙張樣式
48             worddoc.PageSetup.Orientation = Microsoft.Office.Interop.Word.WdOrientation.wdOrientPortrait;//排列方式為垂直方向
49 
50 
51             //向文檔中寫入內容(直接粘貼)
52             worddoc.Paragraphs.Last.Range.Paste();
53 
54             //保存文檔
55             path = Server.MapPath("~/UploadFile/test.doc");          //設置文件保存路勁
56             worddoc.SaveAs(ref path, ref format, ref Nothing, ref Nothing,
57                 ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing,
58                 ref Nothing, ref Nothing, ref Nothing, ref Nothing);
59 
60             //關閉文檔
61             worddoc.Close(ref Nothing, ref Nothing, ref Nothing);  //關閉worddoc文檔對象
62             wordApp.Quit(ref Nothing, ref Nothing, ref Nothing);   //關閉wordApp組對象
63 
64         }

其中要注意的一點是,因為在webform頁面調用webbrowser,需要引入以下引用

?1 using System.Windows.Forms;?

前端頁面引用,需要加入AspCompat="true"

1 <%@ Page Language="C#" AutoEventWireup="true" AspCompat="true" CodeBehind="HtmlToWord.aspx.cs" Inherits="NurseManage.Export.HtmlToWord" %>

最后引用了微軟的操作類庫

?1 using MSWord = Microsoft.Office.Interop.Word;?

方法引用:

1      protected void Page_Load(object sender, EventArgs e)
2         {
3             HtmlToWordByUrl("http://www.cnblogs.com/Kuleft/p/5010636.html");
4 
5         }

效果圖:

?

關于word內容排版的問題希望大家能不吝賜教,對于word的操作確實不太清楚。

還有一個就是不知道是不是百度首頁(http://www.baidu.com)防盜爬,暫時轉化不了。

轉載于:https://www.cnblogs.com/Kuleft/p/5010636.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/374074.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/374074.shtml
英文地址,請注明出處:http://en.pswp.cn/news/374074.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

一不小心就掉大啦《數組使用注意》

今天程序提交答案總是不對&#xff0c;調試半天才發現本定義的是char s[4]{1,2,3,4} ; 程序運行過程中輸出才發現多了一個字符 printf("%s\n"); //結果12349 思前想后覺得可能是沒有字符數組結束符 (\0); 特別注意&#xff1a; 定義使用字符型數組時&#xff0c;應…

Java并發教程–阻塞隊列

如第3部分所述&#xff0c;Java 1.5中引入的線程池提供了核心支持&#xff0c;該支持很快成為許多Java開發人員的最愛。 在內部&#xff0c;這些實現巧妙地利用了Java 1.5中引入的另一種并發功能-阻塞隊列。 隊列 首先&#xff0c;簡要回顧一下什么是標準隊列。 在計算機科學…

json和字符串/數組/集合的互相轉換の神操作總結

一:前端字符串轉JSON的4種方式 1&#xff0c;eval方式解析&#xff0c;恐怕這是最早的解析方式了。 function strToJson(str){var json eval(( str ));return json; } 2&#xff0c;new Function形式&#xff0c;比較怪異哦。 function strToJson(str){var json (new Funct…

python 修改array_python 基礎_ 數組的 增刪改查3

數組是運用在多個數據存在一個變量中的&#xff0c;而在調用的時候可以調用所需要的數組。創建數組a [a,b,c,d,f]   #創建一個數組a其中有5個元素分別是abcdf1.查詢。所謂的查詢就是顯示變量a中一個或是一些元素print (a[1])  #打印出a變量中的序列1的元素&#xff0c;我們…

Android實現推送方式解決方案

Android實現推送方式解決方案 本文介紹在Android中實現推送方式的基礎知識及相關解決方案。推送功能在手機開發中應用的場景是越來起來了&#xff0c;不說別的&#xff0c;就我們手機上的新聞客戶端就時不j時的推送過來新的消息&#xff0c;很方便的閱讀最新的新聞信息。這種推…

NYOJ 2 括號配對問題

括號配對問題 時間限制&#xff1a;3000 ms | 內存限制&#xff1a;65535 KB難度&#xff1a;3描述 現在&#xff0c;有一行括號序列&#xff0c;請你檢查這行括號是否配對。 輸入第一行輸入一個數N&#xff08;0<N<100&#xff09;,表示有N組測試數據。后面的…

您應該對什么進行單元測試? –測試技術3

昨天我在辦公室里&#xff0c;和我的一位同事談論測試&#xff0c;他對編寫單元測試有些不服氣。 他使用的原因之一是有些測試似乎毫無意義&#xff0c;這使我想到了什么是單元測試&#xff0c;什么也不需要打擾。 考慮下面一個簡單的不可變的Name Bean&#xff0c;其中包含一…

java基礎知識系列---垃圾收集

1 為什么要使用垃圾回收機制&#xff1f; “垃圾收集”暗示程序不再需要的對象就是垃圾&#xff0c;可以被丟棄。更精確&#xff0c;更新的說法是“內存回收”。 1.1 新對象的使用 當一個對象不再被程序所引用時&#xff0c;他所使用的堆空間可以被回收&#xff0c;以便于被后續…

經濟

聯合國&#xff0c;美蘇英法中 國家要外匯儲備干什么&#xff1f; 01年加入WTO &#xff0c;美國躲開 WTO 另起爐灶 TPP 諾貝爾經濟學獎得主 克魯格蠻 觸動利益比觸動靈魂還困難 SDR IMF 轉載于:https://www.cnblogs.com/zrui513/p/5014593.html

wxpython的sizer_wxPython BoxSizer布局

Box wx.BoxSizer(wxHORIZONTAL) Box wx.BoxSizer(wxVERTICAL)Add() 方法(從wxSizer繼承)它附加到sizer的下一行/列。Box.Add(control, proportion, flag, border)proportion 參數控制的控件響應于所述容器的尺寸改變其大小。各種flag 參數的組合決定控件在sizer的外觀。下面是…

NYOJ 6 噴水裝置(一)

噴水裝置&#xff08;一&#xff09; 時間限制&#xff1a;3000 ms | 內存限制&#xff1a;65535 KB 難度&#xff1a;3描述 現有一塊草坪&#xff0c;長為20米&#xff0c;寬為2米&#xff0c;要在橫中心線上放置半徑為Ri的噴水裝置&#xff0c;每個噴水裝置的效果都會讓以它為…

如何部署Zabbix服務端

部署環境 RHEL 6.7 Zabbix-server 2.2.14 安裝zabbix官方源 # wget http://repo.zabbix.com/zabbix/2.2/rhel/6/x86_64/zabbix-release-2.2-1.el6.noarch.rpm # rpm -ivh zabbix-release-2.2-1.el6.noarch.rpm 安裝zabbix-server # yum install zabbix zabbix-server-mysql zab…

Google App Engine上的Spring MVC和REST

前段時間&#xff0c;我寫了一篇關于如何使用Spring MVC實現Restful Web API的文章 。 閱讀我以前的文章以了解它。 在那篇文章中&#xff0c;開發了一個簡單的Rest示例。 為了測試該應用程序&#xff0c;將文件復制到Web服務器&#xff08;例如Tomcat &#xff09;中&#xff…

SALT+HASH撒鹽加密

#region 撒鹽加密string salt Guid.NewGuid().ToString();byte[] passwordAndSaltBytes System.Text.Encoding.UTF8.GetBytes(model.Password salt);byte[] hashBytes new System.Security.Cryptography.SHA256Managed().ComputeHash(passwordAndSaltBytes);string hashStr…

python 子串是否在字符串中_python七種方法判斷字符串是否包含子串

1. 使用 in 和 not inin 和 not in 在 Python 中是很常用的關鍵字&#xff0c;我們將它們歸類為 成員運算符。使用這兩個成員運算符&#xff0c;可以很讓我們很直觀清晰的判斷一個對象是否在另一個對象中&#xff0c;示例如下&#xff1a;>>> "llo" in &quo…

NYOJ 8 一種排序

一種排序 時間限制&#xff1a;3000 ms | 內存限制&#xff1a;65535 KB難度&#xff1a;3描述現在有很多長方形&#xff0c;每一個長方形都有一個編號&#xff0c;這個編號可以重復&#xff1b;還知道這個長方形的寬和長&#xff0c;編號、長、寬都是整數&#xff1b;現在要…

css3中的background

對background的兩種運用&#xff1a;一是background中的線性漸變&#xff0c;background: linear-gradient(to bottom,#0e7bef,#0d73da);這個是對背景顏色從上到下的一種線性漸變&#xff08;linear-gradient&#xff09;&#xff0c;兩個顏色參數是從第一個顏色參數漸變到第二…

Oracle JRockit Mission Control 4.1發布

Oracle發布了以前的僅JRockit專用工具Mission Control Suite&#xff08;JRMC&#xff09;的新版本。 4.1版本是次要版本升級&#xff0c;直接遵循4.0.1&#xff08;該版本發布于2010年中期&#xff09;。 但是&#xff0c;即使版本號表明是次要的升級&#xff0c;您仍然可以在…

pe安裝usb3.0驅動_電腦店U盤啟動盤制作工具下載安裝須知

電腦店U盤啟動盤制作工具集成最全面的硬件驅動&#xff0c;精心挑選的系統維護工具&#xff0c;加上獨有人性化的設計&#xff0c;具備較強的兼容性、穩定性和安全性。能夠完美兼容臺式機、品牌機及筆記本等新老機型&#xff0c;且安全無毒&#xff0c;電腦店一鍵U盤啟動盤制作…

Webwork【02】前端OGNL試練

1.OGNL 出現的意義 在mvc中&#xff0c;數據是在各個層次之間進行流轉是一個不爭的事實。而這種流轉&#xff0c;也就會面臨一些困境&#xff0c;這些困境&#xff0c;是由于數據在不同世界中的表現形式不同而造成的&#xff1a; a. 數據在頁面上是一個扁平的&#xff0c;不帶數…