如何读取网页源码然后生成html文件?
2008-10-14 16:31
253 查看
如何读取网页源码然后生成html文件? Delphi / Windows SDK/API
http://www.delphi2007.net/DelphiBase/html/delphi_20061219212425113.html
我在网上找了好久没有找到,不知道用哪个函数可以实现?希望给段代码,谢谢了,在线等.
uses ActiveX, ComObj;
//...
function GetHtml(const WebBrowser:TWebBrowser): string;//此函数原作者卢小海
const
BufSize = $10000;
var
Size: Int64;
Stream: IStream;
hHTMLText: HGLOBAL;
psi: IPersistStreamInit;
begin
if not Assigned(WebBrowser.Document) then Exit;
OleCheck(WebBrowser.Document.QueryInterface(IPersistStreamInit, psi));
try
hHTMLText := GlobalAlloc(GPTR, BufSize);
if 0 = hHTMLText then RaiseLastWin32Error;
OleCheck(CreateStreamOnHGlobal(hHTMLText,True, Stream));
try
OleCheck(psi.Save(Stream, False));
Size := StrLen(PChar(hHTMLText));
SetLength(Result, Size);
CopyMemory(PChar(Result), Pointer(hHTMLText),Size);
finally
Stream := nil;
end;
finally
psi := nil;
end;
end;
procedure TForm1.Button1Click(Sender: TObject);
var
HtmF:Textfile;
begin
memo1.Text:=gethtml(WebBrowser1);
assignfile(HtmF,'c:\result.htm');
rewrite(HtmF);
writeln(HtmF,memo1.text);
closefile(HtmF);
end;
procedure TForm1.Button2Click(Sender: TObject);
begin
webbrowser1.Navigate('http://www.google.com');
end;
------------引自 大富翁。
借助 webbrower 控件。
webbrower.nagivate('your url')
8、直接从TWebBrowser得到网页源码及Html
下面先介绍一种极其简单的得到TWebBrowser正在访问的网页源码的方法。一般方法是利用TWebBrowser控件中的Document对象提供的IPersistStreamInit接口来实现,具体就是:先检查WebBrowser.Document对象是否有效,无效则退出;然后取得IPersistStreamInit接口,接着取得HTML源码的大小,分配全局堆内存块,建立流,再将HTML文本写到流中。程序虽然不算复杂,但是有更简单的方法,所以实现代码不再给出。其实基本上所有IE的功能TWebBrowser都应该有较为简单的方法来实现,获取网页源码也是一样。下面的代码将网页源码显示在Memo1中。
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml);
同时,在用TWebBrowser浏览HTML文件的时候要将其保存为文本文件就很简单了,不需要任何的语法解析工具,因为TWebBrowser也完成了,如下:
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText);
lihuasoft(学习低调做人)
的 很深
看不懂
简单的就是最好的。我的也是抄别人的。抛别人的玉引玉。
^
http://www.delphi2007.net/DelphiBase/html/delphi_20061219212425113.html
我在网上找了好久没有找到,不知道用哪个函数可以实现?希望给段代码,谢谢了,在线等.
uses ActiveX, ComObj;
//...
function GetHtml(const WebBrowser:TWebBrowser): string;//此函数原作者卢小海
const
BufSize = $10000;
var
Size: Int64;
Stream: IStream;
hHTMLText: HGLOBAL;
psi: IPersistStreamInit;
begin
if not Assigned(WebBrowser.Document) then Exit;
OleCheck(WebBrowser.Document.QueryInterface(IPersistStreamInit, psi));
try
hHTMLText := GlobalAlloc(GPTR, BufSize);
if 0 = hHTMLText then RaiseLastWin32Error;
OleCheck(CreateStreamOnHGlobal(hHTMLText,True, Stream));
try
OleCheck(psi.Save(Stream, False));
Size := StrLen(PChar(hHTMLText));
SetLength(Result, Size);
CopyMemory(PChar(Result), Pointer(hHTMLText),Size);
finally
Stream := nil;
end;
finally
psi := nil;
end;
end;
procedure TForm1.Button1Click(Sender: TObject);
var
HtmF:Textfile;
begin
memo1.Text:=gethtml(WebBrowser1);
assignfile(HtmF,'c:\result.htm');
rewrite(HtmF);
writeln(HtmF,memo1.text);
closefile(HtmF);
end;
procedure TForm1.Button2Click(Sender: TObject);
begin
webbrowser1.Navigate('http://www.google.com');
end;
------------引自 大富翁。
借助 webbrower 控件。
webbrower.nagivate('your url')
8、直接从TWebBrowser得到网页源码及Html
下面先介绍一种极其简单的得到TWebBrowser正在访问的网页源码的方法。一般方法是利用TWebBrowser控件中的Document对象提供的IPersistStreamInit接口来实现,具体就是:先检查WebBrowser.Document对象是否有效,无效则退出;然后取得IPersistStreamInit接口,接着取得HTML源码的大小,分配全局堆内存块,建立流,再将HTML文本写到流中。程序虽然不算复杂,但是有更简单的方法,所以实现代码不再给出。其实基本上所有IE的功能TWebBrowser都应该有较为简单的方法来实现,获取网页源码也是一样。下面的代码将网页源码显示在Memo1中。
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml);
同时,在用TWebBrowser浏览HTML文件的时候要将其保存为文本文件就很简单了,不需要任何的语法解析工具,因为TWebBrowser也完成了,如下:
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText);
lihuasoft(学习低调做人)
的 很深
看不懂
简单的就是最好的。我的也是抄别人的。抛别人的玉引玉。
^
相关文章推荐
- 如何用webbrowser获取ajax动态生成的网页的源码?
- 【WPF学习笔记】之如何把数据库里的值读取出来然后显示在页面上:动画系列之(六)(评论处有学习资料及源码)
- 如何生成word文档的源码
- 如何生成针成对PD环境的测试网页
- E语言读取网页源码输出不全的BUG
- java读取文件以字节流的形式读取 然后转化为字节流数组,最后经过SHA1加密生成返回16进制字符串存入数据库
- 如何将android源码生成eclipse可用的jar,以marvell的fmmanager为例
- 如何获取网页源码
- 如何抓取Js动态生成数据且以滚动页面方式分页的网页
- OpenJDK源码研究笔记(八)-详细解析如何读取Java字节码文件(.class)
- php 读取网页源码 , 导出成txt文件, 读取xls,读取文件夹下的所有文件的文件名
- 如何使用xmlhttprequester对象,读取一个比较长的网页
- 如何读取EXCEL 表格文件并使他在WEB网页上显示(使用ASP.NET)
- Asp.net(C#)读取数据库并生成JS文件制作首页图片切换效果(附demo源码下载)
- WKWebView加载Html文件,如何自适应网页内容呢?就是不要让它左右滑动
- 如何读取txt内的行重新生成新的txt文件
- java小程序从数据库中(表)中读取数据然后创建文件夹生成txt文件
- ASP 如何读取 Word 档案内容并显示于网页
- SprignMVC+myBatis整合+mybatis源码分析+动态代理实现流程+如何根据mapper接口生成其实现类
- ASP生成HTML后如何计算网页的浏览数