博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
jsoup分解HTML DOM
阅读量:6325 次
发布时间:2019-06-22

本文共 786 字,大约阅读时间需要 2 分钟。

采用jsoup 分解HTML 。使用和JS操作DOM分类似。

示例代码:

import java.io.IOException;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class ParserHtml {	public static void main(String[] args) throws IOException {		String url = "http://www.jd.com/";//能够依据情况选择POST,GET请求URL		Document doc = Jsoup.connect(url).data("query", "Java").userAgent("Mozilla").cookie("auth", "token").timeout(6000).get();		/* 依据ID获取 */		Element footer = doc.getElementById("footer-2013");		System.err.println(footer.getAllElements());		/* 依据标签获取 */		Elements element = doc.getElementsByTag("img");		for (int i = 0; i < element.size(); i++) {			System.out.println(element.get(i).attr("src"));		}	}}

使用JSOUP工具包

jsoup-1.5.2.jar

下载地址:

版权声明:本文博主原创文章,博客,未经同意不得转载。

你可能感兴趣的文章
python 之队列和生产者消费者模型、基于selectors模块实现的IO多路复用
查看>>
《将博客搬至CSDN》
查看>>
对T4模板研究-针对SQL SERVER的EF代码生成
查看>>
php的基础知识(一)
查看>>
Dart: puppeteer库
查看>>
javaMai+Springl实现给QQ邮箱发邮件(带附件,html格式)
查看>>
AtCoder Beginner Contest 075 D - Axis-Parallel Rectangle【暴力】
查看>>
【转载】wpf数据绑定binding与INotifyPropertyChanged
查看>>
oracle连接两个数据库
查看>>
Sybase常用函数
查看>>
RMAN-format变量及configuration配置项
查看>>
Properties中的主要方法
查看>>
LeetCode44.通配符匹配
查看>>
Win7 IIS 局域网中无法访问网页
查看>>
idea中maven web项目设置的相关问题
查看>>
【java】静态方法声明与调用习题
查看>>
C#中数组、ArrayList和List三者的区别
查看>>
项目总结(2010-8-8)
查看>>
MYSQL-innodb性能优化几个点
查看>>
nstimer,需要注册到 runloop里面去的,
查看>>