how2j.cn

下载区
文件名 文件大小
jsoup.rar 358k
步骤 1 : 获取 Document   
步骤 2 : 代码演示   

获取Document对象的方式有多种,常见的就是基于字符串,文件,网页地址。
其中 a.html 在右上角的可运行项目里
代码演示
package cn.how2j.jsoup; import java.io.File; import java.net.URL; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; public class Test { public static void main(String[] args) throws Exception { String html1 = "<html><body><p>Hello HTML</p></body></html>"; Document doc1 = Jsoup.parse(html1); System.out.println("基于字符串方式得到的 Document:\r\n"+ doc1); File f = new File("a.html"); if(f.exists()) { Document doc2 = Jsoup.parse(f,"utf-8"); System.out.println("基于文件方式得到的 Document:\r\n"+ doc2); } String url = "http://www.baidu.com"; Document doc3 = Jsoup.parse(new URL(url),5000); //超过5秒就报错 System.out.println("基于URL方式得到的 Document:\r\n"+ doc3); } }


HOW2J公众号,关注后实时获知最新的教程和优惠活动,谢谢。


问答区域    
2020-02-14 怎么伪造 下了个文件 才访问通过。
nicococococ




这个具体怎么伪造baidu 的认证结果。 _FakeX509TrustManager.allowAllSSL(); 抄了个伪造。就过了。
加载中
 Document doc3 = Jsoup.parse(new URL(url),5000); //超过5秒就报错
Exception in thread "main" javax.net.ssl.SSLHandshakeException:
sun.security.validator.ValidatorException: 
PKIX path building failed:
 sun.security.provider.certpath.SunCertPathBuilderException
unable to find valid certification path to requested target
	at sun.security.ssl.Alerts.getSSLException


1 个答案

jyzzzzzzZ
答案时间:2020-06-11
路径http改为https就输出了



回答已经提交成功,正在审核。 请于 我的回答 处查看回答记录,谢谢
答案 或者 代码至少填写一项, 如果是自己有问题,请重新提问,否则站长有可能看不到









提问之前请登陆
提问已经提交成功,正在审核。 请于 我的提问 处查看提问记录,谢谢
关于 JAVA 应用-jsoup-获取文档 的提问

尽量提供截图代码异常信息,有助于分析和解决问题。 也可进本站QQ群交流: 578362961
提问尽量提供完整的代码,环境描述,越是有利于问题的重现,您的问题越能更快得到解答。
对教程中代码有疑问,请提供是哪个步骤,哪一行有疑问,这样便于快速定位问题,提高问题得到解答的速度
在已经存在的几千个提问里,有相当大的比例,是因为使用了和站长不同版本的开发环境导致的,比如 jdk, eclpise, idea, mysql,tomcat 等等软件的版本不一致。
请使用和站长一样的版本,可以节约自己大量的学习时间。 站长把教学中用的软件版本整理了,都统一放在了这里, 方便大家下载: https://how2j.cn/k/helloworld/helloworld-version/1718.html

上传截图