URL--统一资源定位符=协议名称:资源名称
java.net提供URL类表示URL
1.URL类中的常用方法:
//创建一个URL对象
URL url = new URL("http://www.baidu.com");
URL url1 = new URL(url, "/index.html?usrname=lqq#test");
//url的常用方法
System.out.println("URL主机名称:"+url1.getHost());
System.out.println("URL协议:"+url1.getProtocol());
System.out.println("URL端口:"+url1.getPort());
System.out.println("URL文件路径:"+url1.getPath());
System.out.println("URL查询字符串:"+url1.getQuery());
System.out.println("URL相对路径:"+url1.getRef());
System.out.println("URL文件名:"+url1.getFile());
2.通过URL获取html文件内容:
public static void main(String[] args) throws IOException {
URL url=new URL("http://www.snnu.edu.cn");
InputStream is =url.openStream();
InputStreamReader isr=new InputStreamReader(is);
BufferedReader bufferedReader = new BufferedReader(isr);
String data=bufferedReader.readLine();
while (data!=null){
System.out.println(data);
data=bufferedReader.readLine();
}
bufferedReader.close();
isr.close();
is.close();
}
22222222222222222
222222222222222
1111111111111111
使用URL读取网页内容
通过URL对象的openStream()方法可以得到指定资源的字符输入流。
通过输入流可以读取、访问网络上的数据。
getProtocol()获取协议
getHost()获取主机
如果未指定端口号,则使用默认端口号,getPort()返回-1
getPort()获取端口
getPath()文件路径
getFile()文件名
getRef()相对路径(锚点后面的内容)
getQuery()查询字符串(URL后面的参数)
//通过URL对象获取所表示的字节输入流
openStream()
使用 new BufferReader(new InputStreamRead(url.openStream))实例化按字符读取数据。readLine()读取一行数据。
注意编码格式转换,在创建InputStreamRead对象时添加utf-8编码
new InputStreamRead(isr,"utf-8")
URL:intinternet上某一资源的地址。由两部分组成协议和资源名
12345
通过URL 获取指定资源地址的数据
URL:统一资源定位符
URL:统一资源定位符
URL类常用方法:
协议:url.getProtocol()
主机:url.getHost()
端口:url.getPort()
注:若未指定端口号则返回值为-1
文件路径:url.getPath()
文件名称:url.getFile()
相对路径:url.getRef()
查询字符串:url.getQuery()
URL的内容
url的组成
锚点是一种超链接,只是它是页面内部的超链接。
http://jingyan.baidu.com/album/8275fc86b79e6446a13cf66b.html
URL读取网页内容2
URL读取网页内容
URL类。。
“?”后面表示参数;“#”后面表示锚点
URL类:协议+具体资源
url = 协议名称 + 资源名称
两者用冒号(:)分隔
socket-url实例的应用