根据一个已经创建的URL来通过openConnection来打开生成一个URLConnection,虽然利用url来获取,其实内部调用的是URLStreamHandler的openConnection,该方法是一个抽象方法,它返回的URLConnection会根据协议的类型返回,倘若是一个http url则就会返回一个HTTPURLConnection。
URL url=new URL("http://www.baidu.com");
URLConnection uc=url.openConnection();
此时该
uc并没有连接,本地与远程主机是无法进行收发数据的,需要调用uc.connect()方法来建立连接。不过在使用getInputStream(),getHeaderField()等其它要求的时候会首先自动调用这个方法。
利用此URLConnection可以很容易读取来自服务器端的数据,只要其getInputStream。
URLConnection提供了对于HTTP首部的访问
URLConnection可以配置客户端向服务器端发送的请求参数即首部
URLConnection可以利用POST,PUT等请求方法与服务器进行交互
利用URL与URLConnection都可以向服务器发送HTTP请求。
1,创建一个URL,传递一个字符串形式的HTTP请求,可以加上查询字符串,此时默认动作类型是get,也就是查询,从服务器返回一个资源,再通过getInputStream正式的建立客户端与服务器之间的连接,将该HTTP请求发送到服务器端,建立必要的握手,由于HTTP是全双工的,此时就可以在这里面获取服务器的返回输出流。
2,通过url的opentConnection获取一个指向url地址的活动连接,初次获取的时候是没有连接的,本地和远程根本不能收发数据,也就是没有socket来连接这台主机。要利用connect()方法来在本地和远程主机之间建立一个TCP socket连接,不过一般都是在使用getInputstream自动调用这个方法,使用getInputStream才是真正的进行发送HTTP的请求消息。 对于服务器响应的首部,当然这里都是以HTTP服务器响应为准,可以来获取响应中的首部字段。
Content-type,Content-length,Content-encoding,Date,Last-modified,Expires
可以利用getContentType()来获取数据的MIME类型,判断字符编码,并且以正常的格式显示出,如 String encoding=
"ISO-8859-1";//HTTP默认的编码方式
URL u=
new URL(url);
URLConnection uc=u.openConnection();
String type=uc.getContentType();
//获取字符编码方式 int star=type.indexOf(
"charset=");
if(star!=-1)
encoding=type.substring(star+8);
System.out.println(
"CharSet:"+encoding);
InputStream raw=uc.getInputStream();
Reader r=
new InputStreamReader(
new BufferedInputStream(raw),encoding);
利用getContentLength来获取二进制文件大小,从而来下载文件
URLConnection uc=url.openConnection();
String contentType=uc.getContentType();
int contentLength=uc.getContentLength();
if(contentType.startsWith(
"text/")||contentLength==-1)
{
throw new IOException(
"This is not a binary file");
}
InputStream raw=
new BufferedInputStream(uc.getInputStream());
byte[] data=
new byte[contentLength];
int bytesRead=0;
int offset=0;
while(offset<contentLength)
{
bytesRead=raw.read(data, offset, contentLength);
if(bytesRead==-1)
break;
offset+=bytesRead;
}
raw.close();
if(offset!=contentLength)
{
throw new IOException(
"Only read "+offset+
"bytes;Expected "+contentLength+
" bytes");
}
//根据URL中获取文件路径的名,将获取的流写入到本地 String file=url.getFile();
int start=file.lastIndexOf(
"/");
String filename=file.substring(start+1);
FileOutputStream fout=
new FileOutputStream(filename);
fout.write(data);
fout.flush();
fout.close();
getHeaderField(String name);可以根据指定首部名来不区分大小写获取该名对应的值 getHeaderFieldKey(int n)和getHeaderField(int n)依此返回首部中的名和值,很有用 URL u=
new URL(url);
URLConnection uc=u.openConnection();
for(
int j=1;;j++)
{
String header=uc.getHeaderField(j);
if(header==
null)
break;
//skip the loop System.out.println(uc.getHeaderFieldKey(j)+
":"+header);
}
所谓的配置主要就是定义了客户端如何向服务器做出请求。
一般客户端在默认情况下doInput为true,表示可以接受来自服务器端发送的数据,这些必须在URLConnection连接之前设置。如果想要利用POST和PUT进行交互就必须要设置doOutpu为true,默认是false
客户端进行服务器访问的时候,有些协议需要加上首部,配置一些名值对,可以通过setRequestProperty(name,value)设置,多个值之间利用逗号隔开。
package com.urlconnection;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.net.URL;
import java.net.URLConnection;
//模拟表单提交处理 public class FormPoster {
private URL url;
private QueryString query=
new QueryString();
//必须要保证是http协议 public FormPoster(URL url)
{
if(!url.getProtocol().toUpperCase().startsWith(
"HTTP"))
{
throw new IllegalArgumentException(
"Posting only works for http urls");
}
this.url=url;
}
public void add(String name,String value)
{
query.add(name, value);
}
public URL getURL()
{
return this.url;
}
public InputStream post()
throws IOException
{
URLConnection uc=url.openConnection();
uc.setDoOutput(
true);
Writer out=
new OutputStreamWriter(uc.getOutputStream(),
"ASCII");
//POST行,Content-type和Content-length是由URLConnection发送的 //只需要发送数据即可 out.write(query.toString());
out.write(
"\r\n\r\n");
out.flush();
out.close();
return uc.getInputStream();
}
public static void main(String[] args) {
// TODO Auto-generated method stub String u=
"http://www.baidu.com"; URL url=null;try{ url=new URL(u); }catch(IOException e) { } FormPoster poster=new FormPoster(url); poster.add("hawk", "fdafda"); poster.add("good morning", "fdafa");try{ InputStream in=poster.post();//读取响应 InputStreamReader r=new InputStreamReader(in);int c;while((c=r.read())!=-1) { System.out.print((char)c); } in.close(); }catch(IOException ex) { System.err.println(ex); } } } 这个是一个专门操作http URL的类,继承子URLConnection,主要有7个请求的方法
, 利用setRequestMethod(String method)设置不同的请求方法,默认是get,区分大小写
TRACE , 服务器返回客户端发送的HTTP首部,用于检测代理服务器对HTTP首部进行怎样修改
getResponseMessage()获取响应码对应的消息,如OK
getResponseCode()获取响应码,如200
协议处理器主要就是根据URL中的协议来找到合适的协议处理器来进行客户端与服务器端的交互。主要涉及四个类,具体类URL,抽象类URLConnection和URLStreamHandler,以及接口URLStreamHandlerFactory。协议处理器的流处理器总是根据指定的协议找到最适合的URLConnection
要想自己建立协议处理器,需要编写两个
URLConnection和URLStreamHandler的子类,然后创建一个 URLStreamHandlerFactory。 URLConnection子类主要处理与服务器交互,将服务器发送的数据转换为InputStream,将客户端发送的所有数据转换为OutputStream。 URLStreamHandler子类主要将URL的字符串表示解析为各个部分,用这些部分来设置URL对象的各个部分,并且创建一个理解次URL协议的URLConnection。 1 程序先利用字符串构建某一个协议的URL对象,在创建URL模式中,只会验证是否识别URL模式,而不会对其格式的正确性进行检查
2 构造函数利用所传递的参数来确定URL的协议部分,如http
3 URL()构造函数以如下方式尝试进行找到给定的
URLStreamHandler a 如果以前使用过此协议,从缓存中获取 URLStreamHandler b 否则,若设置了 URLStreamHandlerFactory,将此字符串传递给工厂 c 若两个都没有,则尝试实例化一个位于java.protocol.handler.pkgs属性列出的 protocol.Handler的 URLStreamHandler d 如果实例化失败,就尝试实例化一个位于sun.net.www.protocol中的 protocol.Handler 的 URLStreamHandler e 如果其中一个成功了,则设置属性字段handler字段。如果都不成功,则抛 出 MalformedURLException异常
4 程序调用URL对象的openConnection方法
5 URL会根据协议让
URLStreamHandler返回一个适合于此URL的URLConnection 6 使用 URLConnection进行与远程资源的交互 URLStreamHandler解析URL中字段的过程 URL(String)-->URL(URL,String)-->URL(URL,String,String)--> URLStreamHandler.parseURL() --> URLStreamHandler.setURL()--> URL.set(); 要新建立一个
URLStreamHandler一般只需要修改openConnection方法即可,根据需要来修改parseURL 为每一个URLConnection子类重写一个connect方法,该方法包含了Socket的具体建立步骤。
再利用URLStreamHandlerFactory来注册这些流处理器 本文转自 zhao_xiao_long 51CTO博客,原文链接:http://blog.51cto.com/computerdragon/1195689