使用Java程序自动发博客的尝试

案例:我正在将我网站的资料搬到我在百度空间的博客哦:作为备份用。
http://hi.baidu.com/java2000_net

手里有好多的技术资料,不想一个一个的粘贴到那里,包括在CSDN的一些代码,想复制一份到那里,留个备份。决定使用Java程序直接向博客里发数据。
需要解决的几个问题
1 认证
2 发送数据
3 解决发送太频繁的问题

一 认证

百度支持保存用户名和密码,也就是自动登录,所以其登录信息肯定保存在cookie里面。
如何获得cookie呢?我提供2个方法
1 你去你机器的IE的临时目录里查找cookie吧,比如
C:\Documents and Settings\Administrator\Local Settings\Temporary Internet Files

里面有许多的cookie文件,具体是哪个?你自己找吧,我就不多说了。

2 用Firefox + Firebug 你只要看一下网络链接数据的Header,就可以看到cookie部分的数据了,比如

我们编写的程序,就需要把这个同时送过去,这样对方的程序就会自动识别登录的用户信息了。

二 发送数据

我们使用HttpURLConnection 的 POST方法进行数据的发送,注意其中关键的几个部分

  1. Host 这个一定要设置成提交的主机相同,因为对于虚拟主机,这个最关键了
  2. Referer 这个一般被用来防止盗链,所以一定要设置为一个属于他站点的链接,比如发贴的页面链接
  3. Cookie 这个是认证的关键,否则发贴后会让你登录的
  4. Content-Type 对于普通的POST提交,使用 application/x-www-form-urlencoded,如果是带附件的提交,则需要使用multipart/form-data; boundary=XXXXXXX, 其中的XXXXXX是数据的边缘分界标志
  5. Content-Length 提交的数据长度,字节数

数据没啥特殊的,只要符合表单的要求就可以了,比如百度博客的数据格式如下
ct=1&cm=1&spRefURL=http%3A%2F%2Fhi.baidu.com%2Fjava2000%25255Fnet%2Fcreat%2Fblog%2F&spBlogTitle={TITLE}&spBlogText={CONTENT}&spBlogCatName=%C4%AC%C8%CF%B7%D6%C0%E0&spIsCmtAllow=1&spBlogPower=0&spVcode=&spVerifyKey=&tj=+%B7%A2%B1%ED%CE%C4%D5%C2+

其中的{TITLE}应该替换为我们自己的主题,{CONTENT}替换为我们自己的内容。
下面是发送数据的代码

  1.   /**
  2.    * 发送普通的POST数据
  3.    * 
  4.    * @param host
  5.    *          主机
  6.    * @param charset
  7.    *          编码
  8.    * @param postURL
  9.    *          表单提交的地址URL
  10.    * @param referer
  11.    *          来源,使用填写表单的页面
  12.    * @param cookies
  13.    *          认证数据
  14.    * @param message
  15.    *          发送的数据模板
  16.    * @param title
  17.    *          标题,将替换模板里的对应位置
  18.    * @param content
  19.    *          内容,将替换模板里的对应位置
  20.    * @return 成功返回true
  21.    */
  22.   public static boolean post(String host, String charset, String postURL, String referer, String cookies, String message, String title, String content) {
  23.     try {
  24.       URL url = new URL(postURL);
  25.       HttpURLConnection con = (HttpURLConnection) url.openConnection();
  26.       con.setDoOutput(true); // POST方式
  27.       con.setRequestMethod(“POST”);
  28.       con.addRequestProperty(“Host”, host);
  29.       con.addRequestProperty(“Referer”, referer);
  30.       con.addRequestProperty(“Cookie”, cookies);
  31.       con.addRequestProperty(“Content-Type”“application/x-www-form-urlencoded”);
  32.       message = message.replace(“{TITLE}”, URLEncoder.encode(title, charset));
  33.       message = message.replace(“{CONTENT}”, URLEncoder.encode(content, charset));
  34.       con.addRequestProperty(“Content-Length”, Integer.toString(message.getBytes(charset).length));
  35.       OutputStream os = con.getOutputStream(); // 输出流,写数据
  36.       os.write(message.getBytes(charset));
  37.       os.flush();
  38.       BufferedReader reader = new BufferedReader(new InputStreamReader(con.getInputStream(), charset)); // 读取结果
  39.       String line;
  40.       while ((line = reader.readLine()) != null) {
  41.         // System.out.println(line); // 我这里不再读取每一样了,大家测试时可以去掉注释掉的break,并去掉这里的注释
  42.         break;
  43.       }
  44.       os.close();
  45.       reader.close();
  46.       return true;
  47.     } catch (Exception ex) {
  48.       ex.printStackTrace();
  49.       return false;
  50.     }
  51.   }

给大家提供一个参考的参数数据

  1. host=hi.baidu.com
  2. charset=GBK
  3. cookie=
  4. post=http://hi.baidu.com/java2000%5Fnet/creat/blog/
  5. action=http://hi.baidu.com/java2000%5Fnet/commit
  6. message=ct=1&cm=1&spRefURL=http%3A%2F%2Fhi.baidu.com%2Fjava2000%25255Fnet%2Fcreat%2Fblog%2F&spBlogTitle={TITLE}&spBlogText={CONTENT}&spBlogCatName=%C4%AC%C8%CF%B7%D6%C0%E0&spIsCmtAllow=1&spBlogPower=0&spVcode=&spVerifyKey=&tj=+%B7%A2%B1%ED%CE%C4%D5%C2+

其中的cookie我去掉了,哈哈。 post 就是填写博客的地址,action就是提交博客的地址,其它的大家自己看吧

发送的接口

  1. package net.java2000.blogsender;
  2. public interface Sender {
  3.   public boolean send(String title, String message);
  4. }

我们给百度博客的实现类

  1. package net.java2000.blogsender.baidu;
  2. import java.io.IOException;
  3. import java.util.Properties;
  4. import net.java2000.blogsender.Sender;
  5. import net.java2000.blogsender.util.PostUtil;
  6. /**
  7.  * 百度的博客发送实现类
  8.  * 
  9.  * @author 赵学庆,Java世纪网(java2000.net)
  10.  * 
  11.  */
  12. public class BaiduSender implements Sender {
  13.   private String host;
  14.   private String charset;
  15.   private String post;
  16.   private String action;
  17.   private String cookie;
  18.   private String message;
  19.   public boolean send(String title, String content) {
  20.     content = content.replace(“\r\n”“<br/>”);
  21.     content = content.replace(“\n”“<br/>”);
  22.     return PostUtil.post(host, charset, action, post, cookie, message, title, content);
  23.   }
  24.   public BaiduSender() {
  25.     Properties p = new Properties();
  26.     try {
  27.       p.load(BaiduSender.class.getResourceAsStream(“baidu.properties”));
  28.       host = p.getProperty(“host”);
  29.       charset = p.getProperty(“charset”);
  30.       post = p.getProperty(“post”);
  31.       action = p.getProperty(“action”);
  32.       cookie = p.getProperty(“cookie”);
  33.       message = p.getProperty(“message”);
  34.     } catch (IOException e) {
  35.       e.printStackTrace();
  36.     }
  37.   }
  38. }

三 解决发送太频繁的问题
  我测试,百度的文章最快需要1分钟才能发一个,否则会因为发送太快而让你输入验证码,那个我可破解不了。
所以我们的程序应该发送一个之后,休眠1分钟再发另外一个。

小结

用程序做类似的东西基本都差不多,都是模拟浏览器进行数据的提交。
JavaEye的博客发送程序也快弄好了,整理完毕后也发上来和大家分享。

欢迎访问Java世纪网 http://www.java2000.net

<script type=”text/javascript”>

</script> <script src=”http://pagead2.googlesyndication.com/pagead/show_ads.js” type=”text/javascript”>
</script>

发表评论

电子邮件地址不会被公开。 必填项已用*标注