设为首页 加入收藏

TOP

HTMLParser学习整理常用的解析代码
2014-11-23 17:39:06 来源: 作者: 【 】 浏览:12
Tags:HTMLParser 学习 整理 常用 解析 代码

  1.获取指定URL地址下面的全部的<>标签名称


  private void visitorFunction() {


  try {


  Parser parser = new Parser();


  parser.setURL("http://www.tianya.cn/publicforum/articleslist/0/no20.shtml"); parser.setEncoding(parser.getEncoding());


  NodeVisitor visitor = new NodeVisitor(){


  public void visitTag(Tag tag) {


  System.out.print("tag name is:"+tag.getTagName()+"\n class is:"+tag.getClass());


  }


  };


  parser.visitAllNodesWith(visitor);


  }catch (Exception e) {


  // TODO: handle exception


  }


  }


  2.获取指定页面的全部的链接地址即URL地址值


  private void visitorFunction() {


  try {


  Parser parser = new Parser();


  parser.setURL("http://www.tianya.cn/publicforum/articleslist/0/no20.shtml"); parser.setEncoding(parser.getEncoding());


  NodeVisitor visitor = new NodeVisitor(){


  public void visitTag(Tag tag) {


  System.out.print("tag name is:"+tag.getTagName()+"\n class is:"+tag.getClass());


  }


】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇基础编程:Java快速排序实例 下一篇httpclient抓取网页内容

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: