基本信息
源码名称:JAVA爬虫实例 javaReptile
源码大小:0.62M
文件格式:.zip
开发语言:Java
更新时间:2020-06-04
友情提示:(无需注册或充值,赞助后即可获取资源下载链接)
嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300
本次赞助数额为: 2 元×
微信扫码支付:2 元
×
请留下您的邮箱,我们将在2小时内将文件发到您的邮箱
源码介绍
maven项目
package com.dark.reptile; import java.io.FileNotFoundException; import java.io.IOException; import java.util.ArrayList; import java.util.List; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import com.dark.pojo.Product; import com.dark.util.POItoExcel; /** 作者:darkjazz * * 日期:2018年3月22日 下午7:11:20 */ public class Reptile { public static void main(String[] args) throws FileNotFoundException, IOException { List<Product> list=getInfor("http://www.xinfadi.com.cn/marketanalysis/1/list/1.shtml", 1000); POItoExcel.toExcel(list); } public static List<Product> getInfor(String url,int maxPage){ List<Product> proList=new ArrayList<Product>(); for(int i=2;i<=maxPage 1;i ){ try { Document doc=Jsoup.connect(url).get(); Elements table=doc.select(".hq_table"); Elements tbody=table.select("tbody"); Elements trList=tbody.select("tr"); trList.remove(0); for(Element tr:trList){ Elements tdList=tr.select("td"); Product product=new Product(); product.setProductName(tdList.get(0).html().toString()); product.setLowerPrice(tdList.get(1).html().toString()); product.setAveragePrice(tdList.get(2).html().toString()); product.setMaxPrice(tdList.get(3).html().toString()); product.setSpecs(tdList.get(4).html().toString()); product.setUnit(tdList.get(5).html().toString()); product.setDate(tdList.get(6).html().toString()); /*System.out.println(product.toString());*/ proList.add(product); } } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } url="http://www.xinfadi.com.cn/marketanalysis/1/list/" i ".shtml"; } System.out.println("爬取前" maxPage "成功"); return proList; } }