【前言】 我看其他文章中说到设置环境变量path,还提及selenium-server和Selenium-rc,我这篇文章没那么复杂,没有设置path,只是使用webdriver技术,调用本机chrome,获取动态页面渲染后的html,在进行解析。代码如下:
public static void main(String[] args) {
System.getProperties().setProperty("webdriver.chrome.driver",
"D:\\Code\\chromedriver.exe"); //这个参数就是【chrome驱动器的位置】
WebDriver webDriver = new ChromeDriver();
webDriver.get("http://www.facejoking.com/top/12001/0");
WebElement webElement = webDriver.findElement(By.id("ColumnContainer"));
List listLink = webElement.findElements(By.tagName("a"));
for (int i = 0; (i + 2) < 50; i += 2) {
System.out.println(listLink.get(i).getAttribute("href") + "/"
+ listLink.get(i + 1).getText());
}
System.out.println("chrome driver");
// 关闭窗口,释放资源。
webDriver.close();
}