Python爬虫：通过关键字爬取百度图片 - Python - 程序员开发

设为首页加入收藏

编程入门

首页

C语言

C++开发

Python

Java

AI大数据: Hadoop

Hdfs

Spark

Hive

HBase

Flume

Kfaka

操作系统: Win

Linux

OS X

其它

windows编..

linux编程..

网络编程

热门语言: GO

PHP

R语言

.Net

Swift

Ruby

Scala

等级考试: C语言

C++

JAVA

面试

当前位置：

首页 -> 其它语言 -> Python

TOP

Python爬虫：通过关键字爬取百度图片

2017-10-09 16:59:04 【大中小】浏览:8262次

Tags：Python 爬虫通过关键字百度图片

使用工具：Python2.7 点我下载

scrapy框架

sublime text3

一。搭建python（Windows版本）

1.安装python2.7 ---然后在cmd当中输入python，界面如下则安装成功

2.集成Scrapy框架----输入命令行：pip install Scrapy

安装成功界面如下：

失败的情况很多，举例一种：

解决方案：

其余错误可百度搜索。

二。开始编程。

爬取无反爬虫措施的静态网站。例如百度贴吧，豆瓣读书。

例如-《桌面吧》的一个帖子https://tieba.baidu.com/p/2460150866?red_tag=3569129009

python代码如下：

代码注释：引入了两个模块urllib,re。定义两个函数，第一个函数是获取整个目标网页数据，第二个函数是在目标网页中获取目标图片，遍历网页，并且给获取的图片按照0开始排序。

注：re模块知识点:

爬取图片效果图：

图片保存路径默认在建立的.py同目录文件下。

2.爬取有反爬虫措施的百度图片。如百度图片等。

例如关键字搜索“表情包”https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

图片采用滚动式加载，先爬取最优先的30张。

代码如下：

代码注释：导入4个模块，os模块用于指定保存路径。前两个函数同上。第三个函数使用了if语句，并tryException异常。

爬取过程如下：

爬取结果：

注：编写python代码注重对齐，and不能混用Tab和空格，易报错。

copyriht by WC-cong


【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：python导入模块时提示ImportError..	下一篇：Python系列之heapq内置模块

最新文章

Django框架系列目录

创建Anaconda虚拟Python环境的方法

Python获取主目录的方法

Python中跨越多个文件使用全局变量

chatgpt使用python写一段二分查找的..

热门文章

PyCharm 2017 官网下载安装设置 ..

day5模块学习 -- os模块学习

字符、字符集、编码，以及它们pytho..

Day9 网络编程

Python爬虫实战一之爬取QQ音乐

Hot 文章

PyCharm 2017 官网下载安装设置 ..

day5模块学习 -- os模块学习

字符、字符集、编码，以及它们pytho..

Day9 网络编程

Python爬虫实战一之爬取QQ音乐

Python

825

Django框架系列目录

662

创建Anaconda虚拟Pyt

1257

Python获取主目录的

896

Python中跨越多个文

546

chatgpt使用python写

748

一条爬虫抓取一个小

620

Python教程：sys.std

678

Python教程(13)——P

862

Docker安装配置Jupyt

748

【matplotlib基础】-

C 语言

546

C语言入坑总结

633

C数据结构-线性表之顺序表

1396

Programming abstractions in..

561

C语言内存布局

845

最全的李慧芹APUE-标准IO笔记

753

alog一个日志库

609

1.1.初识STM32及新建工程

811

codeblock安装及汉化教程

627

东方博宜OJ1000 熟悉一下Onli..

1357

关于指针与引用传递的效率问题

C++基础

1227

KMP 字符串匹配学习笔记

906

2.10 PE结构：重建重定位表结..

581

【Qt6】列表模型——抽象基类

705

2.12 PE结构：实现PE字节注入

633

571

2.14 PE结构：地址之间的转换

625

4.1 应用层Hook挂钩原理分析

985

使用Vulkan-Loader将ncnn代码..

646

4.3 IAT Hook 挂钩技术

553

C++ 学习笔记、01 | 开发简单..

大数据基础

1026

多线程：线程的同步

583

vertica-->kafka-

906

662

解决android studio

599

Kafka史上最详细原理

626

Error while fetchin

766

【Kafka】安装与快速

503

664

flume读取日志数据写

655

Authentication plug

linux编程基础

725

如何在Python中过滤字符串列表

732

如何在Python中读写文件

754

初识Lambda表达式

811

深入理解Python中的列表推导..

1033

如何在Python中执行外部命令

1094

设计模式之单例模式理解

606

跟我学Python GUI编程系列 - ..

1371

21道并发编程面试题

619

深入理解 Hadoop 序列化

990

CAS无锁机制深入理解

C/C++面试题目

1227

KMP 字符串匹配学习

581

【Qt6】列表模型——

906

2.10 PE结构：重建重

633

705

2.12 PE结构：实现PE

571

2.14 PE结构：地址之

985

使用Vulkan-Loader将

625

4.1 应用层Hook挂钩

646

4.3 IAT Hook 挂钩技

553

C++ 学习笔记、01 |

Copyright@https://www.cppentry.com all rights reserved 粤ICP备13067022号-3