代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
Python
】
淘宝式的爬虫爬取 带断点续传
作者:
奕男
/ 发布于
2018/3/23
/
1052
淘宝数据抓取,按照关键词抓取,带伪装协议头,
淘宝数据抓取,按照关键词抓取,带伪装协议头, import requests import re import pymysql as pq import pandas def To_obtain(): db = pq.connect(host='localhost', user='root', password='a83822851', db='hexun') curs = db.cursor() table = 'SHOW TABLES;' curs.execute(table) TABLE = curs.fetchall() print(TABLE) for keys in TABLE: rangdis = 0 sql = "SELECT * FROM {}".format(keys[0]) curs.execute(sql) results = curs.fetchall() print(results) for i in results: urlid = i[0] url = i[2] Git_id(keys[0],urlid,url) rangdis = rangdis + 1 if rangdis >= 300 and rangdis < 301: print("当前的值为"+str(rangdis)) pass def Git_id(keys,id,url): cont = [keys,id,url] pds = pandas.DataFrame(cont,index=False) pds.to_csv('nams.csv',encoding='utf-8') To_obtain() bbs.py import requests import re import pymysql as pq import pandas def To_obtain(): db = pq.connect(host='localhost', user='root', password='a83822851', db='hexun') curs = db.cursor() table = 'SHOW TABLES;' curs.execute(table) TABLE = curs.fetchall() print(TABLE) for keys in TABLE: rangdis = 0 sql = "SELECT * FROM {}".format(keys[0]) curs.execute(sql) results = curs.fetchall() print(results) for i in results: urlid = i[0] url = i[2] Git_id(keys[0],urlid,url) rangdis = rangdis + 1 if rangdis >= 300 and rangdis < 301: print("当前的值为"+str(rangdis)) pass def Git_id(keys,id,url): cont = [keys,id,url] pds = pandas.DataFrame(cont,index=False) pds.to_csv('nams.csv',encoding='utf-8') To_obtain()
试试其它关键字
同语言下
.
比较两个图片的相似度
.
过urllib2获取带有中文参数的url内容
.
不下载获取远程图片的宽度和高度及文件大小
.
通过qrcode库生成二维码
.
通过httplib发送GET和POST请求
.
Django下解决小文件下载
.
遍历windows的所有窗口并输出窗口标题
.
根据窗口标题调用窗口
.
python 抓取搜狗指定公众号
.
pandas读取指定列
可能有用的
.
比较两个图片的相似度
.
过urllib2获取带有中文参数的url内容
.
不下载获取远程图片的宽度和高度及文件大小
.
通过qrcode库生成二维码
.
通过httplib发送GET和POST请求
.
Django下解决小文件下载
.
遍历windows的所有窗口并输出窗口标题
.
根据窗口标题调用窗口
.
python 抓取搜狗指定公众号
.
pandas读取指定列
奕男
贡献的其它代码
(
13
)
.
读取MP4等视频文件的长度
.
实现1-12月份查询统计
.
实现MySQL数据库备份
.
淘宝式的爬虫爬取 带断点续传
.
获取指定路径下的全部文件然后删除
.
生成日历表
.
文件IO
.
模拟PHP的pack和unpack类
.
有向图最小点基(邻接阵形式)
.
自动跳转支付宝和财付通并填表的函数
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3