代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
Python
】
提取双色球每期信息
作者:
dezai
/ 发布于
2014/9/11
/
620
#!/usr/bin/python #coding = GBK import sys import os import urllib import re import MySQLdb #con= MySQLdb.connect(host='localhost',user='root',passwd='',db='caipiao') #cursor =con.cursor() reload(sys) sys.setdefaultencoding( "utf-8" ) pager=urllib.urlopen('http://zx.caipiao.163.com/trend/ssq_basic.html?beginPeriod=2004001&endPeriod=2012149&historyPeriod=2012150&year=') data=pager.read() pager.close() p=re.compile('(?<=<tbody id="cpdata".).+?(?=</tbody)',re.I|re.S) data = p.search(data).group() data = data.decode('utf-8') del p p=data.split('</tr>'); output = open('/home/liukai/python/data.txt', 'a') for i in range(len(p)): con= MySQLdb.connect(host='localhost',user='root',passwd='',db='caipiao') cursor =con.cursor() if(i == 1591): break pattern = re.compile('(?=title=).+?(?=">)',re.I|re.S) if((i-5) ==0 or(i-5)%6==0): continue title = pattern.search(p[i]).group() title = title.split('"') if(len(title)==2): title = title[1] else: title = "" nums = p[i].split('</td>') list = title for j in range(len(nums)): if(j==0): continue # print nums[j] # patt = re.compile('(?=chartBall).+?',re.I|re.S) flag = nums[j].find('chartBall') if(flag != -1): numList = nums[j].split(">"); list =list+ numList[1] if(i != -1): date = list[7:16] first = list[19:21] second = list[21:23] third = list[23:25] four = list[25:27] five = list[27:29] six = list[29:31] seven = list[31:33] sql = "insert into 500wan (data_time,first,second,third,fouth,five,six,seven) values('"+date+"','"+first+"','"+second+"','"+third+"','"+four+"','"+five+"','"+six+"','"+seven+"')" cursor.execute(sql) cursor.close() con.close() #print list+"\\n" print first+"_"+second+"_"+third+"_"+four+"_"+five+"_"+six+"_"+seven+"_"+date #break #print list output.write(list+'\\n')
试试其它关键字
双色球
同语言下
.
比较两个图片的相似度
.
过urllib2获取带有中文参数的url内容
.
不下载获取远程图片的宽度和高度及文件大小
.
通过qrcode库生成二维码
.
通过httplib发送GET和POST请求
.
Django下解决小文件下载
.
遍历windows的所有窗口并输出窗口标题
.
根据窗口标题调用窗口
.
python 抓取搜狗指定公众号
.
pandas读取指定列
可能有用的
.
C#实现的html内容截取
.
List 切割成几份 工具类
.
SQL查询 多列合并成一行用逗号隔开
.
一行一行读取txt的内容
.
C#动态修改文件夹名称(FSO实现,不移动文件)
.
c# 移动文件或文件夹
.
c#图片添加水印
.
Java PDF转换成图片并输出给前台展示
.
网站后台修改图片尺寸代码
.
处理大图片在缩略图时的展示
dezai
贡献的其它代码
(
1065
)
.
双色球
.
列出所有物理网络适配器
.
快乐数的 Python 实现
.
计算当月还剩天数
.
猜属相
.
二十四小时时钟
.
每日一语
.
很酷的日历
.
超长日历表单
.
最简单的时钟
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3