先用python GET网页源码
这里我们用GET参考的双色球频道_往期回顾
因为不同的网站源码不一样,主要讲解思路
soup = BeautifulSoup(html, 'html.parser')
用BS解析后,使用
lottery_info = soup.find_all('tr')#根据tr标签找到开奖所有的期号行
先找到所有的tr行,因为我发现这个网站源码它没有class来标识
lottery_info会得到所有的tr行数据元素,然后我们在lottery_info中再去查找期号+球号
第二步使用center属性找到tr中的期号和球号,这里需要过滤一些
lottery_data = lottery_info[i].find_all('td',attrs={'align':'center'})
我们会发现期号就在
print(lottery_data[1].string) #从0开始,获得期号
第三步,我们再用em标签来获取具体的球号
#打印红球 redball = lottery_data[2].find_all('em') print('红球的个数为是%d' % len(redball)) for i in range(len(redball)): red = redball[i].string print(red.strip()) #打印一只红球
未写得很详细,主要讲解思路,下载到数据后保存我们进行统计分析,然后进行预测
慢慢完善代码