分享112个HTML娱乐休闲模板,总有一款适合您
112个HTML娱乐休闲模板下载链接:https://pan.baidu.com/s/15uBy1SVSckPPMM55fiudeQ?pwd=kqfz
提取码:kqfz
Python采集代码下载链接:采集代码.zip - 蓝奏云
Bootstrap视频网站模板
摇滚音乐娱乐网站模板
音乐唱片公司网站模板
高端桑拿会所响应式模板
import os
import shutil
import time
from time import sleep
from docx import Document
from docx.shared import Inches
from framework.base.BaseFrame import BaseFrame
from sprider.business.DownLoad import DownLoad
from sprider.business.SeleniumTools import SeleniumTools
from sprider.business.SpriderTools import SpriderTools
from selenium import webdriver
from selenium.webdriver.common.by import By
from sprider.model.SpriderEntity import SpriderEntity
from sprider.access.SpriderAccess import SpriderAccess
title_name = "娱乐休闲"
class ChinaZJsSelenium:
base_url = "https://sc.chinaz.com/" # 采集的网址
save_path = "D:\\Freedom\\Sprider\\ChinaZ\\"
sprider_count = 112 # 正在采集第20页的第20个资源,共22页资源
sprider_start_count = 111
word_content_list = []
folder_name = ""
page_end_number = 0
max_pager = 24 # 每页的数量
haved_sprider_count = 0 # 已经采集的数量
page_count = 1 # 每个栏目开始业务content="text/html; charset=gb2312"
filter_down_file = []
word_image_count = 5 # word插入图片数量 同时也是明细采集图片和描述的数量
sprider_detail_index = 0 # 明细方法采集的数量 累加
sprider_top_level = "HTML"
时尚服装博客网站模板
保健与美容网站模板
吉他演奏html网站模板
xbox游戏体验网站模板
绿色保健按摩HTML5模板
度假村房间预订HTML5模板
绿色饮食养生HTML5模板
大气户外摄影HTML5模板
水疗spa会所网站模板
深蓝色音乐演唱会模板
扁平摄影工作室网站模板
音乐活动专题页面模板下载
电影影视门户网站html5模板
多彩音乐演唱会门票官网模板
黑色酷炫乐队网站模板下载
快乐游乐园HTML5网页模板
适合博客新闻网站模板
美容美发会所网站模板
按摩健身绿色网站模板
激情节奏酷炫音乐网站模板
def sprider(self, title_name):
"""
采集
医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html
电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html
电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html
婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html
电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html
旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html
体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html
娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html
:return:
"""
if title_name == "医疗保健":
self.first_column_name = "moban"
self.folder_name = "HTML医疗保健模板"
self.second_column_name = "YiLiaoBaoJian"
elif title_name == "娱乐休闲":
self.first_column_name = "moban"
self.folder_name = "HTML娱乐休闲模板"
self.second_column_name = "YuLeXiuXian"
elif title_name == "体育竞技":
self.first_column_name = "moban"
self.folder_name = "HTML体育竞技模板"
self.second_column_name = "TiYuJingJi"
elif title_name == "旅游交通":
self.first_column_name = "moban"
self.folder_name = "HTML旅游交通模板"
self.second_column_name = "LvYouJiaoTong"
elif title_name == "电脑主机":
self.first_column_name = "moban"
self.folder_name = "HTML电脑主机模板"
self.second_column_name = "DianNaoZhuJi"
elif title_name == "电子产品":
self.first_column_name = "moban"
self.folder_name = "HTML电子产品模板"
self.second_column_name = "DianZiChanPin"
elif title_name == "电子商务":
self.first_column_name = "moban"
self.folder_name = "HTML电子商务模板"
self.second_column_name = "DianZiShangWu"
BaseFrame().right("本次采集参数:日志路径:" + str(BaseFrame().LOG_PATH) + "")
BaseFrame().right("本次采集参数:sprider_count=" + str(self.sprider_count) + "")
BaseFrame().right("本次采集参数:title_name=" + title_name + "")
BaseFrame().right("本次采集参数:second_column_name=" + self.second_column_name + "")
# self.folder_name = "JS表单验证"
self.sprider_category = title_name # 一级目录self.folder_name
second_folder_name = str(self.sprider_count) + "个" + self.folder_name # 二级目录
self.sprider_type = second_folder_name
self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1 # 起始页码用于效率采集
# 原始路径+一级目录+二级目录
self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name
self.save_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name + os.sep + self.folder_name
BaseFrame().debug("开始采集ChinaZJL" + self.folder_name + "...")
sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name, self.first_column_name))
down_path = "D:\\Freedom\\Sprider\\ChinaZ\\" + self.sprider_top_level + "\\" + self.folder_name + "\\" + second_folder_name + "\\Temp\\"
if os.path.exists(down_path) is True:
shutil.rmtree(down_path)
if os.path.exists(down_path) is False:
os.makedirs(down_path)
if os.path.exists(self.save_path) is True:
shutil.rmtree(self.save_path)
if os.path.exists(self.save_path) is False:
os.makedirs(self.save_path)
chrome_options = webdriver.ChromeOptions()
diy_prefs = {'profile.default_content_settings.popups': 0,
'download.default_directory': '{0}'.format(down_path)}
# 添加路径到selenium配置中
chrome_options.add_experimental_option('prefs', diy_prefs)
chrome_options.add_argument('--headless') # 隐藏浏览器
# 实例化chrome浏览器时,关联忽略证书错误
driver = webdriver.Chrome(options=chrome_options)
driver.set_window_size(1280, 800) # 分辨率 1280*800
#
BaseFrame().debug("开始采集" + sprider_url)
driver.get(sprider_url)
# content = driver.page_source
element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 box col3 ws_block masonry-brick
# element_list = div_elem.find_elements(By.CLASS_NAME, 'item')
# print(element_list.get_attribute('innerHTML'))
laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye")
laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a')
laster_pager_url = laster_pager_a[len(laster_pager_a) - 2]
page_end_number = int(laster_pager_url.text)
self.page_count = self.merchant
while self.page_count <= int(page_end_number): # 翻完停止
try:
if self.page_count == 1:
self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
pass
else:
if self.haved_sprider_count == self.sprider_count:
BaseFrame().debug("采集到达数量采集停止...")
BaseFrame().debug("开始写文章...")
self.builder_word(self.folder_name, self.word_content_list)
BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
break
# (self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count))
# http://soft.onlinedown.net/sort/177/2/
# https://sc.chinaz.com//jianli/xiaochengchu_2.html
next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count,
self.first_column_name)
driver.get(next_url)
element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容
self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
pass
# print(self.page_count)
self.page_count = self.page_count + 1 # 页码增加1
except Exception as e:
print("sprider()执行过程出现错误:" + str(e))
sleep(1)
水果榨汁饮料店铺网站模板
咖啡蛋糕店加盟网站模板
Music音乐演唱网站模板
HTML5吉他乐器音乐网站模板
豪华酒店介绍预订网站模板
粉色时尚休闲会所网站模板
CSS3餐厅酒店网站模板
HTML5棕色背景新闻模板
咖啡餐厅类目CSS3模板
战争游戏公司网站模板
音乐扬声器娱乐网站模板
水果沙拉甜点网站模板
酒店在线预订网页模板下载
国外视频新闻网站模板
旅行酒店宾馆整站模板下载
音乐生活娱乐网站模板
黑色游戏评测网页模板
宽屏咖啡休闲企业模板
魅力女性时尚网站模板
酒店游泳健身网站模板
电影上映影讯网站模板
蓝色桑拿会所网站模板
紫色风格乐器网站模板
单机游戏网站模板源码
酒店客房预订模板下载
国内外时事政治网站模板
html5视频直播整站模板下载
游戏APP评测网站模板
学佛打坐锻炼网站模板
html5休闲户外网站模板
黄色风格音乐网页模板
榨果汁饮料店网站模板
吉他乐器爱好者网站模板
佳能相机摄影网站模板
休闲果汁饮料网站模板
模特户外拍摄网站模板
欧美时尚休闲网站模板
国外旅游网站模板下载
中医养生按摩网页模板
灯光下的舞台网站模板
粉红色游戏行业网站模版
音乐发烧友HTML5模板
DJ音乐俱乐部网站模板
流行音乐演唱会网站模板
旅游酒店在线预订网站模板
足浴按摩会所CSS模板
时尚咖啡馆静态网页模板
手机游戏门户网站模板
粉色恋爱交友企业网站模板
蓝色沙滩度假休闲网站模板
DJ夜场狂欢HTML网页模板
自行车综合资讯门户网站模板
绿色微酒店预订wap手机模板
游戏评测HTML5网站模板
国际酒店预订网站模板
娱乐资讯HTML5网站模板
咖啡休闲屋HTML网站模板
多彩边框电影资讯网站模板
电影下载网站HTML5模板
手机应用下载wap网站模板
在线音乐试听wap手机模板
奔跑的男孩HTML网页模板
爬山驴友户外网站模板
星巴克咖啡饮品网页模板
咖啡店加盟培训网站模板
咖啡饮品店网站模板
import os
import shutil
def void_folder(path):
# 访问path路径下的文件或文件夹
lst = os.listdir(path)
# 打印每一层的文件或文件夹
for name in lst:
# 拼接名称,得到绝对路径,判断该文件是否符合是文件夹
real_path = os.path.join(path, name)
# 如果是文件夹,则打空格表示,并且递归访问下一层
if os.path.isdir(real_path):
# print(name)
files = os.listdir(real_path)
if len(files) == 0:
print("void_folder():"+name)
shutil.rmtree(real_path)
endindex = len(real_path) - len(name)
real_path = real_path[0:endindex]
void_folder(real_path)
else:
void_folder(real_path)
# 如果不是文件夹,直接打印,不再递归访问下一层
else:
#print(name)
pass
def void_file(dirPath):
dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表
for file in dirs:
file_full_name = dirPath + '/' + file
file_ext = os.path.splitext(file_full_name)[-1]
if file_ext is None or file_ext=="":
continue
if "rar" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "zip" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "gz" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "tgz" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
# 查找指定文件夹下所有相同名称的文件
def search_file(dirPath, fileName):
dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表
for currentFile in dirs: # 遍历列表
absPath = dirPath + '/' + currentFile
if os.path.isdir(absPath): # 如果是目录则递归,继续查找该目录下的文件
search_file(absPath, fileName)
elif currentFile == fileName:
#print(absPath) # 文件存在,则打印该文件的绝对路径
os.remove(absPath)
五星级酒店HTML5网页模板
明星演唱会网站模板
登山爱好者网站模板
绿色攀岩户外网站模板
蓝色海洋主题网站模板
休闲饮品店CSS网站模板
黑色暗格视频分享网站模板
风车发电科技企业网站模板
台球爱好者HTML5网站模板
炫彩舞台CSS大气模板
摄影爱好者html5网站模板
酒吧夜场CSS网站模板
大气美女麦霸网站模板
手机记录生活网页模板
女性水疗会所网站模板
劲爆dj音乐网站模板
静心打坐健身网站模板
瑜伽健身会馆网站模板
电影票销售网站模板
简洁干净茶餐厅企业模板
瑜伽减肥CSS网站模板
唯美摄影HTML5网站模板
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。