使用python采集分享119个PHP江湖论坛源码，总有一款适合您

news2026/2/13 1:44:31

分享119个PHP江湖论坛源码，总有一款适合您

119个PHP江湖论坛源码下载链接：https://pan.baidu.com/s/1Zz-GiS6WT3i16dZMz-5rvQ?pwd=r416
提取码：r416

Python采集代码下载链接：采集代码.zip - 蓝奏云

我的博客地址：亚丁号-知识付费平台支付后可见扫码付费可见

FlashBBS V1.1 中文版(0614)

VBulletin V2.30 简体汉化正式版(紫桐社区)

FlashBBS V1.1 中文版

Discuz! V2.0 繁体中文正式版

Discuz! V2.0 简体中文正式版

QMWDB 论坛 V2.0 功能增强包 SP1

QMWDB 论坛 V2.0

Blue Magic Board V4.0 正式版

VBulletin V2.30 汉化加强版(北飘联盟)

PostNuke V0.723 中文版本 D RC 无雨修正版

Blue Magic Board V4.0 RC

Ctb V1.41 正式版

import os
import shutil

import requests
from bs4 import BeautifulSoup

from framework.base.BaseFrame import BaseFrame
from sprider.access.SpriderAccess import SpriderAccess
from sprider.plugin.SpriderTools import SpriderTools
from sprider.plugin.UserAgent import UserAgent


class CNSourceCoder:
    base_url = "http://www.downcode.com"

    max_pager = 10  # 每页的数量 影响再次采集的起始位置.
    word_image_count = 5  # word插入图片数量 同时也是明细采集图片和描述的数量

    page_end_number = 0
    word_content_list = []
    haved_sprider_count = 0  # 已经采集的数量
    sprider_detail_index = 0  # 明细方法采集的数量 累加

FXVBB正式版本 V2.3.0A

VBulletin V2.3.0 完美版(仙境)

Ipb中文Hyper版 V1.1.2

SRPBoard V1.2.1 简体中文测试版

Ctb V1.4 手动安装测试版

WDB论坛全码版本(QMWDB) V1.0

VBB V2.3.0 正式版黄金修正版本(仙境)[0506更新]

Dream Club V0360(WDB修改版)

飘在北京虚拟形象2.0

WDB水晶论坛 M0720(加密版)

Blue Magic Board V3.1

Vbb V2.3.0 最终版黄金修正版

华酷论坛 V1.1.2 Build 0428

CTB V1.3a 后台完整版

华酷论坛 V1.1 Build 0212(IBF论坛中文版)

阳光论坛程序

Vbb V2.3.0 最终版黄金版(仙境)

Vbb V2.3.0 简繁标准版(CNVBB)

君临天下WDB黄金修正版

Vbb V2.3.0

夜猫 - 城市社区YmCity Version 1.0 DEMO

Discuz! V1.03 正式版

Livebord V1.01 Beta2 中文升级补丁

Livebord V1.01 Beta2 简体中文版

PostNuke V0.723 中文版本 D RC

VBB V2.3.0 RC3 标准汉化版

古钺青剑论坛 V2.0

君临天下WDB 完整安装版

Wbb2 Rc 2版论坛

阳光论坛(Warmsun Board) V01.2.0

CNVBB Live风格完整包


    def sprider(self,sprider_name,sprider_count,start_number,
                pager_number,sprider_type,is_show_browse,root_path,
                first_column_name,second_column_name,is_record_db):
        """
        http://www.downcode.com/sort/j_1_2_1.shtml
        :param sprider_name:
        :return:
        """
        self.first_folder_name=sprider_type.upper()
        self.base_path=root_path
        self.first_column_name = first_column_name
        self.second_column_name = second_column_name
        self.sprider_start_count=start_number
        self.is_record_db=is_record_db
        BaseFrame().debug("开始采集[源码下载站]" + self.first_folder_name + "源码...")
        BaseFrame().right("本次采集参数：sprider_count(采集数量):" + str(sprider_count) + "")
        BaseFrame().right("本次采集参数：sprider_name(采集名称):" + sprider_name + "")
        sprider_url = self.base_url + "/{0}/{1}_1.shtml".format(self.first_column_name, self.second_column_name)# 根据栏目构建URL
        BaseFrame().debug("本次采集参数：sprider_url:" + sprider_url)

        self.second_folder_name = str(sprider_count) + "个" + sprider_name  # 二级目录也是wordTitle
        self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1  # 起始页码用于效率采集
        self.file_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name
        BaseFrame().right("本次采集参数：file_path=" + self.file_path + "")
        # 浏览器的下载路径
        self.down_path = self.base_path + os.sep + self.first_folder_name+ os.sep + self.second_folder_name+ "\\Temp\\"
        BaseFrame().right("本次采集参数：down_path=" + self.down_path + "")
        # First/PPT/88个动态PPT模板/动态PPT模板
        self.save_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name + os.sep + sprider_name
        BaseFrame().right("本次采集参数：save_path=" + self.save_path + "")


        if os.path.exists(self.down_path) is True:
            shutil.rmtree(self.down_path)
        if os.path.exists(self.down_path) is False:
            os.makedirs(self.down_path)

        if os.path.exists(self.save_path) is True:
            shutil.rmtree(self.save_path)
        if os.path.exists(self.save_path) is False:
            os.makedirs(self.save_path)
        response = requests.get(sprider_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
        response.encoding = 'gb2312'
        soup = BeautifulSoup(response.text, "html5lib")
        #print(soup)
        element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})
        page_end_number = 1
        page_end_url = ""
        page_end_title = soup.find("a", attrs={"title": '最后页'})
        page_end_url = page_end_title.get("href")
        if page_end_url is None or page_end_url == "":
            page_end_number = 1
        else:
            page_end_number = (page_end_url.split(".shtml")[0].split("_")[3])

        self.page_count = self.merchant

        while self.page_count <= int(page_end_number):  # 翻完停止
            try:
                if self.page_count == 1:
                    self.sprider_detail(element_list, page_end_number,sprider_count)
                    pass
                else:
                    if int(self.haved_sprider_count) == int(sprider_count):
                        BaseFrame().debug("sprider采集到达数量采集停止...")
                        BaseFrame().debug("开始写文章...")
                        SpriderTools.builder_word(self.second_folder_name,
                                                  self.word_content_list,
                                                  self.file_path,
                                                  self.word_image_count,
                                                  self.first_folder_name)
                        SpriderTools.copy_file(self.word_content_list,
                                               self.save_path,
                                               self.second_folder_name,
                                               self.file_path)
                        SpriderTools.gen_passandtxt(self.second_folder_name, self.word_content_list, self.file_path)
                        BaseFrame().debug("文件编写完毕，请到对应的磁盘查看word文件和下载文件！")
                        break
                    next_url = self.base_url + "/{0}/{1}_{2}.shtml".format(self.first_column_name,
                                                                           self.second_column_name,
                                                                           self.page_count)

                    response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
                    response.encoding = 'gb2312'
                    soup = BeautifulSoup(response.text, "html5lib")
                    element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})
                    self.sprider_detail(element_list, page_end_number,sprider_count)
                    pass
                self.page_count = self.page_count + 1  # 页码增加1
            except Exception as e:
                BaseFrame().error("sprider()执行过程出现错误:" + str(e))

Yabbse V1.50 完全版中文语言包

Yabbse V1.50 繁体标准安装版

Yabbse V1.50 完全版

Yabbse V1.50 标准安装版

Blue Magic Board 3.0 正式版

IPB 论坛超强功能版

Zorum 3.0 论坛程序

水柠檬汉化IPB 简体中文测试版

Fud 论坛 V2.37(Hightman修改版)

PTB 030103 版论坛

Blue Magic Board 3 Beta 2

K666 Vbb论坛(自动生成HTML页)