concurrent.futures.ThreadPoolExecutor多线程处理文件

news2024/9/24 19:20:06

背景:适用于IO密集型任务。

应用举例:

  • 数据库查询。

  • 文件系统操作。

  • 网络服务器处理请求。

比如大批量从某个服务获取信息。

代码举例:

def worker_core(json_data):  #调用GPT获取数据
    response = send_chat_request(
        system="You are a helpful assistant.",
        examples=[],
        question=json_data["conversations"][0]["value"], # prompt,
        temperature=0.7,
        top_p=0.8,
        engine="xxxxxxxxxxxxxxxxx",
        max_tokens=2048,
        priority=5,
    )
    import copy
    response["data"] = copy.deepcopy(json_data)

    return response


def worker(json_data, max_try=10): #每条数据获取3次,并对获取的数据进行处理
    for iteration in range(0, 3):
        save_path = json_data["meta"]["save_path"]
        save_dpath = os.path.dirname(save_path)
        save_fname = os.path.basename(save_path)
        newd = os.path.join(save_dpath, "gpt4", str(iteration))
        new_save_path = os.path.join(newd, save_fname)
        if os.path.exists(new_save_path):
            return
        safe_mkdir(newd)
                            
        for i in range(max_try):
            result = worker_core(json_data)
            print(json_data)
            try:
                response = check_format(result)
                # response = result["response"]
                if response != None:
                    result["raw_response"] = result["response"]
                    result["response"] = response

                    with open(new_save_path, "w") as f:
                        json.dump(result, f, indent=4, ensure_ascii=False)
            except Exception as e:
                print(e)
        if response == None:
            result["raw_response"] = result["response"]
            result["response"] = None
            with open(new_save_path, "w") as f:
                json.dump(result, f, indent=4, ensure_ascii=False)


def parallel_execution(demo_json_list, n_jobs=100):
    n_jobs = min(n_jobs, len(demo_json_list))
    with concurrent.futures.ThreadPoolExecutor(max_workers=n_jobs) as executor:
        list(tqdm(executor.map(worker, demo_json_list), total=len(demo_json_list)))

parallel_execution(demo_json_list, n_jobs=50)  #demo_json_list是json.load的数据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2161193.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

邮件发送基础:深入SMTP协议、配置邮件服务器及Python实现

目录 引言 SMTP协议基础 定义与功能 工作原理 特性与优势 邮件服务器配置 第三方邮件服务商配置 自建邮件服务器配置 使用Python发送邮件 安装smtplib和email模块 发送简单纯文本邮件 发送HTML格式邮件 发送带附件的邮件 完整示例:发送带附件的HTML邮…

Figma 中要放大并下载 UI 设计中的图标

Figma 中要放大并下载 UI 设计中的图标,通常可以通过以下几步操作来实现: 1. 放大图标: 打开 Figma 文件并找到你想要放大的图标。 选中图标,点击界面右上角的 “缩放”工具(放大镜图标)&#xff0…

静态路由和默认路由(实验)

目录 一、实验设备和环境 1、实验设备 2、实验环境 (1)实验拓扑图 (2)实验命令列表 二、实验记录 1、直连路由与路由表查看 步骤1:建立物理连接并运行超级终端。 步骤2:在路由器上查看路由表。 2、静态路由配置 步骤1:配…

硬件看门狗导致MCU启动时间慢

最近,在项目交付过程中,我们遇到了一个有趣的问题,与大家分享一下。 客户的需求是:在KL15电压上电后,MCU需要在200ms内发送出第一包CAN报文数据。然而,实际测试结果显示,软件需要360ms才能发送…

统计分析-外测度和内测度作用异同

统计分析-外测度和内测度作用 外测度和内测度是测度论中两个基本的概念,它们在统计分析和概率论中具有重要的作用,特别是在处理不可测集合和函数的积分理论方面。 外测度(Outer Measure) 外测度是对集合大小的一种“外部”估计…

突破历史-----中证股指ETF看涨期权--日内超190倍收益

美国联邦储备委员会21日发布的7月货币政策会议纪要显示,如果通货膨胀等经济数据走势继续如预期发展,美联储可能将在9月议息会议上降息。 下面图片,有很多数据接口,可以1对1帮助您解决代码、软件或者策略问题。 受此影响&#xff…

中国雕塑—孙溟㠭浅析碑帖《张猛龙碑》

中国雕塑——孙溟㠭浅析碑帖《张猛龙碑》 《张猛龙碑》 《张猛龙碑》是北魏时期的碑刻,全称是《魏鲁郡太守张府君清颂之碑》属正书体,北魏正光三年(公元522年)立碑。 碑文内容是赞颂鲁郡太守张猛龙尊孔兴办学校的事迹。 《张…

Redis 篇-深入了解 Redis 五种数据类型和底层数据结构(SDS、Intset、Dict、ZipList、SkipList、QuickList)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 Redis 底层数据结构 1.1 Redis 数据结构 - 动态字符串 SDS 1.2 Redis 数据结构 - Intset 1.3 Redis 数据结构 - Dict 1.3.1 Dict 的渐进式 rehash 1.4 Redis 数据…

记录-java web 生成并下载zip文件

java生成zip文件,zip文件分两种:一种是包含文件夹、一种是不包含文件夹 生成zip文件的方式 ZipOutputStream zipOutputStream new ZipOutputStream(response.getOutputStream());// 文件夹名称String folder "download/";ZipEntry ze new Z…

测试必存!12种网站崩溃的原因及排查方法!

网站崩溃是研发团队最怕看到的情况,但是由于种种原因却时常出现,作为测试人员,我们更应该比一般人了解网站崩溃的原因及排查方法,这是我们测试工作的重要一环。 接下来我就谈谈12种常见的网站崩溃原因以及如何跟踪和解决它们。 你…

《CUDA编程》2.CUDA中的线程组织

0 来自GPU的hello world 在visua studio 中新建一个CUDA runtime项目&#xff0c;然后把kernel.cu中的代码删掉&#xff0c;输入以下代码 #include"cuda_runtime.h" #include"device_launch_parameters.h"#include<stdio.h>__global__ void hello_…

VM ware的安装——个人使用

VM ware的安装 Workstation 和 Fusion 对个人使用完全免费&#xff0c;企业许可转向订阅 如果没有官方账号需要注册一个 选择个人下载&#xff0c;会跳转到下一个页面 要勾选同意&#xff0c;才能下载 点击下载之后还会跳转到填写地址的页面&#xff0c;填写完同意后&#x…

合宙LuatOS应用,与时间相关那些事

合宙嵌入式操作系统LuatOS——在蜂窝物联网模组上推出开源二次开发框架&#xff0c;功能齐全性能稳定&#xff0c;可大幅度降低用户的研发成本和研发周期。 在LuatOS中&#xff0c;获取时间函数用得最多的就是os.time()函数了。接下来&#xff0c;我会讲一些与这个函数以及其他…

美团外卖霸王餐系统有哪些优势?如何选择?

外卖霸王餐系统是一种流行的营销策略&#xff0c;旨在通过提供免费或优惠的餐食来吸引新顾客和提升品牌知名度。美团外卖平台本身拥有巨大的流量&#xff0c;美团霸王餐作为美团外卖平台推出的营销服务&#xff0c;能够充分利用这一流量优势。商家在平台上发布霸王餐活动信息&a…

美业门店怎么提升业绩?连锁美业门店管理系统收银系统拓客系统源码

美业门店想要提升业绩&#xff0c;需要考虑多方面的因素&#xff0c;并采取综合性的方法。以下是一些可以考虑的因素和建议&#xff1a; 产品与服务优化&#xff1a; 提供高质量的美容产品和服务&#xff0c;确保顾客满意度。不断更新产品线&#xff0c;引入新的时尚趋势&#…

Ansible流程控制-条件_循环_错误处理_包含导入_块异常处理

文章目录 Ansible流程控制介绍1. 条件判断2. 循环3. 循环控制4. 错误处理5. 包含和导入6. 块和异常处理7. 角色的流程控制*include_tasks、import_tasks_include之间的区别 条件语句再细说且、或、非、是模糊条件when指令的详细使用方法 循环语句再细说如何使用使用item变量结合…

应用targetSdkVersion升级指导

应用targetSdkVersion升级指导 应电信终端产业协会&#xff08;TAF&#xff09;发布的《移动应用软件高 API 等级预置与分发自律公约》&#xff08;以下简称《公约》&#xff09;要求&#xff1a;截止到2019年5月1日所有新发布的应用 API 必须为26或更高&#xff0c;2019年8月…

What is the OpenAI Chat Completion API tools/functions property format?

题意&#xff1a;OpenAI 聊天完成 API 的工具/函数属性格式是什么 问题背景&#xff1a; Is there any clear documentation on the format of OpenAIs Chat Completion API tools/functions object format? I understand its JSON, but there appear to be underlying requi…

tauri开发软件中,使用tauri自带的api用浏览器打开指定的url链接

有能力的可以看官方文档&#xff1a;shell | Tauri Apps 就是使用这个api来打开指定的url链接&#xff0c;要在tauri.config.json中配置打开这个api&#xff1a; 然后在前端页面中导入使用&#xff1a; import { open } from tauri-apps/api/shell; // opens the given URL o…

Cpp类和对象(下)(6)

文章目录 前言一、初始化列表概念使用注意实际运用explicit关键字初始化列表的总结 二、static成员static成员的概念static成员的特性static的一个实用场景 三、友元友元函数友元类 四、内部类概念特性 五、匿名对象六、再次理解封装和面向对象总结 前言 Hello&#xff0c;本篇…