Python批量下载主播照片,实现人脸识别, 进行颜值评分,制作颜值排行榜

news2024/11/15 7:25:22

昨晚一回家,表弟就神神秘秘的跟我说,发现一个高颜值网站,非要拉着我研究一下她们的颜值高低。

我心想,这还得要我一个个慢慢看,太麻烦了~

于是反手用Python给他写了一个人脸识别代码,把她们的照片全部爬下来,自动检测颜值打分排名。

这不比手动快多了?

准备工作

开发环境

  • Python 3.8
  • Pycharm

模块使用

  • requests >>> pip install requests
  • tqdm >>> pip install tqdm 简单实现进度条效果
  • os 文件操作
  • base64

照片采集部分

流程思路

  1. 明确需求:
    分析 主播照片 能够去哪里获取到 <开发者工具抓包分析图片数据来源>
    • 打开开发者工具: F12
    • 刷新网页
    • 点击 Img 查看图片链接地址
    • 通过关键字去搜索图片所对应的数据包
  2. 在这个链接里面就有想要图片数据内容
    • 发送请求, 模拟浏览器对于url地址发送请求
    • 获取数据, 获取服务器返回响应数据
    • 解析数据, 提取我们想要的内容 图片url 和 主播名字
    • 保存数据, 把图片数据内容保存本地文件夹里面

代码展示

# 导入数据请求模块
import requests
"""
发送请求, 模拟浏览器对于url地址发送请求
"""
# 模拟浏览器  headers 请求头 --> 字典数据类型, 构建完整键值对
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36'
}
# 请求链接
url = 'https://www.某牙.com/cache.php?m=LiveList&do=getLiveListByPage&gameId=1663&tagAll=0&page=2'
# 发送请求
# 调用requests模块里面get请求方法, 对于url地址发送请求并且携带上headers请求头伪装, 最后用response变量接受返回数据
response = requests.get(url=url, headers=headers)
# <Response [200]> 响应对象, 200状态码表示请求成功
print(response)
"""
- 获取数据, 获取服务器返回响应数据
    response.text 获取响应文本数据 <字符串数据>
    response.json() 获取响应json字典数据 <字典数据>

- 解析数据, 提取我们想要的内容 图片url 和 主播名字
    解析数据方法选择, 是根据返回数据内容来的
        键值对取值 <字典取值>
"""
# for循环遍历提取内容
for index in response.json()['data']['datas']:
    # 照片
    img = index['screenshot']
    # 名字
    name = index['nick']
    """
    保存数据
    """
    content = requests.get(url=img, headers=headers).content
    with open('img\\' + name + '.jpg', mode='wb') as f:
        f.write(content)
    print(name, img)

采集到的照片

评分排名部分

对于照片内容进行人脸检测, 颜值评分:

  1. 百度云API接口 --> 有现成文档代码
  2. 通过文档提供代码 先获取 access_token

代码部分

import time
# encoding:utf-8
import requests
import base64
from pprint import pprint
import os
from tqdm import tqdm
 
 
def Score(file):
    # client_id 为官网获取的AK, client_secret 为官网获取的SK
    host = 'https://aip.某度.com/oauth/2.0/token?grant_type=client_credentials&client_id=官网获取的AK&client_secret=官网获取的SK'
    response = requests.get(host)
    access_token = response.json()['access_token']
    '''
    人脸检测与属性分析
    '''
    # 读取一下图片数据
    f = open(file, mode='rb')
    # 转成 BASE64格式
    img_base = base64.b64encode(f.read())
    request_url = "https://aip.某度.com/rest/2.0/face/v3/detect"
    params = {
        # 传入图片BASE64格式
        "image":img_base,
        # 指定图片数据类型
        "image_type": "BASE64",
        # 检测类型 检测颜值评分
        "face_field": "beauty"
    }
    request_url = request_url + "?access_token=" + access_token
    headers = {'content-type': 'application/json'}
    json_data = requests.post(request_url, data=params, headers=headers).json()
    # KeyError: 'result' 因为识别失败了
    try:
        num = json_data['result']['face_list'][0]['beauty']
        # print('颜值分数是:', num)
        return num
    except:
        return '识别失败'
 
lis = []
# 读取文件路径
files = os.listdir('img\\')
print('正在颜值检测中, 请稍后......')
for file in tqdm(files):
    time.sleep(0.5)
    filename = f'img\\{file}'
    # 主播名字
    name = file.split('.')[0]
    # 评分
    num = Score(file=filename)
    if num != '识别失败':
        dit = {
            '主播': name,
            '颜值': num
        }
        lis.append(dit)
 
lis.sort(key=lambda x:x['颜值'], reverse=True)
page = 1
for li in lis:
    print(f'颜值排名第{page}的是{li["主播"]}, 颜值评分是{li["颜值"]}')
    page += 1

效果展示


好了文章内容就分享到这里,文章不理解的话,我还录制了对应的视频讲解,和代码一起打包好了。

包括文末这些资料,直接名片扫码领取。
备注【LL】快速通过验证


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/811801.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

06-行向量列向量_向量的运算 加法,数乘,减法,转置

行向量和列向量 行向量是按行把向量排开&#xff08;横着来写&#xff09;&#xff0c; 列向量是按列把向量排开&#xff08;竖着来写&#xff09; 在数学中我们更多的把数据写成列向量&#xff0c;在编程语言中更多的把数据存成行向量! 如果想在编程语言中把行向量转化成列…

人力资源管理系统servlet jsp人资企业办公java源代码mysql

本项目为前几天收费帮学妹做的一个项目&#xff0c;Java EE JSP项目&#xff0c;在工作环境中基本使用不到&#xff0c;但是很多学校把这个当作编程入门的项目来做&#xff0c;故分享出本项目供初学者参考。 一、项目描述 人力资源管理系统ervlet jsp 系统有1权限&#xff1a…

【计算机网络】408统考2014年题36

题目描述 【2014年题36】主机甲与主机乙之间使用后退N帧(GBN)协议传输数据&#xff0c;甲的发送窗口尺寸为1000&#xff0c;数据帧长为1000字节&#xff0c;信道带宽为100Mbps&#xff0c;乙每收到一个数据帧就立即利用一个短帧&#xff08;忽略其传输延迟&#xff09;进行确认…

动态sql以及常用的标签

什么是动态sql&#xff1a; 指根据不同的条件生成不同的sql 搭建环境&#xff1a; 建表&#xff1a; create table blog( id varchar(50) not null comment 博客id, title varchar(100) not null comment 博客标题, author varchar(30) not null comment 博客作者, create_ti…

基于springboot+mybatis+mysql+vue+html民宿管理平台

基于springbootmybatismysqlvuehtml民宿管理平台 一、系统介绍二、功能展示1.首页2.个人中心3.民宿信息浏览(用户)4房间信息浏览&#xff08;用户&#xff09;5.房间预订&#xff08;用户&#xff09;6.房间退订&#xff08;用户&#xff09;7.投诉反馈&#xff08;用户&#x…

如何配置保存cpolar所建立的隧道参数?

文章目录 可以利用cpolar建立一个能发布到公共互联网的网页&#xff0c;这是基于我们直接对cpolar进行即时设置&#xff0c;获得了能在公共互联网上访问本地数据的二级子域名。但如果电脑关闭重启后&#xff0c;如何让电脑自动启动cpolar&#xff0c;并记住设置好的域名参数文件…

一文搞懂自动驾驶芯片TDA4 启动流程

文章目录 TDA4架构简介TDA4启动流程DMSC ROM阶段MCU域R5 ROM阶段SBL阶段 TDA4架构简介 TDA4是德州仪器推出的一款高性能、超异构的多核SoC&#xff0c;拥有ARM Cortex-R5F、ARM Cortex-A72、C66以及C71内核&#xff0c;可以部署AUTOSAR CP系统、HLOS(Linux或QNX)、图像处理以及…

tinkerCAD案例:23.Tinkercad 中的自定义字体

tinkerCAD案例&#xff1a;23.Tinkercad 中的自定义字体 原文 Tinkercad Projects Tinkercad has a fun shape in the Shape Generators section that allows you to upload your own font in SVG format and use it in your designs. I’ve used it for a variety of desi…

Python实现GA遗传算法优化循环神经网络分类模型(LSTM分类算法)项目实战

说明&#xff1a;这是一个机器学习实战项目&#xff08;附带数据代码文档视频讲解&#xff09;&#xff0c;如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 遗传算法&#xff08;Genetic Algorithm&#xff0c;GA&#xff09;最早是由美国的 John holland于20世…

(文章复现)梯级水光互补系统最大化可消纳电量期望短期优化调度模型matlab代码

参考文献&#xff1a; [1]罗彬,陈永灿,刘昭伟等.梯级水光互补系统最大化可消纳电量期望短期优化调度模型[J].电力系统自动化,2023,47(10):66-75. 1.基本原理 1.1 目标函数 考虑光伏出力的不确定性&#xff0c;以梯级水光互补系统的可消纳电量期望最大为目标&#xff0c;函数…

递归求解汉诺塔问题(超详解)

问题提出 这个问题是关于三根柱子和一些圆盘的游戏。 初始时&#xff0c;所有的圆盘按照从大到小的顺序叠放在一根柱子上&#xff0c;目标是将所有圆盘从起始柱子移动到目标柱子上&#xff0c;在移动过程中&#xff0c;要满足以下规则喵&#xff1a; 每次只能移动一个圆盘。大圆…

混动才是未来?福特电车亏损数十亿美元,聚焦混动展望未来

福特汽车公司决定聚焦混合动力汽车&#xff0c;以弥补电动汽车市场亏损数十亿美元。吉姆法利首席执行官表示&#xff0c;在最新财报发布会上透露&#xff0c;未来将推出更多种类的混合动力车型。 福特最近公布了Q2盈亏情况&#xff0c;显示电动汽车部门的亏损有所增加。不过&am…

从源码角度配合网络编程函数accept() connect()等实现的客户端服务器通信 分析下 三握手四挥手都做了什么

首先我们先说下网络编程API&#xff1a; 数据在网络上通信&#xff0c;通信的双方一个是 客户端&#xff0c; 一个是 服务器 更具体来说&#xff0c;不是 客户端和服务器这两个机器在 经由互联网 进行通信&#xff0c; 而是 客户端上的某一进程 与 服务器端的某一进程 进…

vue3+ts未使用变量报错的解决

实例 问题原因 tsconfig.json文件中开启了ts语法检查 "strict": true, // 开启严格模式&#xff0c;检查类型声明和赋值...是否合法 "noUnusedLocals": true, // 检查是否存在未使用的变量 "noUnusedParameters": true, // 检查是否存在会使…

app性能测试怎么做?内容全在这里了

1 app性能测试 提到APP的性能测试这个概念比较笼统&#xff0c;因为APP的性能测试分为服务端的性能和手机端的性能测试 1.1 app服务端性能测试 app服务端的性能测试&#xff0c;利用jmeter等工具模拟并发&#xff0c;压测服务器系统&#xff0c;服务端性能测试&#xff0c;一…

Anaconda安装-超详细版(2023)

Anaconda安装 - 超详细版&#xff08;2023&#xff09; 前言&#xff1a;彻底卸载pythonAnaconda下载地址安装详细步骤配置环境变量检验安装是否成功更改conda源&#xff08;后续安装第三方库可以加快速度&#xff09;超详细彻底卸载Anaconda教程Tensorflow-gpu 安装 前言&…

2023.07.29 驱动开发DAY6

通过epoll实现一个并发服务器 服务器 #include <stdio.h> #include <string.h> #include <unistd.h> #include <sys/types.h> #include <sys/socket.h> #include <netinet/in.h> #include <arpa/inet.h> #include <sys/epoll.h…

Android getDrawable()和getColor()

Android getDrawable() 1.过时代码 虽然过时&#xff0c;但是不妨碍使用 context.getResources().getDrawable(R.drawable.xxx) 2.建议代码 context.getDrawable(R.drawable.xxx) 有API限制 3.最新代码 ContextCompat.getDrawable(getContext(), R.drawable.xxx); 有A…

C语言枚举与联合体详解

本篇文章带来枚举与联合体相关知识详细讲解&#xff01; 如果您觉得文章不错&#xff0c;期待你的一键三连哦&#xff0c;你的鼓励是我创作的动力之源&#xff0c;让我们一起加油&#xff0c;一起奔跑&#xff0c;让我们顶峰相见&#xff01;&#xff01;&#xff01; 目录 一…

Qt中文显示乱码问题

解决方法&#xff1a; 添加#pragma execution_character_set("utf-8");