某音短视频评论采集翻页(移动安全篇)

news2024/9/21 4:26:57

本章测试一个作品的评论及翻页:

以及前面的抓x包方式,在专栏里也有很多,xposed抓包过sslping,通用版本等;

https://codeooo.blog.csdn.net/category_11500477.html

翻页通过页码来控制:
在这里插入图片描述

# -*- coding: utf-8 -*-
# @Author  : Codeooo
# @Time    : 2023-02-09
import gzip
import json
import time
import hashlib
import requests


def test_6god(url, data):
    god6_url = 'http://119.91.218.111:9050/6god'
    god_data = {
        "url": url,
        "headers": data,
        "token": "test",
    }
    response = requests.post(god6_url, headers={}, data=god_data)
    return response.json()


def test_4god(url, data, cookies=""):
    god6_url = 'http://119.91.218.111:9051/4god'
    god_data = {
        "url": url,
        "headers": data,
        "cookie": cookies,
        "token": "test",
    }
    response = requests.post(god6_url, headers={}, data=god_data)
    return response.json()


def md5(str):
    post_data = gzip.compress(bytes(json.dumps(str), encoding="utf8"))
    m = hashlib.md5()
    m.update(bytes(post_data))
    str_md5 = m.hexdigest()
    return str_md5.upper()


def get_keyword(device_id, iid, keyword, page, proxies):
    url = f"https://aweme.snssdk.com/aweme/v1/search/item/?os_api=25&device_type=Pixel+XL&ssmix=a&manifest_version_code=180101&dpi=560&is_guest_mode=0&app_name=aweme&version_name=18.1.0&ts={int(time.time())}&cpu_support64=true&app_type=normal&appTheme=light&ac=wifi&host_abi=armeabi-v7a&channel=wandoujia_lesi_1128_0629&update_version_code=18109900&_rticket=1686903952535&device_platform=android&iid={iid}&version_code=180100&cdid=0528d7f9-bb0f-4d1d-b142-097951a0629d&os=android&is_android_pad=0&openudid=60a02c5de917fa4c&device_id={device_id}&package=com.ss.android.ugc.aweme&resolution=1440*2392&device_brand=google&language=zh&os_version=7.1.2&need_personal_recommend=1&aid=1128&minor_status=0"

    data = {
        "keyword": keyword,
        "offset": page,
        "count": "12",
        "source": "video_search",
        "from_user": "",
        "search_source": "switch_tab",
        "is_pull_refresh": "1",
        "hot_search": "0",
        "search_id": "",
        "query_correct_type": "1",
        "is_filter_search": "0",
        "sort_type": "0",
        "publish_time": "0",
        "search_range": "0",
        "enter_from": "homepage_hot",
        "backtrace": "",
        "user_avatar_shrink": "64_64",
        "video_cover_shrink": "372_496",
        "previous_searchid": "20230616162541D17367263D89FB0029F7",
        "switch_tab_from": "general",
        "rs_word_count": "5",
        "location_permission": "0",
        "need_filter_settings": "1",
        "enable_history": "1"
    }

    headers = {
        "X-SS-STUB": md5(json.dumps(data)),
        "activity_now_client": str(int(time.time() * 1000)),
        "x-ss-req-ticket": str(int(time.time() * 1000)),
        "x-vc-bdturing-sdk-version": "2.2.1.cn",
        "passport-sdk-version": "20356",
        "sdk-version": "2",
        "User-Agent": "okhttp/3.10.0.1",
        # "X-Ladon": "Fmwzchui1d9Bq4YebHART+PamP6awv5wq1ovcMlrm2Ugad0r",
        # "X-Khronos": "1686900009",
        # "X-Gorgon": "8404e04200056c703e652c97d023fd0577de3ae546915de0072d",
        # "X-Medusa": "Kw2MZB9hGQgcf9b/zdmRAeG19ULZNGJF1QWJQlIBamjbj/Jvc4gOGDJHatwPrzkMg3XHeDG/D1HWp23rFtOEze91VQd1RsEa0oZb9JEbfJLPJNDQTvP+Yg7DAYpO1k5Q9CNldKbv6FuGuqfFBt8Llx8lvbu16yxbwExrxXIDpxetUkw9Y4p9jc5y1MFT222L9ex/DJ4jDpe4HGchME2XQT/ygJNHJ12MFMYk/sTRYbDCuzWFe2rqErJSAVREY53HHU1ovFgXB2YKLqghSk/ZD+5/9a70i8x5D85aJMxUa8U6BN5gG6l8+5/hc+9p/NHXX2WcIEj+zXxZ2uDCOZPO9vn/LDpzYM4UGKRDIKk4SstUKCLgRL8A7NmXbwqGmfl7FXM1fXserhP59EXBBryjUbjRoxlf/Q==",
        # "X-Helios": "Jcqpen49rqhO8rTb/3E9G+N85U65yy4//vupPM33B6BaoQ6S",
        # "X-Argus": "XdYCNeAU12qsWMY0anSNeqWBmM4FNPLHXe4HY3C0VK/rVajjGV6+S2hnYoODLJX3A9a9dHM4UouytekIw+D/CWb1izuwO9LADIV+ro/5WxZJBriWVODiRk7mSQJJZQ5uCtgeVmd8YmfubtAI/QKG0L+EkhVvblnRY5fO8JxSSsrhM51/nfC7vAZ1csVCJh7fBf8L43dM5M+60NtwYVbBjM36nKcq1Kd1DKRq9oZfqHn/Za6DUDwf1ejq7+qh615hennjTaZSrg8YHodkHgfHzOYy",
        "Content-Type": "application/x-www-form-urlencoded; charset=UTF-8",
        "Host": "aweme.snssdk.com",
        "Cookie": f"install_id={iid};",
    }

    # headers.update(test_6god(url, json.dumps(data)))
    headers.update(test_4god(url, json.dumps(data), headers["Cookie"]))
    # headers.update(test_4god(url, json.dumps(data)))

    response = requests.post(url=url, headers=headers, data=data, proxies=proxies)

    print("====>", response.text)
    # print("====>", response.headers)


if __name__ == '__main__':
    proxies = None
    device_id, iid = "3069485532583981", "1368252763082152"
    keyword = "成功"
    get_keyword(device_id, iid, keyword, "12", proxies)

评论:

在这里插入图片描述

# -*- coding: utf-8 -*-
# @Author  : Codeooo
# @Time    : 2023-06-15


import time
import requests


def test_6god(url, data):
    god6_url = 'http://119.91.218.111:9050/6god'
    god_data = {
        "url": url,
        "headers": data,
        "token": "test",
    }
    response = requests.post(god6_url, headers={}, data=god_data)
    return response.json()


def test_4god(url, data, cookies=""):
    god6_url = 'http://119.91.218.111:23517/4god'
    god_data = {
        "url": url,
        "headers": data,
        "cookie": cookies,
        "token": "test",
    }
    response = requests.post(god6_url, headers={}, data=god_data)
    return response.json()


def get_comment(device_id, iid, page, proxies):

    url = f"https://aweme.snssdk.com/aweme/v2/comment/list/?aweme_id=7203360425642102072&cursor={page}&count=20&insert_ids&address_book_access=2&gps_access=2&forward_page_type=1&channel_id=0&city=310000&hotsoon_filtered_count=0&hotsoon_has_more=0&follower_count=0&is_familiar=0&page_source=0&user_avatar_shrink=64_64&aweme_author=MS4wLjABAAAAm4S0tfufQuiNdHFdh9bQ3IR1OZJ9in1iEXDjQpdzmSc&item_type=0&comment_aggregation=0&top_query_word=%E5%A5%B3%E5%AD%90%E6%8A%B1%E7%9D%80%E5%AD%A9%E5%AD%90%E7%94%B7%E5%AD%90%E5%A4%A7%E6%89%93%E5%87%BA%E6%89%8B%E5%90%8E%E7%BB%AD&os_api=25&device_type=SM-G988N&ssmix=a&manifest_version_code=180101&dpi=320&is_guest_mode=0&app_name=aweme&version_name=18.1.0&ts={int(time.time())}&cpu_support64=false&app_type=normal&appTheme=light&ac=wifi&host_abi=armeabi-v7a&channel=wandoujia_lesi_1128_0629&update_version_code=18109900&_rticket=1677204785764&device_platform=android&iid={iid}&version_code=180100&cdid=f0d57e33-e858-4fb6-a6d1-d5df9dc54561&os=android&is_android_pad=0&device_id={device_id}&package=com.ss.android.ugc.aweme&resolution=1080*1920&device_brand=samsung&language=zh&os_version=7.1.2&need_personal_recommend=1&aid=1128&minor_status=0&mcc_mnc=46007"

    headers = {
        'Host': 'aweme.snssdk.com',
        'passport-sdk-version': '20356',
        'sdk-version': '2',
        "activity_now_client": str(int(time.time() * 1000)),
        "x-ss-req-ticket": str(int(time.time() * 1000)),
        'x-vc-bdturing-sdk-version': '2.2.1.cn',
        'user-agent': 'okhttp/3.10.0.1'
    }

    # headers.update(test_6god(url, json.dumps(headers)))
    headers.update(test_4god(url, "", ""))

    response = requests.get(url, headers=headers, proxies=proxies)
    print("====>", response.text)
    # print("====>", response.headers)


if __name__ == '__main__':
    proxies = None
     device_id, iid = "3069485532583981", "1368252763082152"
    get_comment(device_id, iid, "0", proxies)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/659895.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docker部署(1)——将jar包打成docker镜像并启动容器

在代码编写完成即将部署的时候,如果采用docker容器的方法,需要将jar包打成docker镜像并通过镜像将容器启动起来。具体的步骤如下。 一、首先下载java镜像 先使用docker search java命令进行搜索。 然而在拉取镜像的时候要注意不能直接去选择pull java ,…

kubernetes(k8s)理论篇

注意:kubeadm与docker是有版本要求的。 如果版本不兼容,初始化 kubeadm是会出现以下问题。 学习k8s掌握知识 基础概念 什么是 Pod 控制器类型 K8S 网络通讯模式 Kubernetes 构建 K8S 集群 资源清单 资源 掌握资源清单的语法 编写 Pod 掌握 Pod 的…

C国演义 [第四章]

第四章 全排列题目理解步骤树形图递归函数递归结束条件单层逻辑 代码 全排列II题目理解步骤递归函数递归结束条件单层逻辑 代码 全排列 力扣链接 给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 示例 1: 输…

简要介绍 | 深度学习中的自注意力机制:原理与挑战

注1:本文系“简要介绍”系列之一,仅从概念上对深度学习中的自注意力机制进行非常简要的介绍,不适合用于深入和详细的了解。 注2:"简要介绍"系列的所有创作均使用了AIGC工具辅助 深度学习中的自注意力机制:原…

android jetpack databinding的基本使用(java)

目录 databing的基本使用二级页面的绑定自定义BindingAdapter自定义BinddingAdapter的可选旧值双向绑定使用ObservableField来进行双向绑定 在recycleview中使用databinding databing的基本使用 开启databing android {........dataBinding{enable true} }修改布局文件 为布…

Unity UGUI6——UGUI进阶

一、UI 事件监听接口 ​ 目前所有的控件都只提供了常用的事件监听列表 ​ 如果想做一些类似长按,双击,拖拽等功能是无法制作的,或者想让 Image 和 Text,RawImage 三大基础控件能够响应玩家输入也是无法制作的 ​ 而事件接口就是…

Elasticsearch 基本使用(三)条件查询

条件查询 单条件查询matchdebug 查看分词结果match_phrase 多条件查询bool 子元素区别 单条件查询 match match 匹配字段,会对条件分词,然后每个词以or的关系在文档倒排索引内进行查询 GET bank/_search {"query": {"match": {&q…

一起学SF框架系列6.1-模块core-Resource

Java虽然提供了java.net.URL类和各种URL前缀处理程序来负责处理对各种资源的访问,但对于低级别资源的访问来说还是不够充分。例如,没有标准化的实现可用于访问需要从类路径中获取或者相对于一个ServletContext的资源;也没有检查所指向的资源是…

火影手游 问答题小抄

文章目录 Part.I IntroductionPart.II 一些常识Chap.I 基础常识Chap.II 人物相关Chap.III 原作相关Chap.III 游戏相关 Part.III 奥义 & 技能Chap.I S 忍Chap.II A 忍Chap.III B 忍Chap.IV C 忍 Part.IV 针对活动Chap.I 组织樱花祭Chap.II 樱花问答 Pary.V 名言Reference Pa…

群辉DSM7.2安装svn服务

Part1前言 今天研究了一晚上使用群辉安装svn,确实挺多坑的,总结记录一下。我的型号是DS220,版本为DSM 7.2 Part2安装docker 首先打开套件中心,如下图,检索docker 然后点击安装,安装之后打开如下&#xff1a…

Clickhouse之物化视图分享

前言 ClickHouse广泛用于用户和系统日志查询场景中,主要针对于OLAP场景,为业务方提供稳定高效的查询服务。在业务场景下,数据以不同的格式、途径写入到clickhouse。用传统JOIN方式查询海量数据,通常有如下痛点: 每个查询的代码冗…

【TOP生物信息】基于Scanpy的单细胞数据质控、聚类、标注

扫码关注下方公粽号,回复推文合集,获取400页单细胞学习资源! 「写在前面」 Python作为一种高级编程语言,被广泛用于单细胞数据分析,有着以下的优势: 「大量的生物信息学库:」 Python拥有大量的…

【UE 从零开始制作坦克】6-坦克开炮

效果 步骤 1. 添加初学者内容包(需要用到其中的音效和粒子效果) 2. 接下来制作坦克的炮弹 首先新建一个Actor蓝图类,作为所有发射物体(炮弹、机枪子弹等)的父类,这里命名为“TotalCategoryOfProjectile”…

从清华高材生拿到百万年薪offer说起

这几天在脉脉上看到一个很火的帖子,帖子内容是一位清华姚班毕业的博士,透露其拿到「亚马逊应用科学家」的offer,Base 110k/月+股票400K分四年给,还有195k的签字费。 清华姚班毕业薪资 看到这张截图博主留下了羡慕的泪…

搞懂了,React 中原来要这样测试自定义 Hooks

React 中自定义的 Hooks 为开发者提供了重用公共方法的能力。然而,如果你是一个测试新手的话,测试这些钩子可能会很棘手。本文中,我们将探索如何使用 React Testing Library 测试库来测试自定义钩子。 如何测试 React 组件 开始前&#xff…

【统计模型】生存分析基本知识介绍

目录 一、生存分析介绍 1.生存分析用途 2.传统方法在分析随访资料时的困难 (1)生存时间和生存结局都是我们关心的因素 (2)存在大量失访 (3)显然,将失访数据无论是算作死亡还是存活都不合理…

CSS基础学习--20 提示工具(Tooltip)

一、定义 提示工具在鼠标移动到指定元素后触发&#xff0c;总共四种样式实例&#xff1a; 二、基础提示框(Tooltip) 提示框在鼠标移动到指定元素上显示 <!DOCTYPE html> <html> <head> <meta charset"utf-8"> <title>CSS基础学习-提…

【RV1126】IIC驱动--EEPROM

文章目录 原理图查找空闲的I2CEEPROM芯片改设备树编写驱动驱动端设备端驱动端和设备端编译成驱动模块应用层的测试代码 原理图查找空闲的I2C 由上面可以知道&#xff0c;空闲了I2C4接口&#xff0c;然后也引出来了。 再找原理图找到具体引脚&#xff1a; I2C4_SCL&#xff1…

第 5 章 机器学习技术的应用(下)

全文目录 机器学习技术的实施方法 预测阶段效果监控 离线预测在线预测 监控点击率的稳定性 真实点击率的稳定性 计算相邻两个区间内点击率分布的 PSI(Population Stability Index, 群体稳定性指标), 小于 0.1 可认为数据相对稳定;预测点击率的稳定性 与系统本身和用户发生变…

Dice Loss

导读 ​ Dice Loss是由 Dice 系数而得名的&#xff0c;Dice系数是一种用于评估两个样本相似性的度量函数&#xff0c;其值越大意味着这两个样本越相似&#xff0c;Dice系数的数学表达式如下&#xff1a; Dice 2 ∣ X ∩ Y ∣ ∣ X ∣ ∣ Y ∣ \text { Dice }\frac{2|X \ca…