【内容安全】微服务学习笔记八:使用腾讯云T-Sec天御对文本及图片内容进行安全检测

news2024/11/15 10:12:43

 8420b26844034fab91b6df661ae68671.png

 

个人简介: 

> 📦个人主页:赵四司机
> 🏆学习方向:JAVA后端开发 
> 📣种一棵树最好的时间是十年前,其次是现在!
> ⏰往期文章:SpringBoot项目整合微信支付
> 🧡喜欢的话麻烦点点关注喔,你们的支持是我的最大动力。

前言:

1.前面基于Springboot的单体项目介绍已经完结了,至于项目中的其他功能实现我这里就不打算介绍了,因为涉及的知识点不难,而且都是简单的CRUD操作,假如有兴趣的话可以私信我我再看看要不要写几篇文章做个介绍。

2.完成上一阶段的学习,我就投入到了微服务的学习当中,所用教程为B站上面黑马的微服务教程。由于我的记性不是很好,所以对于新事物的学习我比较喜欢做笔记以加强理解,在这里我会将笔记的重点内容做个总结发布到“微服务学习”笔记栏目中。我是赵四,一名有追求的程序员,希望大家能多多支持,能给我点个关注就更好了。

目录

一:需求分析

二:功能介绍

1.文本内容安全

2.图片内容安全

三:功能实现

1.前期工作  

 (1)开通服务并配置策略

(2)导入坐标

(3)配置腾讯云 API 访问密钥

2.代码实现

(1)文本内容安全

(2)图片内容安全

四:结果处理

1.返回参数

2.功能测试

(1)文本内容安全测试

(2)图片内容安全测试

(3)总结


一:需求分析

        由于我最近在做的是新闻体裁的项目,由于互联网的发展,网络上面经常充斥着很多不可控的风险因素,如色情暴力、垃圾广告等,因此发布文章需要进行审核才能发布到App端。如果全部都要人工审核的话会很耗时间,这时候就可以借助第三方提供的服务来对内容进行审核。市面上提供的内容安全审核服务有很多,如腾讯云、阿里云、网易易盾等,不过都是收费的,我是学生党,没必要为了一个项目而去购买这些服务(这些服务还不便宜),不过好在这些服务都会免费送一个月给新用户使用,这样就还有的玩。

二:功能介绍

1.文本内容安全

        什么是文本内容安全,主要指的是检测文本中是否包含色情暴力、广告内容等违规内容,并对检测出违规的文章进行屏蔽。而腾讯文本内容安全(Text Moderation System,TMS)是一款文本内容智能识别服务,对用户上传的文本进行内容安全识别,能够做到识别准确率高、召回率高,多维度覆盖对内容识别的要求,并实时更新识别服务的识别标准和能力。其具有以下特点:

  • 能够对文本文件进行多样化场景检测,精准识别文本中出现可能令人反感、不安全或不适宜的内容,有效降低内容违规风险与有害信息识别成本。
  • 能够精准识别涉黄等有害内容,支持用户配置词库,打击自定义的违规文本。文本内容安全服务能检测内容的危险等级,对于高危部分直接过滤,对于可疑部分提交人工复审,从而节省识别人力,降低业务风险。
  • 以开放 API(Application Programming Interface,应用程序编程接口)的方式提供服务,用户通过调用API即可获取识别结果,高效构建智能化业务系统,提升业务运营效率。

2.图片内容安全

        什么是图片内容安全,图片内容安全(Image Moderation System,IMS)是一款图片内容智能识别服务。能够对图片文件进行多样化场景检测,精准识别图片中出现可能令人反感、不安全或不适宜内容;帮助我们有效降低内容违规风险与有害信息过滤成本。 IMS也能对色情、广告等进行检测,还能自定义检测内容,当然文本内容安全也支持自定义检测内容。

三:功能实现

1.前期工作  

 (1)开通服务并配置策略

         要使用腾讯云的内容安全服务,首先需要注册一个腾讯与账号,并且开通相应的服务(文本内容安全&图片内容安全),然后可以在内容安全控制台创建自己的策略,具体配置教程见官方文档。

(2)导入坐标

         我使用的是Java语言进行开发,所以选择接入Java SDK进行接入,导入以下坐标

<!--腾讯云-->
<dependency>
    <groupId>com.tencentcloudapi</groupId>
    <artifactId>tencentcloud-sdk-java-cvm</artifactId>
    <version>3.1.528</version>
</dependency>
<dependency>
    <groupId>com.tencentcloudapi</groupId>
    <artifactId>tencentcloud-sdk-java-tms</artifactId>
    <version>3.1.528</version>
</dependency>
<dependency>
    <groupId>com.tencentcloudapi</groupId>
    <artifactId>tencentcloud-sdk-java-ims</artifactId>
    <version>3.1.528</version>
</dependency>

(3)配置腾讯云 API 访问密钥

        这两个服务都需要用到腾讯云API的访问密钥,因此使用在接入服务之前需要先申请自己的秘钥,申请地址点击这里。获取密钥之后,便可以将其配置到相应的微服务中,由于我使用了Nacos进行注册管理,这里我就将密钥信息放入Nacos配置中心中(密钥已部分删除,不能直接使用):

tencentcloud:
 secretId: AKIDjLjtq1rSe5JJ3
 secretKey: bxDFH66IH1glxeASULOJ

2.代码实现

(1)文本内容安全

  •  需要的参数:密钥信息、待检测文本(String类型)
  • 注意事项:不能直接将文本扔进去检测,检测之前需要对文本进行Base64加密
  • 返回类型:JSON
package com.my.common.tencentcloud;


import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import com.tencentcloudapi.common.Credential;
import com.tencentcloudapi.common.profile.ClientProfile;
import com.tencentcloudapi.common.profile.HttpProfile;
import com.tencentcloudapi.common.exception.TencentCloudSDKException;
import com.tencentcloudapi.tms.v20201229.TmsClient;
import com.tencentcloudapi.tms.v20201229.models.*;
import lombok.Getter;
import lombok.Setter;
import org.springframework.boot.context.properties.ConfigurationProperties;
import org.springframework.stereotype.Component;

import java.nio.charset.StandardCharsets;
import java.util.Base64;

@Getter
@Setter
@Component
@ConfigurationProperties(prefix = "tencentcloud")
public class TextDetection {
    private String secretId;
    private String secretKey;
    public JSONObject greenTextDetection(String text) throws TencentCloudSDKException {
        // 实例化一个认证对象,入参需要传入腾讯云账户secretId,secretKey,此处还需注意密钥对的保密
        Credential cred = new Credential(secretId, secretKey);

        // 实例化一个http选项,可选的,没有特殊需求可以跳过
        HttpProfile httpProfile = new HttpProfile();
        httpProfile.setEndpoint("tms.tencentcloudapi.com");

        // 实例化一个client选项,可选的,没有特殊需求可以跳过
        ClientProfile clientProfile = new ClientProfile();
        clientProfile.setHttpProfile(httpProfile);

        // 实例化要请求产品的client对象,clientProfile是可选的
        TmsClient client = new TmsClient(cred, "ap-guangzhou", clientProfile);
        // 实例化一个请求对象,每个接口都会对应一个request对象
        TextModerationRequest req = new TextModerationRequest();

        //Base64加密
        String encryptionText = Base64.getEncoder().encodeToString(text.getBytes(StandardCharsets.UTF_8));
        //设置内容参数
        req.setContent(encryptionText);

        // 返回的resp是一个TextModerationResponse的实例,与请求对象对应
        TextModerationResponse resp = client.TextModeration(req);

        // 输出json格式的字符串回包
        String result = TextModerationResponse.toJsonString(resp);
        return JSON.parseObject(result);
    }
}

(2)图片内容安全

  •  需要的参数:密钥信息、待检测图片URL路径
  • 注意事项:如果输入参数为待检测图片文件内容,也需要对其进行Base64编码,且图片大小不超过5MB
  • 返回类型:JSON
package com.my.common.tencentcloud;

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import com.tencentcloudapi.common.exception.TencentCloudSDKException;
import lombok.Getter;
import lombok.Setter;
import org.springframework.boot.context.properties.ConfigurationProperties;
import org.springframework.stereotype.Component;
import com.tencentcloudapi.common.Credential;
import com.tencentcloudapi.common.profile.ClientProfile;
import com.tencentcloudapi.common.profile.HttpProfile;
import com.tencentcloudapi.ims.v20201229.ImsClient;
import com.tencentcloudapi.ims.v20201229.models.*;

@Getter
@Setter
@Component
@ConfigurationProperties(prefix = "tencentcloud")
public class ImageDetection {
    private String secretId;
    private String secretKey;

    public JSONObject greenImageDetection(String imageUrl) throws TencentCloudSDKException {
        // 实例化一个认证对象,入参需要传入腾讯云账户secretId,secretKey,此处还需注意密钥对的保密
        Credential cred = new Credential(secretId, secretKey);

        // 实例化一个http选项,可选的,没有特殊需求可以跳过
        HttpProfile httpProfile = new HttpProfile();
        httpProfile.setEndpoint("ims.tencentcloudapi.com");

        // 实例化一个client选项,可选的,没有特殊需求可以跳过
        ClientProfile clientProfile = new ClientProfile();
        clientProfile.setHttpProfile(httpProfile);

        // 实例化要请求产品的client对象,clientProfile是可选的
        ImsClient client = new ImsClient(cred, "ap-guangzhou", clientProfile);

        // 实例化一个请求对象,每个接口都会对应一个request对象
        ImageModerationRequest req = new ImageModerationRequest();
        //设置图片url地址
        req.setFileUrl(imageUrl);

        // 返回的resp是一个ImageModerationResponse的实例,与请求对象对应
        ImageModerationResponse resp = client.ImageModeration(req);

        // 输出json格式的字符串回包
        String result = ImageModerationResponse.toJsonString(resp);

        return JSON.parseObject(result);
    }
}

四:结果处理

1.返回参数

两个服务返回的参数基本相同,见下表:

 f2a3b970fa8d47b0b87a67a7ef6e94bb.png 

我这里主要用到的参数是SubLabel参数,其包含Block(建议屏蔽)、Review(建议人工复审)、Pass(通过)三种类型。

2.功能测试

(1)文本内容安全测试

@Autowired
private TextDetection textDetection;
@Autowired
private ImageDetection imageDetection;

@Test
public void textTest() throws TencentCloudSDKException {
    JSONObject result_json = textDetection.greenTextDetection("冰毒");
    String result = (String) result_json.get("Suggestion");
    
    System.out.println(result);
}

f46382f9cd854317abd0d88737fae33e.png

 可以看到建议屏蔽。

(2)图片内容安全测试

检测图片:是一个冰毒图片,由于放上来会造成图片违规,这里就不放上来了,需要说明的是好像IMS对于纯图片识别效果不是很好,要是上面包含某些违规文字能够检测出来,应该是使用了OCR技术。

@Test
public void imageTest() throws TencentCloudSDKException {
    JSONObject result_json = imageDetection.greenImageDetection("http://49.234.52.192:9000/headlines/2022/07/21/e3428ce741f04602b6984196af18c4d4.png");
    String result = (String) result_json.get("Suggestion");
    System.out.println(result);
}

  77c74e35dd7e421f957b7ed13ba78ec7.png 

可以看到建议屏蔽。

(3)总结

         腾讯云T-Sec 天御的内容安全检测结果还是挺靠谱的,还能自定义检测内容,大大提高了检测的精准度,而且调用起来十分方便,用来做项目练手很不错。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/887935.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

安装paddlepadddle-gpu的正确方式

正确安装paddlepadddle-gpu的方式 1.查看系统CUDA版本2.参照飞桨官网快速pip安装 安装paddlepaddle时&#xff0c;pip install paddlepaddle是直接安装的CPU版本&#xff0c;要安装GPU版本的话&#xff0c;就要注意适配的CUDA版本&#xff0c;安装GPU版本可参照官网教程&#x…

做一个超简单的Python运行

作为一名专业的爬虫代理产品供应商&#xff0c;我知道很多人对Python爬虫有兴趣&#xff0c;但可能不知道该从何处入手。今天&#xff0c;我就来分享一个超简单的Python爬虫入门教程&#xff0c;希望能帮助到你们&#xff01;快点准备起来&#xff0c;让我们开始吧&#xff01;…

【C语言】数据在内存中的存储

大家好&#xff0c;我是苏貝&#xff0c;本篇博客介绍数据在内存中的存储&#xff0c;如果你觉得我写的不错的话&#xff0c;可以给我一个赞&#x1f44d;吗&#xff0c;感谢❤️ 使用的编译器为VS2019 文章目录 一.数据类型介绍类型的基本归类 二.整形在内存中的存储2.1 原码…

DMA技术

先总结: DMA是指外部设备不通过CPU而直接与系统内存交换数据的接口技术 主要工作是由DMA控制器来完成的. 下面开始正文 ---------------------------------------------------------------------------- 1、DMA由来 DMA(Direct Memory Access,直接存储器访问)。在&#xf…

主成分分析Python代码

对于主成分分析详细的介绍&#xff1a;主成分分析&#xff08;PCA&#xff09;原理详解https://blog.csdn.net/zhongkelee/article/details/44064401 import numpy as np import pandas as pd标准PCA算法 def standeredPCA(data,N): #data:…

Visualizing and Understanding Convolutional Networks阅读笔记

Visualizing and Understanding Convolutional Networks阅读笔记 摘要1. 前言 [ 1 ] ^{[1]} [1]2. 使用反卷积网络可视化3. 卷积网络可视化 [ 2 ] ^{[2]} [2]3.1 特征可视化3.2 训练过程中特征的演化3.3 特征不变性3.4 架构选择3.5 遮挡敏感性 参考文章 摘要 CNN模型已经取得了…

Linux 5种IO模型

Linux IO模型 网络IO的本质是socket的读取&#xff0c;socket在linux系统被抽象为流&#xff0c;IO可以理解为对流的操作。刚才说了&#xff0c;对于一次IO访问&#xff08;以read举例&#xff09;&#xff0c;数据会先被拷贝到操作系统内核的缓冲区中&#xff0c;然后才会从操…

【测试开发】基于 MeterSphere 的接口测试流程

基于 MeterSphere 的接口测试流程 MeterSphere 接口测试模块提供了 接口定义、接口自动化 等接口测试相关功能。 用户可以使用树状多级模块来分级分组管理项目下的接口列表&#xff0c;创建执行接口用例测试接口&#xff0c;组合编排多个接口用例进行场景自动化测试。 1 接口定…

caffe专题五——回归中——检测框架

一&#xff1a;Bounding-box regression回归 1.问题理解(为什么要做 Bounding-box regression&#xff1f; )如图 1 所示&#xff0c; 绿色的框为飞机的 Ground Truth, 红色的框是 Selective Search 提取的 Region Proposal。 那么即便红色的框被分类器识别为飞机&#xff0c;但…

Win10系统pytorch安装教程

前提&#xff1a;安装后Anaconda和NVIDIA显卡驱动 1. 确定支持的最高CUDA版本 确定支持的最高CUDA版本 记住这个CUDA版本&#xff0c;后面要用。 2. 新建conda虚拟环境 2.1 为conda配置清华镜像源 conda常用命令 打开Anaconda prompt窗口&#xff0c;使用如下命令&#xf…

学习心得01:STM32开发板

嵌入式开发也不难&#xff0c;相关知识需要学习。对于某个具体内容&#xff0c;需要反复测试、修改。 这是我买的一个开发板&#xff0c;各个范例都跑了一遍&#xff0c;有问题的还问过客服&#xff08;更新代码后解决&#xff09;。

[C++]笔记-函数的栈空间(避免栈空间溢出)

错误1 当数组的内存占用较大时,会引发异常 #include <iostream> using namespace std; int main() {char buff[2000000];cout << (int)buff[sizeof(buff) - 1] << endl; 错误 2 当调用次数较小的时候,栈内存还没有满,可以输出,该地址相减除以1024等于100,就…

​《乡村振兴战略下传统村落文化旅游设计 》在2023年畅销榜排名465位

​《乡村振兴战略下传统村落文化旅游设计 》在2023年畅销榜排名465位

T01西门子#将博图触摸屏中使用的外部图片全部导出

方法一&#xff1a;直接在博图软件WINCC中 点击图片右击 缺点&#xff1a;用自带的画图软件打开保存后无法保留透明。 方法二&#xff1a;使用官方软件导出 优点&#xff1a;快速批量全部导出&#xff0c;保留文件原格式。 下载地址&#xff1a; 将图形从 WinCC (TIA Portal) …

理解变分自编码器(VAE)

转载翻译自&#xff1a;https://towardsdatascience.com/understanding-variational-autoencoders-vaes-f70510919f73 介绍 在过去几年中&#xff0c;基于深度学习的生成模型因为在该领域中取得了一些惊人的进展而越来越受到关注。依靠大量的数据、精心设计的网络架构和智能训…

日志系统——实用类设计,日志等级类设计,日志消息类设计

一&#xff0c;实用类设计 该类主要是提前完成一些后面会用到的零碎通用的功能接口&#xff0c;主要有下面几个 1.获取系统时间&#xff1a;这里我们直接用time()函数获取时间返回 2.判断文件是否存在&#xff1a;判断文件我们调用系统接口&#xff0c;stat()&#xff0c;如下所…

Linux命令200例:top是一个基于终端的实时系统监控工具(常用)

&#x1f3c6;作者简介&#xff0c;黑夜开发者&#xff0c;全栈领域新星创作者✌。CSDN专家博主&#xff0c;阿里云社区专家博主&#xff0c;2023年6月csdn上海赛道top4。 &#x1f3c6;数年电商行业从业经验&#xff0c;历任核心研发工程师&#xff0c;项目技术负责人。 &…

新款2023奥迪A5新车32.24,这款车怎么样?

奥迪公司近期发布了新款A5车型&#xff0c;全国起售价为32.24万元。这款新车凭借其精致的设计和出色的实用性&#xff0c;吸引了大量消费者的关注。本文将结合个人经验和市场调研&#xff0c;对这款新车的特性进行深入剖析。 首先&#xff0c;奥迪A5的外观设计完美融合了实用性…

16.5 【Linux】SELinux 初探

16.5.1 什么是 SELinux SELinux是“ Security Enhanced Linux ”的缩写&#xff0c;字面上的意义就是安全强化的 Linux。 当初设计的目标&#xff1a;避免资源的误用 SELinux 是由美国国家安全局 &#xff08;NSA&#xff09; 开发的&#xff0c;当初开发这玩意儿的目的是因…

Centos7完全卸载已安装的Nginx

查看服务器上安装的nginx版本号&#xff0c;主要是通过ngix的-v或-V选项 Linux下查看Nginx安装目录、版本号信息? -v 显示 nginx 的版本。 -V 显示 nginx 的版本&#xff0c;编译器版本和配置参数。 [rootwww ~]# /usr/local/nginx/sbin/nginx -v nginx version: nginx/1.…