【随笔】博客质量分计算,如何让自己的博客脱颖而出,也许文章能够给你答案

news2025/1/9 0:31:33

作者:小5聊

简介:一只喜欢全栈方向的程序员,专注基础和实战分享,欢迎咨询,尽绵薄之力答疑解惑!

公众号:有趣小馆,一个有趣好玩的关键词回复互动式公众号,欢迎前来体验

1、标题质量

1.1、标题质量应该做到以下几点

符合自然语言语法的主谓/动宾结构

1

部分词汇在术语词典中,重点是主语和宾语

2

如果一个标题只有术语词典中的词,做一定的降权

3

标题的情感分析结果应趋向于中立,情绪激烈的予以降权

4

对包含负分数词汇的标题降权

1)排序依据

内容质量分,这个质量,并不是严格遵循主观上的内容质量,而仅仅是一个排序依据,

属于推荐系统的一部分

2)目标

基于统计算法而非人工干涉,尽可能在统计上将更优质的内容推荐给用户,

推荐系统也不能保证推荐的内容能够百分百就是用户想要的

1.2、标题推荐

标题推荐,主要目标是两个

1)第一个目标,标题应该符合专栏题材或搜索关键字

这方面,要重点对抗通过标题堆砌关键字来提高命中率的行为(标题堆砌,容易降权,需要特别注意)

2)第二个目标,标题要能符合文章本身的内容

要对抗“标题党”行为(容易降权,需要特别注意),目前C站博主大多数标题质量还是很高的,标题党占比率还是很低的,

个人也非常认同这一点,推荐到的文章,标题和内容都是非常匹配一致的,这点必须给C站技术人员点赞!

2、内容质量

标题的质量显然不能决定一篇文章的质量,博文内容评估仍然是一个比较难定量的问题,对文章的质量进行自动化的量化评估,是一件很有争议的事情,哪怕是仅仅评估文章的形式质量,也很难做到精准明确

1)高阶词汇的差文

博文目前存在的情况,内容可能命中很多高阶词汇,但仍然是一篇很差的文章,甚至可能是不符合自然语言的词语堆砌,仅仅是符合词法语法的机器判定

2)多项式评估

总体来说,质量分计算是一个多项式,它由一组指标项的加权求和,再乘一组因子项,求得的结果做归一化处理来实现

看到这个公式,只想说,算法是个技术量很高的领域,佩服做算法的程序员

函数 f(x):归一化处理的工具函数,主要是为了将计算结果约束在一个有限的区间内,便于比较

因子项p:指以乘法作用于质量分的那些指标项,它们通常都在(0, 1]区间

总结:从这个式子可以看出,每一个低分的因子会明显的降低最终的质量分,这些因子也基本都是一些降权机制

3)重点关注指标

内容质量,关注的指标

1

博客文章的长度

1)文章针对性强和目标清晰

直白点就是,文章说1就是1,不要说1出来1、2、3,没有一个重点,不符合标题和内容不匹配

2)太长或太短的文章,会被降低分数

3)避免啰嗦或者,导致糟糕的阅读体验

4)过长的文章也不利于读者消化吸收其中的知识

5)结构和章节清晰

一篇博客,更接近于一章甚至一节

6)过长文章,鼓励按专栏或者打标签,提高用户阅读体验和知识消化

7)段落结构,要主次分明,不要标题字段比内容还多

2

链接等超文本内容的比例和质量

1)超链接比例过高

显然是不正常的,这样的文章我们会予以降权,目前比例阀值非常的高,作者们可以放心,文章带有内部目录,或者常见的包含引用资料等链接的文章,不会触发这个规则,仅针对文章都是链接的情况

2)图片比例过高的文章进行降权

3

代码等文本格式问题

1)代码块格式混乱,或者行号串位,其中一部分我们通过技术手段识别出来,并对其降权

点击查看代码混乱例子:https://bbs.csdn.net/topics/392404771

2)

4

代码复杂度

1)非决定一篇文章的质量,但作为一个非关键性因素,尝试识别文章代码中包含的信息复杂程度,甄别出认真写作的作者,和一些可能存在的对抗行为

2)注水代码和无意义的代码,会降低质量分

3)代码质量分是加法项x中的一个指标,并不会决定性的提升最终的质量分

5

段落结构

1)合理的段落结构

鼓励在结构上均衡,不会有过多极短段落,也不会有非常长的长段落的文章

  • 代码复杂度,简单举例

第一段代码

for i in range(1, 10):
    print(i)

第二段代码

print(1)
print(2)
print(3)
print(4)
print(5)
print(6)
print(7)
print(8)
print(9)
print(10)

为什么会出现第二种情况,业内有一个笑话,说有团队按代码行数计算工作量,于是就有程序员把循环展开写

这两段代码在输入输出上是等效的,如果单纯按代码行数,第二段应该分数更高,但是在信息复杂度上,其实第一段比第二段更复杂,它描述了一个有边界条件的循环,而第二段是简单的重复。在我们的代码质量分计算中,第一段质量更高

3、实际验证,优化效果

通过小5的这篇文章来验证:【Sql Server】数据库的表变量和临时表的区别,并通过变量表随机生成姓名_小5聊的博客-CSDN博客

3.1、优化前文章质量分

3.2、优化后文章质量分

优化方向

1)拆分代码展示和底部增加总结

影响不大

 

 2)增加内置目录和丰富内容描述

3)继续调整段落结构和完善内容描述,并更新内置目录

 4)标题优化

【Sql Server】数据库的表变量和临时表的区别,并通过变量表随机生成姓名

【Sql Server】数据库变量表和临时表的区别,并运用变量表遍历和随机生成姓名记录

 总结:CSDN 质量分是一项公开的 CSDN 博文内容质量分析服务,其综合分析了内容的标题、段落结构、正文长度、代码格式及复杂度、链接和超文本内容比例及质量等因素,为 IT 技术文章提供客观公共的质量分析结果。

【参考内容】

 官方博客质量分计算,推荐文章阅读,也是本篇文章的参考方向

博客质量分计算(一)

博客质量分计算(二)

博客质量分计算(三)

https://blog.csdn.net/ccat/article/details/127891341?spm=1001.2014.3001.5502

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/163811.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TSF微服务治理实战系列(四)——服务安全

一、导语 **道路千万条,安全第一条。治理不规范,老板两行泪”。**当企业从单体架构逐渐转向微服务架构时, 服务安全 的需求也随之分散到了整个微服务体系的各个部分中。这就需要构建一套配置活、成本低的安全防控体系,覆盖请求链…

基于javaweb(springboot)城市地名地址信息管理系统设计和实现

基于javaweb(springboot)城市地名地址信息管理系统设计和实现 博主介绍:5年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 超级帅帅吴 Java毕设项目精品实战案例《500套》 欢迎点赞 收藏 ⭐留言 文…

日志门面和日志框架(SpringBoot日志实现)

一、Springboot日志实现简介 SpringBoot是现今市场上最火爆用来简化spring开发的框架,springboot日志也是开发常用的日志系统。SpringBoot默认就是使用SLF4J作为日志门面,Logback作为日志实现来记录日志。 二、application.yml修改日志相关的配置 appl…

Spring入门-IOC/DI相关配置与使用(1)

文章目录Spring入门1,Spring介绍1.1 为什么要学?1.2 学什么?1.3 怎么学?2,Spring相关概念2.1 初识Spring2.1.1 Spring家族2.1.2 了解Spring发展史2.2 Spring系统架构2.2.1 系统架构图2.2.2 课程学习路线2.3 Spring核心概念2.3.1 目前项目中的问题2.3.…

修改RT-Thread 的启动流程,实现显式调用rtthread_startup

一、STM32 单片机的启动流程 单片机上电后,会首先执行定义在startup 文件 中的Reset_Handler 函数,Reset_Handler 函数会首先执行SystemInit 函数,执行完之后,再执行我们常见的main 函数。 二、RT-Thread 启动函数是怎么被调用的…

什么是最少知识原则?-外观模式

外观模式将一个或数个类的复杂的一切都隐藏在背后,只显露出一个干净美好的外观。 构建自己的家庭影院 //打开爆米花机,开始爆米花 popper.on(); popper.pop();//调整灯光亮度 lights.dim(10);//把屏幕放下 screen.down();//打开投影仪 projector.on();…

【阶段三】Python机器学习32篇:机器学习项目实战:关联分析的基本概念和Apriori算法的数学演示

本篇的思维导图: 关联分析模型:Apriori算法 关联分析的基本概念和Apriori算法 关联分析是数据挖掘中一种简单而实用的技术,它通过深入分析数据集,寻找事物间的关联性,挖掘频繁出现的组合,并描述组合内对象同时出现的模式和规律。例如,对超市购物的数据进行关联…

缓存Cache-Control

可缓存性指定哪些地方可以缓存publichttp请求返回的过程中,http请求返回的内容所经过的任何路径包括:中间的代理服务器,发出请求的客户端浏览器,都可以对返回的内容进行缓存。private发起请求的浏览器可以缓存。no-cache任何节点都…

【程序员高效率工具】PlantUML —— 使用代码快速绘制时序图、思维导图

本篇思维导图 前言 不管是在工作还是学习,特别是在项目计划初期,我们需要画大量的图将工作内容、项目方案等进行可视化描述,包括但不限于时序图、类图、思维导图等等。 但是对于不经常画图,或者经常使用键盘的孩子,手…

VMware三种网络模式的摸索

VMware三种网络模式的摸索 文章目录VMware三种网络模式的摸索前言一、桥接模式简要描述拓扑图展示配置测试优缺点二、NAT模式简要描述拓扑图展示配置测试优缺点三、仅主机模式简要描述拓扑图展示配置测试优缺点3.总结前言 注意:所有的测试请关闭虚拟机和主机的防火…

微信小程序 - 实现手机号登录--授权并获取手机号保存至本地

详细代码请见文档最下方,仅供参考,更多需要请查看官方文档 一、 微信官方文档 | 获取手机号 这是服务端的 这是我们前端获取手机号需要给接口传递的两个参数 注意: 参数一:获取access_token需要用到小程序密钥,这个…

你可能不知道的20个Git命令,但真的很实用

如果您曾经浏览过git 手册(或 run man git),那么您会注意到 git 的功能比我们大多数人每天使用的要多得多。很多这些命令都非常强大,可以让你的生活更轻松(其他命令有点小众,但仍然很高兴知道)。…

QT-QStackedWidget多窗口应用

前言: 多窗口应用,例如某微信,页面由1,2,3个布局组成。 1-基本流程 页面1控制页面2,通过选择页面1上的按钮或控件 页面2控制页面3,通过选择页面2上的按钮或控件 2-其中页面2中的页面很…

100、【树与二叉树】leetcode ——105. 从前序与中序遍历序列构造二叉树+106. 从中序与后序遍历序列构造二叉树(C++版本)

106. 从中序与后序遍历序列构造二叉树 题目描述 原题链接:106. 从中序与后序遍历序列构造二叉树 解题思路 中序的特点:左中右,后序的特点:左右中。因此可通过后序序列找到中间结点,然后再根据中间结点,分…

3、关键词与标识符

目录 一、关键词 二、标识符 一、关键词 C语言中有32个关键字: 注意:在C语言中,关键字是不允许作为标识符出现在程序中的。 二、标识符 C语言标识符的命名规则: (1)所有标识符必须由字母或下画线开头…

KMP算法 看这一篇就够了 图解刨析+代码

目录 问题背景 逐步剖析 KMP如何优化暴力做法 思考 公共前后缀 next数组 如何构建next数组: 代码实现 问题背景 给定一个字符串 S,以及一个模式串P, P 在字符串 S 中多次作为子串出现。 求出模式串 P 在字符串 S 中所有出现的位置的起始下标。 …

说话人识别中的Temporal pooling(时序池化)

概述 Temporal pooling(时序池化)是说话人识别神经网络中,声学特征经过frame-level变换之后,紧接着会进入的一个layer。目的是将维度为(bs,F,T)(bs,F,T)(bs,F,T)的特征图,变换成维度为(bs,F)(bs,F)(bs,F)的特征向量 …

再不来看看常用的PyCharm快捷键就out了,玩转PyCharm仅此一篇!

最近在学习Python的数据可视化项目,在大学有学过Python,还有一些基础的。目前虽说已经工作,但是兴趣使然,依然想在空闲时间学一些其他技能来充实自己,未雨绸缪! 在使用工具的时候,必定会对工具有…

【话题:工作生活】2021年工作总结--这些人,那些事。

Hello Everyone, 我又开始撰写自己的工作总结了。2021年的工作总结,拖得太久,拖得我也不想写了。每次写自己一年的工作总结,总是要耗费我大量的时间与心力,有时,我也真的是心好累。 好了,懒散、…

【人工智能原理自学】隐藏层:神经网络为什么Working

😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔笔记来自B站UP主Ele实验室的《小白也能听懂的人工智能原理》。 🔔本文讲解隐藏层:神经网络为什么Working,一起卷起来叭! 目录一、…