django项目 法律法规管理系统

news2025/1/12 16:05:59

1.项目结构

2.项目需求
  1.用户管理模块
  2.数据采集模块
  3.知识管理模块
  4.智能匹配模块
  5.个人收藏模块
  6.数据分析模块
  7.页面展示模块

3.知识点

  1.智能匹配模块推荐算法的实现原理

        TF (Term Frequency):词频,表示一个词在文档中出现的频率。如果一个词在文档中出现的次数越多,那么它的 TF 值就越大。

        IDF (Inverse Document Frequency):逆文档频率,表示一个词的稀有程度。如果一个词在很多文档中都出现过,那么它的 IDF 值就越低,说明这个词的重要性可能不高。IDF 的计算方式是对总文档数目除以包含该词的文档数目,然后取对数。

        TF-IDF 的计算方式是将 TF 和 IDF 相乘,以衡量一个词在文档中的重要性。TF-IDF 旨在找出在当前文档中频繁出现,但在整个文集中很少出现的词,这些词可能具有较高的区分度。

        接下来,使用 TF-IDF 转换文本内容为特征向量,主要步骤如下:

        分词:首先将文本内容进行分词,将其划分为单词或者短语。

        计算词频 TF:对于每个词或短语,计算其在文档中出现的频率。

        计算逆文档频率 IDF:对于整个文集中的每个词或短语,计算其逆文档频率。

        计算 TF-IDF 值:将每个词或短语的 TF 乘以 IDF,得到 TF-IDF 值。

        特征向量表示:将每个文档表示为一个向量,其中向量的每个维度对应一个词或短语的 TF-IDF 值。

        一旦文本内容被转换为 TF-IDF 特征向量,就可以使用余弦相似度来计算文档之间的相似度。余弦相似度是一种常用的相似度度量方法,计算两个向量之间的余弦值,值越接近1表示两个向量越相似,值越接近0表示两个向量越不相似。在这个场景下,使用余弦相似度可以度量用户收藏的法律文件与所有法律文件之间的相似度,从而找出最相似的法律文件进行推荐。

  2.余弦相似度是什么?

        余弦相似度是一种用于衡量两个向量之间相似度的方法。在机器学习和信息检索等领域经常会用到余弦相似度来比较文本、图像、音频等数据之间的相似程度。

余弦相似度通常用于处理高维度的数据,特别是文本数据。在文本数据中,每个文档可以表示为一个向量,其中每个维度对应于一个单词,并且向量的值表示该单词在文档中的出现频率或权重。然后可以使用余弦相似度来比较两个文档之间的相似程度。

余弦相似度的计算公式如下:

similarity(𝐴,𝐵)=𝐴⋅𝐵∥𝐴∥∥𝐵∥similarity(A,B)=∥A∥∥B∥A⋅B​

其中,𝐴A 和 𝐵B 是两个向量,𝐴⋅𝐵A⋅B 是它们的点积,∥𝐴∥∥A∥ 和 ∥𝐵∥∥B∥ 分别是它们的范数(长度)。

余弦相似度的取值范围在 -1 到 1 之间,当两个向量方向相同时取得最大值1,方向相反时取得最小值-1,如果两个向量正交(垂直),则相似度为0。

在实际应用中,通常将余弦相似度用于计算两个文档之间的相似程度,以便进行文本分类、信息检索、推荐系统等任务。

4.主要代码(部分)

#用户数据分析
def data_analysis(request):
    if 'user_id' in request.session:
        user_id = request.session['user_id']
        
        # 执行SQL查询
        with connection.cursor() as cursor:
            cursor.execute("""
                SELECT 法律.*
                FROM 用户收藏
                INNER JOIN 法律 ON 用户收藏.legal_id = 法律.ID
                WHERE 用户收藏.user_id = %s
            """, [user_id])
            rows = cursor.fetchall()
        cursor.close()
        if rows:
                
            # 将查询结果转换成DataFrame
            columns = ['ID', '标题', '办公室', '发布日期', '到期日期', '类型', '状态', 'URL', '点击量']
            df = pd.DataFrame(rows, columns=columns)
            
            # 统计分析
            num_collections = len(df)
            type_counts = df['类型'].value_counts()
            
            plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置中文字体为黑体
            plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示为方块的问题
            
            # 可视化分析
            plt.figure(figsize=(8, 6))
            type_counts.plot(kind='bar')
            plt.title('收藏法律文件类型统计')
            plt.xlabel('文件类型')
            plt.ylabel('收藏数量')
            plt.xticks(rotation=45)
            plt.tight_layout()
            
            # 将图表数据转换成base64编码的字符串
            buffer = io.BytesIO()
            plt.savefig(buffer, format='png')
            buffer.seek(0)
            plot_data = base64.b64encode(buffer.read()).decode('utf-8')
            plt.close()
            
            # 查询时间序列数据
            with connection.cursor() as cursor:
                cursor.execute("""
                    SELECT DATE(timestamp) AS date, COUNT(*) AS num_collections
                    FROM 用户收藏
                    WHERE user_id = %s
                    GROUP BY DATE(timestamp)
                    ORDER BY DATE(timestamp)
                """, [user_id])
                rows = cursor.fetchall()
            cursor.close()
            
            # 将查询结果转换成DataFrame
            columns = ['date', 'num_collections']
            time_series_df = pd.DataFrame(rows, columns=columns)
            
            # 时间序列可视化分析
            plt.figure(figsize=(10, 6))
            plt.plot(time_series_df['date'], time_series_df['num_collections'], marker='o', linestyle='-')
            plt.title('收藏数量随时间变化趋势')
            plt.xlabel('日期')
            plt.ylabel('收藏数量')
            plt.xticks(rotation=45)
            plt.tight_layout()
            
            # 将时间序列图表数据转换成base64编码的字符串
            buffer = io.BytesIO()
            plt.savefig(buffer, format='png')
            buffer.seek(0)
            time_series_plot_data = base64.b64encode(buffer.read()).decode('utf-8')
            plt.close()
            
            # 查询与当前用户共享收藏的其他用户数量
            with connection.cursor() as cursor:
                cursor.execute("""
                    SELECT COUNT(DISTINCT user_id) AS shared_users
                    FROM 用户收藏
                    WHERE legal_id IN (
                        SELECT legal_id
                        FROM 用户收藏
                        WHERE user_id = %s
                    )
                    AND user_id != %s
                """, [user_id, user_id])
                shared_users_count = cursor.fetchone()[0]
            cursor.close()

            
            # 将统计分析和时间序列分析的结果和图表数据传递给模板
            context = {
                'num_collections': num_collections,
                'type_counts': type_counts,
                'plot_data': plot_data,
                'time_series_plot_data': time_series_plot_data,
                'shared_users_count': shared_users_count,
                
            }
            return render(request, 'data_analysis.html', context)
        else:
            return render(request, 'data_analysis.html', context = {
                'num_collections': '',
                'type_counts': '',
                'plot_data': '',
                'time_series_plot_data': '',
                'shared_users_count': '',
            })
    else:
        return render(request, 'login.html')
def user_management(request):
    if 'user_id' in request.session:
        if request.method == 'POST':
            email = request.POST.get('email')
            new_password = request.POST.get('new_password')
            user_id = request.session['user_id']
            # 检查用户输入的邮箱是否存在于数据库中
            try:
                user = User.objects.get(email=email,id=user_id)
            except User.DoesNotExist:
                return render(request, 'user_management.html', {'error_message': 'Invalid email'})

            # 更新用户密码为新密码
            user.password = new_password
            user.save()

            return render(request, 'user_management.html', {'reset_password_sent': True})
        else:
            return render(request, 'user_management.html')
    else:
        return render(request, 'login.html')

5.运行效果

 

 

6.遇到问题及总结:

        1.特别多的问题,例如前端获取不到数据给后端,ajax传递数据老是报错,

        2.学会了很多,例如模态框,数据大屏,推荐算法等等 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1486074.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Latex常用符号和技巧

Latex常用符号和技巧 随笔记录,不分顺序 一些有用的Latex资源 https://latexstudio.net/ https://www.latexstudio.net/articles/ IEEE相关文件(包括IEEETransaction Latex模板,参考文件模板,相关文件和个人搜集的Latex说明文件等) 链接:https://pan.baidu.com/s/1NJ…

每个大模型开发者都应该知道的数字

GitHub - ray-project/llm-numbers: Numbers every LLM developer should know 谷歌内部流传了一份由传奇工程师 Jeff Dean 整理的文档,名为《每个工程师都应该知道的数字》。大语言模型(LLM)开发人员们同样需要一组类似的数字为粗略计算做参…

steam++加速问题:出现显示443端口被 vmware-hostd(9860)占用的错误。

目录 前言: 正文: 前言: 使用Steam对GitHub进行加速处理时,建议使用2.8.6版本。 下载地址如下:Release 2.8.6 BeyondDimension/SteamTools GitHub 下载时注意自己的系统位数 正文: 使用GitHub时会使…

Spring重点记录

文章目录 1.Spring的组成2.Spring优点3.IOC理论推导4.IOC本质5.IOC实现:xml或者注解或者自动装配(零配置)。6.hellospring6.1beans.xml的结构为:6.2.Spring容器6.3对象的创建和控制反转 7.IOC创建对象方式7.1以有参构造的方式创建…

WPF应用程序使用MVVM模式

文章目录 一、前言二、正文:模式 - WPF应用程序使用MVVM设计模式2.0 一些术语2.1 秩序与混乱2.2 MVVM模式的演变2.3 为何WPF开发者喜爱MVVM2.4 Demo应用程序2.5 路由命令逻辑2.6 ViewModel类层次结构2.7 ViewModelBase类2.8 CommandViewModel类2.9 MainWindowViewMo…

spring注解驱动系列--自动装配

Spring利用依赖注入(DI),完成对IOC容器中中各个组件的依赖关系赋值;依赖注入是spring ioc的具体体现,主要是通过各种注解进行属性的自动注入。 一、Autowired:自动注入 一、注解介绍 1、默认优先按照类型去…

MySQL进阶:InnoDB引擎(逻辑存储结构、架构、事务原理、MVCC(面试高频))

👨‍🎓作者简介:一位大四、研0学生,正在努力准备大四暑假的实习 🌌上期文章:MySQL进阶:全局锁、表级锁、行级锁总结 📚订阅专栏:MySQL进阶 希望文章对你们有所帮助 MVCC很…

jenkins实战(1)

一, Jenkins官网介绍: Jenkins 持续集成、持续部署 下载地址:Jenkins download and deployment 提供两种类型: LTS(长期版)和Weekly(最近一周的版本) 注: 必须是Java8及以上版本(官网针对这一点有做说明) 二, 安装 下载war包,java -jar XXX --httpPort8081 或 下载war包…

为什么说 TiDB 在线扩容对业务几乎没有影响

本文讨论了分布式数据库在在线扩容方面的挑战, 详细解释了一般分布式数据库和 TiDB 在扩容机制上的不同。 一般分布式数据库在进行在线扩容时,需要重新平衡数据分布,可能会影响系统的可用性和 IO 消耗。 相比之下,TiDB 的存算分离…

五、西瓜书——集成学习

1.个体与集成 集成学习通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化性能,这对“弱学习器”(weak learner)尤为明显因此集成学习的很多理论研究都是针对弱学习器进行的而基学习器有时也被直接称为弱学习器。 要获得好的集成个体学习器应“好而不同”…

mybatis开发一个分页插件、mybatis实现分页、mybatis拦截器

mybatis开发一个分页插件、mybatis实现分页、mybatis拦截器 通过官网的mybatis插件说明可知,我们可以通过拦截器进行开发一个插件。 例如这样的: UserMapper mapper sqlSession.getMapper(UserMapper.class);// 开始分页MagicPage.startPage(1, 3);//…

八. 实战:CUDA-BEVFusion部署分析-分析BEVFusion中各个ONNX

目录 前言0. 简述1. camera.backbone.onnx(fp16)2. camera.backbone.onnx(int8)3. camera.vtransform.onnx(fp16)4. fuser.onnx(fp16)5. fuser.onnx(int8)6. lidar.backbone.xyz.onnx7. head.bbox.onnx(fp16)总结下载链接参考 前言 自动驾驶之心推出的《CUDA与TensorRT部署实战…

【C++】vector的使用和模拟实现(超级详解!!!!)

文章目录 前言1.vector的介绍及使用1.1 vector的介绍1.2 vector的使用1.2.1 vector的定义1.2.2 vector iterator 的使用1.2.3 vector 空间增长问题1.2.3 vector 增删查改1.2.4 vector 迭代器失效问题。(重点!!!!!!)1.2.5 vector 在OJ中有关的练习题 2.ve…

蓝桥杯倒计时 41天 - KMP 算法

KMP算法 KMP算法是一种字符串匹配算法,用于匹配模式串P在文本串S中出现的所有位置。 例如S“ababac,P“aba”,那么出现的所有位置是13。 在初学KMP时,我们只需要记住和学会使用模板即可,对其原理只需简单理解&#xff…

WiFi模块引领智能家居革命:连接未来的生活

随着科技的快速发展,智能家居正成为现代生活的一部分,极大地改变了我们与家庭环境互动的方式。其中,WiFi模块作为关键的连接技术,在推动智能家居革命中发挥着不可忽视的作用。本文将深入探讨WiFi模块如何驱动智能家居革命。 设备互…

Maven实战(2)之搭建maven私服

一, 背景: 如果使用国外镜像,下载速度比较慢; 如果使用阿里云镜像,速度还算OK,但是假如网速不好的时候,其实也是比较慢的; 如果没有网的情况下更加下载不了. 二, 本地仓库、个人/公司私服、远程仓库关系如下: 三, 下载安装nexus私服 略

如何在Window系统部署VisualSVN服务并结合cpolar实现无公网ip远程访问

文章目录 前言1. VisualSVN安装与配置2. VisualSVN Server管理界面配置3. 安装cpolar内网穿透3.1 注册账号3.2 下载cpolar客户端3.3 登录cpolar web ui管理界面3.4 创建公网地址 4. 固定公网地址访问 前言 SVN 是 subversion 的缩写,是一个开放源代码的版本控制系统…

Mixtral模型解读

Mixtral 8x7B(Mistral MoE) 1.Mistral 7B模型 Mistral 7B模型与Llama2 7B模型结构整体上是相似的,其结构参数如下所示。 细节上来说,他有两点不同。 1.1SWA(Sliding Window Attention) ​ 一般的Attention来说,是Q与KV-Cache做内积&#…

23端口登录的Telnet命令+传输协议FTP命令

一、23端口登录的Telnet命令 Telnet是传输控制协议/互联网协议(TCP/IP)网络(如Internet)的登录和仿真程序,主要用于Internet会话。基本功能是允许用户登录进入远程主机程序。 常用的Telnet命令 Telnet命令的格式为&…

基础算法(四)(递归)

1.递归算法的介绍: 概念:递归是指函数直接或间接调用自身的过程。 解释递归的两个关键要素: 基本情况(递归终止条件):递归函数中的一个条件,当满足该条件时,递归终止,避…