django-haystack,具有全文搜索功能的 Python 库!

news2024/12/28 20:21:10

目录

前言

安装与配置

全文搜索基础

搜索引擎配置

索引配置

搜索视图与模板

过滤器与排序

自定义搜索逻辑

应用场景

 1. 电子商务网站的商品搜索

 2. 新闻网站的文章搜索

 3. 社交网站的用户搜索

 4.企业内部系统的文档搜索

总结


前言

大家好,今天为大家分享一个非常实用的 Python 库 - django-haystack

Github地址:https://github.com/django-haystack/django-haystack


Django Haystack库是一个用于在Django项目中实现全文搜索功能的强大工具。它集成了各种搜索引擎,如Elasticsearch、Whoosh等,为开发者提供了灵活且高效的搜索解决方案。在本文中,将深入探讨Django Haystack库的安装、配置和应用,以及如何利用其丰富的功能来实现高级全文搜索功能。

安装与配置

首先,看看如何安装和配置Python Django Haystack库:

pip install django-haystack

安装完成后,在Django项目的 settings.py 文件中进行配置:

INSTALLED_APPS = [
    ...
    'haystack',
    ...
]

HAYSTACK_CONNECTIONS = {
    'default': {
        'ENGINE': 'haystack.backends.elasticsearch2_backend.Elasticsearch2SearchEngine',
        'URL': 'http://localhost:9200/',
        'INDEX_NAME': 'haystack',
    },
}

这样,就完成了Django Haystack库的安装和基本配置。

全文搜索基础

Django Haystack库实现全文搜索的基本原理是将数据索引化并存储到搜索引擎中,然后通过搜索引擎进行搜索查询。

以下是一个简单的数据模型示例:

from django.db import models
from haystack import indexes

class Book(models.Model):
    title = models.CharField(max_length=255)
    author = models.CharField(max_length=255)
    content = models.TextField()

class BookIndex(indexes.SearchIndex, indexes.Indexable):
    text = indexes.CharField(document=True, use_template=True)
    title = indexes.CharField(model_attr='title')
    author = indexes.CharField(model_attr='author')

    def get_model(self):
        return Book

在上述示例中,定义了一个Book模型和对应的BookIndex索引,通过使用 use_template=True 来使用模板定义索引字段。

搜索引擎配置

Django Haystack库支持多种搜索引擎,如Elasticsearch、Whoosh等。可以根据项目需求选择合适的搜索引擎并进行配置。

以下是一个使用Elasticsearch搜索引擎的配置示例:

HAYSTACK_CONNECTIONS = {
    'default': {
        'ENGINE': 'haystack.backends.elasticsearch2_backend.Elasticsearch2SearchEngine',
        'URL': 'http://localhost:9200/',
        'INDEX_NAME': 'haystack',
    },
}

通过这样的配置,可以使用Elasticsearch作为后端搜索引擎来实现全文搜索功能。

索引配置

在Django Haystack库中,可以定义和配置搜索索引来指定需要搜索的字段和权重。

以下是一个索引配置示例:

class BookIndex(indexes.SearchIndex, indexes.Indexable):
    text = indexes.CharField(document=True, use_template=True)
    title = indexes.CharField(model_attr='title')
    author = indexes.CharField(model_attr='author')

    def get_model(self):
        return Book

    def index_queryset(self, using=None):
        return self.get_model().objects.all()

在这个示例中,定义了text、title和author字段,并通过 use_template=True 来使用模板定义text字段。同时,实现了 index_queryset 方法来指定需要索引的查询集。

搜索视图与模板

在Django Haystack库中,可以通过视图处理搜索请求,并在模板中展示搜索结果。

以下是一个简单的搜索视图和模板示例:

from django.shortcuts import render
from haystack.query import SearchQuerySet

def search(request):
    query = request.GET.get('q', '')
    results = SearchQuerySet().filter(text=query)
    return render(request, 'search_results.html', {'results': results})

在搜索结果模板 search_results.html 中,我们可以展示搜索结果:

{% for result in results %}
    <h3>{{ result.title }}</h3>
    <p>{{ result.author }}</p>
    <p>{{ result.object.content }}</p>
{% endfor %}

过滤器与排序

Django Haystack库还支持在搜索结果中应用过滤器和排序规则来优化搜索体验。

以下是一个过滤器和排序示例:

from haystack.query import SearchQuerySet

# 过滤器示例
filtered_results = SearchQuerySet().filter(author='John Doe')

# 排序示例
sorted_results = SearchQuerySet().order_by('-pub_date')

通过这样的过滤器和排序操作,可以对搜索结果进行精确过滤和排序展示。

自定义搜索逻辑

Django Haystack库还允许开发者自定义搜索逻辑和权重,以进一步优化搜索结果的准确性和相关性。

以下是一个自定义搜索逻辑示例:

from haystack.query import SearchQuerySet
from haystack.inputs import Exact

# 自定义搜索逻辑示例
custom_results = SearchQuerySet().filter(content=Exact('Python programming'))

通过这样的自定义搜索逻辑,可以针对特定条件进行搜索,并获得更精确的搜索结果。

应用场景

 1. 电子商务网站的商品搜索

描述:电子商务网站通常需要提供强大的商品搜索功能,包括关键词搜索、过滤器、排序等功能。

示例代码:

     # 定义搜索索引
     class ProductIndex(indexes.SearchIndex, indexes.Indexable):
         text = indexes.CharField(document=True, use_template=True)
         title = indexes.CharField(model_attr='title')
         category = indexes.CharField(model_attr='category__name')

         def get_model(self):
             return Product
     ```
     ```python
     # 搜索视图
     class ProductSearchView(SearchView):
         template_name = 'product_search.html'
         queryset = Product.objects.filter(status='active')
     ```
     ```html
     <!-- product_search.html -->
     {% for result in page.object_list %}
         <h3>{{ result.object.title }}</h3>
         <p>Category: {{ result.object.category }}</p>
     {% empty %}
         <p>No results found.</p>
     {% endfor %}

 2. 新闻网站的文章搜索

描述:新闻网站需要提供快速、准确的文章搜索功能,帮助用户找到感兴趣的新闻内容。

示例代码:

     # 定义搜索索引
     class ArticleIndex(indexes.SearchIndex, indexes.Indexable):
         text = indexes.CharField(document=True, use_template=True)
         title = indexes.CharField(model_attr='title')
         author = indexes.CharField(model_attr='author__name')

         def get_model(self):
             return Article
     # 搜索视图
     class ArticleSearchView(SearchView):
         template_name = 'article_search.html'
         queryset = Article.objects.filter(status='published')
     <!-- article_search.html -->
     {% for result in page.object_list %}
         <h3>{{ result.object.title }}</h3>
         <p>Author: {{ result.object.author }}</p>
     {% empty %}
         <p>No results found.</p>
     {% endfor %}

 3. 社交网站的用户搜索

描述:社交网站需要提供用户搜索功能,让用户能够找到自己感兴趣的人或组织。

示例代码:

     # 定义搜索索引
     class UserProfileIndex(indexes.SearchIndex, indexes.Indexable):
         text = indexes.CharField(document=True, use_template=True)
         username = indexes.CharField(model_attr='user__username')
         bio = indexes.CharField(model_attr='bio')

         def get_model(self):
             return UserProfile
     # 搜索视图
     class UserProfileSearchView(SearchView):
         template_name = 'user_profile_search.html'
         queryset = UserProfile.objects.all()
     ```
     ```html
     <!-- user_profile_search.html -->
     {% for result in page.object_list %}
         <h3>{{ result.object.username }}</h3>
         <p>Bio: {{ result.object.bio }}</p>
     {% empty %}
         <p>No results found.</p>
     {% endfor %}

 4.企业内部系统的文档搜索

描述:企业内部系统需要提供文档搜索功能,帮助员工快速查找和访问企业文档资料。

示例代码:

     # 定义搜索索引
     class DocumentIndex(indexes.SearchIndex, indexes.Indexable):
         text = indexes.CharField(document=True, use_template=True)
         title = indexes.CharField(model_attr='title')
         category = indexes.CharField(model_attr='category__name')

         def get_model(self):
             return Document
     # 搜索视图
     class DocumentSearchView(SearchView):
         template_name = 'document_search.html'
         queryset = Document.objects.filter(status='published')
     ```
     ```html
     <!-- document_search.html -->
     {% for result in page.object_list %}
         <h3>{{ result.object.title }}</h3>
         <p>Category: {{ result.object.category }}</p>
     {% empty %}
         <p>No results found.</p>
     {% endfor %}

总结

Python Django Haystack库是一款强大的全文搜索引擎,适用于各种类型的项目,包括电子商务网站、新闻网站、社交网站和企业内部系统等。通过简单的配置和灵活的API,开发者可以轻松地实现高效的全文搜索功能,包括关键词搜索、过滤器、排序等功能。该库与不同的搜索引擎(如Elasticsearch、Whoosh等)兼容,提供了丰富的搜索索引和视图类,使得开发者能够快速构建可靠的搜索系统,提升用户体验和数据检索效率。总而言之,Python Django Haystack库为开发者提供了一个强大而灵活的工具,用于实现各种项目的全文搜索需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1564632.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2012年认证杯SPSSPRO杯数学建模A题(第一阶段)蜘蛛网全过程文档及程序

2012年认证杯SPSSPRO杯数学建模 A题 蜘蛛网 原题再现&#xff1a; 第一阶段问题   世界上生存着许多种类的蜘蛛&#xff0c;而其中的大部分种类都会通过结网来进行捕食。请你建立合理的数学模型&#xff0c;说明蜘蛛网织成怎样的结构才是最合适的。 整体求解过程概述(摘要…

ubuntu-server部署hive-part2-安装hadoop

参照 https://blog.csdn.net/qq_41946216/article/details/134345137 操作系统版本&#xff1a;ubuntu-server-22.04.3 虚拟机&#xff1a;virtualbox7.0 安装hadoop ​​​​​​下载上传 下载地址 https://archive.apache.org/dist/hadoop/common/hadoop-3.3.4/ 以root用…

Ps:HDR 色调

HDR 技术旨在通过合并不同曝光度的图像来扩展照片的光照细节范围&#xff0c;使得最终图像能够同时展示最亮和最暗区域的细节。 HDR 色调 HDR Toning命令能够在单张图像上重现类似的效果&#xff0c;无需多张不同曝光的照片。 Ps菜单&#xff1a;图像/调整/HDR 色调 Adjustment…

【EasyExcel】—— 实现excel动态表头设置、多个sheet

引入jar <dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>3.1.0</version></dependency>代码 public static void main(String[] args) {//选择存储地址String fileName "/User…

【25考研】:四川大学计算机学院24届874考研考情分析

去年的考情分析也是我做的&#xff0c; 今年就在去年的基础上做了。保持形式不变&#xff0c;更改数据。 21考情&#xff1a; 万载月寒肠断客&#xff1a;四川大学计算机学院21届CS考研考情分析 22考情&#xff1a; 懒羊羊&#xff1a;四川大学计算机学院2022考研考情分析 2…

Taro + vue3 小程序封装标题组件

分为没有跳转页面的title组件和 有跳转页面的title组件 我们可以把这个封装成一个组件 直接上代码 <template><div class"fixed-title-container"><div class"box"><div class"icon" v-if"isShow" click"…

Android的图片加载框架

Android的图片加载框架 为什么要使用图片加载框架&#xff1f;图片加载框架1. Universal Image Loader [https://github.com/nostra13/Android-Universal-Image-Loader](https://github.com/nostra13/Android-Universal-Image-Loader)2. Glide [https://muyangmin.github.io/gl…

【C++】排序算法 --快速排序与归并排序

目录 颜色分类&#xff08;数组分三块思想&#xff09;快速排序归并排序 颜色分类&#xff08;数组分三块思想&#xff09; 给定⼀个包含红⾊、⽩⾊和蓝⾊、共 n 个元素的数组 nums &#xff0c;原地对它们进⾏排序&#xff0c;使得相同颜⾊ 的元素相邻&#xff0c;并按照红⾊、…

文本自动粘贴编辑器:支持自动粘贴并筛选手机号码,让信息处理更轻松

在信息时代的浪潮中&#xff0c;文本处理已成为我们日常工作与生活的重要组成部分。无论是商务沟通、社交互动还是个人事务处理&#xff0c;手机号码的筛选与粘贴都显得尤为关键。然而&#xff0c;传统的文本处理方式效率低下、易出错&#xff0c;已无法满足现代人的高效需求。…

Linux基础篇:VMware centos7虚拟机网络配置——桥接模式

VMware centos7虚拟机网络配置——桥接模式 1 搞清楚什么是桥接模式 桥接模式允许虚拟机直接连接到物理网络&#xff0c;就像它是物理网络中的一个独立设备一样。在这种模式下&#xff0c;虚拟机将具有与宿主机相同网络中的其他设备相同的网络访问权限。虚拟机将获得一个独立…

MySQL-linux安装-万能RPM法

一、MySQL的Linux版安装 1、 CentOS7下检查MySQL依赖 1. 检查/tmp临时目录权限&#xff08;必不可少&#xff09; 由于mysql安装过程中&#xff0c;会通过mysql用户在/tmp目录下新建tmp_db文件&#xff0c;所以请给/tmp较大的权限。执行 &#xff1a; chmod -R 777 /tmp2. …

FPGA常用IP核之FIFO学习

IP核是FPGA芯片公司提供的逻辑功能块&#xff0c;在FPGA芯片中可以进行优化和预先配置&#xff0c;可以直接在用户设计的程序中使用&#xff0c;应用范围很广。在FPGA设计开发过程中使用IP核&#xff0c;可以大大的缩短开发周期&#xff0c;高度优化的IP核可以使FPG开发工程师专…

某音乐平台歌曲信息逆向之参数寻找

如何逆向加密参数&#xff1a;某音乐平台歌曲信息逆向之webpack扣取-CSDN博客 参数构建 {"comm": {"cv": 4747474,"ct": 24,"format": "json","inCharset": "utf-8","outCharset": "ut…

如何开发创建自己的npm包并成功发布、维护至npm官方网站

npm&#xff0c;全称为Node Package Manager&#xff0c;是专为JavaScript生态系统设计的软件包管理系统&#xff0c;尤其与Node.js平台紧密关联。作为Node.js的默认包管理工具&#xff0c;npm为开发者提供了便捷的方式来安装、共享、分发和管理代码模块。 npm作为JavaScript世…

【Python面试题收录】Python的可变对象与不可变对象

一、可变对象与不可变对象的定义 在Python中&#xff0c;对象的可变性是指对象的内部状态&#xff08;值&#xff09;是否允许在对象创建后发生改变。根据这一特性&#xff0c;Python的数据类型可以分为两大类&#xff1a;可变对象&#xff08;mutable objects&#xff09;和不…

Nginx三大常用功能“反向代理,负载均衡,动静分离”

注意&#xff1a;以下案例在Windows系统计算机作为宿主机&#xff0c;Linux CentOS 作为虚拟机的环境中实现 一&#xff0c;Nginx配置实例-反向代理 1.反向代理 案例一 实现效果&#xff1a;使用nginx反向代理&#xff0c;访问 www.123.com 直接跳转到127.0.0.1:8080 准备工…

大数据学习第十二天(hadoop概念)

1、服务器之间数据文件传递 1&#xff09;服务器之间传递数据&#xff0c;依赖ssh协议 2&#xff09;http协议是web网站之间的通讯协议&#xff0c;用户可已通过http网址访问到对应网站数据 3&#xff09;ssh协议是服务器之间&#xff0c;或windos和服务器之间传递的数据的协议…

STM32-03基于HAL库(CubeMX+MDK+Proteus)输入检测案例(按键控制LED)

文章目录 一、功能需求分析二、Proteus绘制电路原理图三、STMCubeMX 配置引脚及模式&#xff0c;生成代码四、MDK打开生成项目&#xff0c;编写HAL库的按键检测代码五、运行仿真程序&#xff0c;调试代码 一、功能需求分析 搭建完成开发STM32开发环境之后&#xff0c;开始GPIO…

OpenCv —— cv::VideoCapture设置摄像头图像格式为“MJPEG“

背景 今天恰巧同事有台USB摄像头,她想要在Windows系统下通过OpenCV读取该摄像头宽高为1080x768、帧率为60的视频,用来做图像算法处理。但无奈通过网上OpenCV教程 读取的视频对应尺寸的帧率仅为10帧左右,根本无法满足使用要求。于是作者通过本篇文章介绍如何解决,欢迎交流指…

0基础学习Mybatis系列数据库操作框架——多环境配置

大纲 配置代码参考资料 在实际开发中&#xff0c;我们往往会将开发环境分成&#xff1a;开发、测试、线上等环境。这些环境的数据源不一样&#xff0c;比如开发环境就不能访问线上环境&#xff0c;否则极容易出现线上数据污染等问题。Mybatis通过多环境配置分开定义来解决这个问…