文章目录
-
- 二、数据连接封装
-
- 2.1 文档加载器:Document Loaders
- 2.2 文档处理器
- 2.3 文档向量化:Text Embeddings
- 2.4 向量的存储(与索引):Vectorstores
- 2.5 向量检索:Retrievers
- 后记
二、数据连接封装

2.1 文档加载器:Document Loaders
!pip install pypdf
from langchain.document_loaders import PyPDFLoader
loader = PyPDFLoader("WhatisChatGPT.pdf")
pages = loader.load_and_split()
print(pages[0].page_content)