DBGroup-RAG-Tutorial/Sample_rag.py at main · Origami1240/DBGroup-RAG-Tutorial · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
from typing import List, Dict
from fastapi import FastAPI, HTTPException
from pydantic import BaseModel
import os
from langchain_community.document_loaders import DirectoryLoader
from langchain_community.vectorstores import Chroma
from langchain_community.embeddings import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate

# 设置环境变量
PARATERA_API_KEY = "xxxxxxxxxx"
PARATERA_LLM_MODEL = "DeepSeek-R1-0528"
PARATERA_EMBEDDING_MODEL = "GLM-Embedding-3"
PARATERA_BASE_URL = "https://llmapi.paratera.com/v1"

os.environ["OPENAI_API_KEY"] = PARATERA_API_KEY
os.environ["OPENAI_BASE_URL"] = PARATERA_BASE_URL

app = FastAPI()

# 请求和响应模型
class Question(BaseModel):
    query: str

class Answer(BaseModel):
    answer: str
    context: List[str]

# 初始化组件
def init_rag():
    # 初始化文档加载器
    loader = DirectoryLoader("Sample_Docs_Markdown/", glob="**/*.md")
    documents = loader.load()

    # 文档分割
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=1000,
        chunk_overlap=200,
        length_function=len,
    )
    texts = text_splitter.split_documents(documents)

    # 初始化 Embeddings
    embeddings = OpenAIEmbeddings(
        model=PARATERA_EMBEDDING_MODEL,
        api_key=PARATERA_API_KEY,
        base_url=PARATERA_BASE_URL,
    )

    # 创建向量存储
    vectorstore = Chroma.from_documents(
        documents=texts,
        embedding=embeddings,
        persist_directory="./chroma_db"
    )

    # 初始化 LLM
    llm = ChatOpenAI(
        model=PARATERA_LLM_MODEL,
        api_key=PARATERA_API_KEY,
        base_url=PARATERA_BASE_URL,
        temperature=0.1,
    )

    # 创建自定义提示模板
    prompt_template = """使用以下上下文来回答问题。如果你不知道答案，就说你不知道，不要试图编造答案。

    上下文：
    {context}

    问题：{question}

    回答："""

    PROMPT = PromptTemplate(
        template=prompt_template,
        input_variables=["context", "question"]
    )

    # 创建 QA 链
    qa_chain = RetrievalQA.from_chain_type(
        llm=llm,
        chain_type="stuff",
        retriever=vectorstore.as_retriever(search_kwargs={"k": 3}),
        return_source_documents=True,
        chain_type_kwargs={"prompt": PROMPT}
    )

    return qa_chain

# 初始化 RAG
qa_chain = init_rag()

@app.post("/ask", response_model=Answer)
async def ask_question(question: Question):
    try:
        # 获取答案
        result = qa_chain({"query": question.query})

        # 提取上下文
        contexts = [doc.page_content for doc in result["source_documents"]]

        return Answer(
            answer=result["result"],
            context=contexts
        )
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)