Neo4j笔记(五):查询的处理流程

📅 2026/6/26 6:06:28
Neo4j笔记(五):查询的处理流程
实现流程整体流程图是否用户提问获取图谱 SchemaLLM 生成 Cypher 查询Neo4j 执行查询查询成功?获取查询结果返回错误信息LLM 增强生成自然语言回答详细流程说明Neo4j图数据库大语言模型用户Neo4j图数据库大语言模型用户自然语言问题 图谱Schema生成 Cypher 查询语句Cypher语句执行 Cypher 查询返回查询结果问题 查询结果增强生成总结回答自然语言回答流程用户提问 → 2. 获取图谱结构 → 3. 生成 Cypher → 4. 执行查询 → 5. LLM 汇总回答大模型和图数据库的连接环境配置创建.env文件NEO4J_URLbolt://localhost:7687 NEO4J_USERneo4j NEO4J_PASSWORDyour_password OPENAI_API_KEYyour_api_key OPENAI_BASE_URLhttps://api.deepseek.com/v1我这里用的是Deepseek也可以根据自己的环境选择比如豆包或者本地Ollama或者Microsoft Foundry。大模型调用from langchain_openai import ChatOpenAI llm ChatOpenAI( modeldeepseek-v4-flash, api_keyOPENAI_API_KEY, base_urlOPENAI_BASE_URL, temperature0 # 设为 0 提高输出确定性 )Neo4j 连接from langchain_neo4j import Neo4jGraph graph Neo4jGraph( urlNEO4J_URL, usernameNEO4J_USER, passwordNEO4J_PASS )第一步文本转知识图谱核心思想利用 LLM 将自然语言文本转换为 Cypher 语句自动创建知识图谱。def text_to_knowledge_graph(text): prompt f 请将以下文本转换为 Neo4j Cypher 语句 文本{text} 要求 1. 识别实体作为节点Person、Location、Event 等 2. 识别关系作为边COOPERATE_WITH、PERFORMED_AT 等 3. 使用 MERGE 语句避免重复 4. 只输出 Cypher 语句 cypher llm.invoke(prompt).content # 清理 markdown 代码块标记 if cypher.startswith(): cypher cypher.split(\n, 1)[1].rsplit(\n, 1)[0] graph.query(cypher)正巧昨天跟苏鹏老师聊起了郭德纲所以这里就用郭德纲和于谦来做示例。输入文本示例郭德纲 1973年出生相声演员与于谦长期搭档2005年爆红 于谦 1969年出生相声演员擅长捧哏常年和郭德纲合作生成的 CypherMERGE (g:Person {name: 郭德纲, birth_year: 1973, occupation: 相声演员}) MERGE (y:Person {name: 于谦, birth_year: 1969, occupation: 相声演员}) MERGE (g)-[:COOPERATE_WITH]-(y)生成的知识图谱第二步获取图谱结构目的获取数据库的 schema 信息为生成准确的 Cypher 查询提供上下文。这个思路跟TEXT2SQL基本是一致的。这里我选择的是先从APOC插件中获取图谱的schema信息如果失败再从Neo4j数据库中获取。由于APOC不是默认被安装的所以目标Neo4j环境很有可能没有这个插件。def get_graph_schema(): # 获取节点标签 labels graph.query(CALL db.labels() YIELD label RETURN collect(label)) # 获取关系类型 rels graph.query(CALL db.relationshipTypes() YIELD relationshipType RETURN collect(relationshipType)) # 获取属性键 props graph.query(CALL db.propertyKeys() YIELD propertyKey RETURN collect(propertyKey)) # 尝试使用 APOC如果安装 try: apoc_schema graph.query(CALL apoc.meta.data()) return {labels: labels, relationships: rels, properties: props, apoc: apoc_schema} except: return {labels: labels, relationships: rels, properties: props}APOC 安装方法tar包安装下载对应版本的 APOC jar 文件放入neo4j/plugins/目录修改neo4j.confapoc.enabledtrue apoc.meta.data.allowlist.alltrue重启 Neo4j第三步生成 Cypher 查询并汇总增强生成结果其它方法都已经准备好最终再通过如下方法做调度def query_and_summarize(question): # 获取图谱结构 schema get_graph_schema() # 生成 Cypher cypher_prompt f 图谱结构{schema} 用户问题{question} 请生成 Cypher 查询语句。 cypher llm.invoke(cypher_prompt).content # 执行查询 result graph.query(cypher) # LLM 汇总 summary llm.invoke(f问题{question}\n结果{result}\n请用自然语言回答).content return summary常见问题与解决方案问题LLM 返回带 markdown 代码块错误信息Invalid input cypher: expected MATCH, MERGE, ...某些模型会带一些前置和后置标记有些不会所以需要根据实际情况处理下。解决方案清理代码块标记if cypher.startswith(): cypher cypher.split(\n, 1)[1].rsplit(\n, 1)[0]总结