项目上线了

📅 2026/6/26 1:29:39

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档文章目录前言一、项目地址二、简介总结前言之前据说很厉害的项目上线了不过AI说像ETL无所谓了给大家看看一、项目地址添加链接描述二、简介基于springboot 3.5.7 springAI 1.1.0实现。接口: ChatController用于用户输入和日志拉取两个流程复用返回精准匹配自动异步落盘searchController用于文本图片双模态多路召回top10并对工具返回格式采取prompt注入和直接调用两种选项获取工具原值工具Fastmcp search_mcp.py利用网络接口补全相关信息pika test_clip.py 分布式系统通过rabbitmq互相通信,多步补全图片向量python代码: insert.py获取简介insert2.py获取演员和导演 k_means.py聚出5个差异最大的数据 Farthest Point Samplingk‑center greedy move.py 数据清洗并向量化 test.py 入库文档: links_updated.csv 根据tmdbID获取简介links_updated2.csv获取演员和导演信息第一步数据清洗https://files.grouplens.org/datasets/movielens/ml-32m.zip因为下的是比较新的数据源2023-10所以多了一个links.csv里面有imdbId和tmdbId方便我们补全电影简介。简单看一下里面有八万条电影限制速度40次/10S那就要六个小时。第二步写python下载ollama下载bge-m3python要写FastAPI原因是ollama图片向量模型本地没有云端太贵所以python提供接口直接调用第三步下载PostgreSQL pgvector第四步使用python接口处理向量和文本然后存储为向量第五步多路复用文本0.7图片0.3 如果没有图片就是文本*1.0第六步拉入近期搜索值处理当天的nginx日志提取有价值的指标为了和java对接引入rabbitmq第七步实时调整向量应该要归一化避免文本长度带来的影响第八步MCP搜索工具和agent智能体的引入提示词写好可以让他在用户提问后多次调用工具不过感觉不算是真的agent第九步测验建立对照实验1.重新导入instruct向量证明他有用2.下载bg25证明bge-m3多语言情况下与文本检索的bg25有同等性能 bg25 缩减版语句 HR10 47 / 50 0.94 bge-m3 未加instruct的中文原文简介 HR10 27 / 50 0.54 bge-m3 加instruct的中文原文简介 HR10 24 / 50 0.48补充:要建索引CREATE INDEX ON documentsUSING hnsw (embedding_text vector_cosine_ops);建表语句 CREATE TABLE movie ( movie_id INTEGER, title CHARACTER VARYING(200), introduction TEXT, genres CHARACTER VARYING(100), embedding_text VECTOR(1024), embedding_image VECTOR(512) );title要有唯一标识 ALTER TABLE movie ADD CONSTRAINT uk_movie_title UNIQUE (title);遇到的问题: Autoweired后在别的地方new了它,交给spring管理后就不能new了改为参数注入没有规划好类导致多个类循环依赖改为lazy懒加载 AdvisorCall获取不到返回值通过提示词要求返回原值并再过一遍LLM回复用户偏好语言或者通过手动调mcp工具获取原值但是不能模糊匹配用户偏好展望: 通过设置偏移值实现让LLM翻页搜索的功能维护用户偏好标题链和用户向量实现用户的持久化 (但是会增加写操作,所以要引入redis缓冲)总结总的来说就是工具调用吧多轮对话也很有意思。

新闻详情

相关阅读

HDFS javaAPI-windows的IDEA中java文件在linux中的hadoop平台运行

OBS使用技巧：如何给OBS视频素材人物画面人脸AI自动追踪戴口罩？

Mac 创建 Python 虚拟环境两种主流方案

MacBook Air M2本地部署DeepSeek-Coder实战指南

用了一个 AI 聚合平台后，我终于明白多模型入口的价值

技术分享的文化建设

特征p代数几何中的F-纯阈值、测试理想与p分形结构解析

基于ANN的学习路线

一个被忽视的事实：代码库一直有反馈回路，只是太低级

计算机毕业设计之基于Java的流浪动物收养系统设计与开发

技术线上面试代码写完就以为通关？留学生利用黑盒测试自证风控「蒸汽教育分享」

暗黑2存档编辑器终极指南：5分钟快速掌握d2s-editor完整使用教程

3个步骤让小爱音箱变身AI语音助手：MiGPT深度体验指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用