分类：大模型 - 不如吃茶去

线上调用大模型接口反应慢的定位和解决

业务流程：用户填写主题和生成要素-->接口拉取prompt配置-->向量检索范文-->填充prompt内容-->调用大模型接口-->大模型响应处理并返回SSE响应线上问题：一到线上用户多的时候响应非常慢，AI内容生成非常慢，需要1分钟才会开始慢慢响应内容。问题定位首先查...

springai集成、开发

springai实际上是对openai接口调用进行封装后的sdk，也包括了其他大模型调用能力，以及和向量数据库的交互操作。对各种实体和参数进行约定，封装统一调用方法，屏蔽底层细节和API交互。官方文档：https://docs.spring.io/spring-ai/reference/api/in...

langchain-chatchat部署验证

开源项目介绍：https://github.com/THUDM/ChatGLM-6BChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT...