• mac idea vm.options配置

    idea更换2024社区版之后,经常会卡死,cpu占用较高。修改vm.options-Xmx10240m # 设置最大堆内存为10GB-Xms512m # 设置初始堆内存为512MB-XX:ReservedCodeCacheSize=512m # 设置代码缓存区的大小为512MB-XX:+...

    prompt配置与结果评价

    ...

    线上调用大模型接口反应慢的定位和解决

    业务流程:用户填写主题和生成要素-->接口拉取prompt配置-->向量检索范文-->填充prompt内容-->调用大模型接口-->大模型响应处理并返回SSE响应线上问题:一到线上用户多的时候响应非常慢,AI内容生成非常慢,需要1分钟才会开始慢慢响应内容。问题定位首先查...

    springai集成、开发

    springai实际上是对openai接口调用进行封装后的sdk,也包括了其他大模型调用能力,以及和向量数据库的交互操作。对各种实体和参数进行约定,封装统一调用方法,屏蔽底层细节和API交互。官方文档:https://docs.spring.io/spring-ai/reference/api/in...

    线上HttpClient连接池超时问题排查、解决

    现象:偶现点击某功能按钮,10秒后才有响应。大多数时间不会出现此现象,但是出现后不会恢复。服务日志:org.apache.http.conn.ConnectionPoolTimeoutException: Timeout waiting for connection from poolKongCli...

    ApplicationRunner与CommandLineRunner的对比

    在《Springboot源码解读与原理分析》中看到下面描述:整个SpringApplication的启动逻辑非常复杂,核心步骤大概分为以下8步:1.获取SpringApplicationRunListener监听器,该监听器会贯穿整个Spring Application的启动过程。2.准备运行时环境...

    文件下载接口优化(代理对象存储)

    背景:原方案:文件上传下载接口,服务端生成对象存储的请求临时链,客户端使用临时链直接请求对象存储服务,进行上传、下载文件。弊端:无法控制上传文件大小同时客户场地的网络环境禁止办公网直接访问对象存储服务域名。改造后:用户携带临时链参数请求服务端,服务端使用这些参数访问对象存储服务,将文件返回给用户。在...

    devops 基础构建镜像

    本镜像用于kubesphere中devops使用的替换基础镜像,升级docker版本,安装docker buildx,增加jdk maven node环境等。一、用于构建docker镜像的Dockerfile# 使用 Ubuntu 作为基础镜像FROM ubuntu:latest# 设置环境变量,避...

    java内存溢出和栈溢出

    看的第一遍勉强找一些比较熟悉的名词,理解一下概念看的第二遍较为系统的理解相关知识点看的第三遍能够理解作者的前面铺垫和后面的总结,和其中算法和数据结构的设计思路。遇到什么问题,为了达到什么效果,采用了什么解决方案。以下内容摘录自《深入理解JVM》java堆内存溢出下载堆内存快照:通过参数-XX:+He...

    langchain-chatchat部署验证

    开源项目介绍:https://github.com/THUDM/ChatGLM-6BChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT...