wxya（个人网站）

Ctrl+K

王小扬博客

产品

🗒️ AI产品分析

🗒️ 产品分析

🗒️ Excel AI 助手

Think

🗒️ Saas的困境

🗒️ AI时代下云厂商的困境

🗒️ 2024技术行业的思考

🗒️ The Romance of Coder

🗒️ 为什么要多元化发展

Git

🗒️ fatal: could not read Username Device not configured

🗒️ git github 配置代理

软件开发

🗒️ 软件行业经验

🗒️ 工作量评估

🗒️ CR代码

🗒️ spring Boot、nestjs、flask web服务框架对比

🗒️ 字节5000WQPS 从DNS到Kubernetes集群负载均衡分析

🗒️ 通用软件架构设计参考

🗒️ BizDevOps落地实践

🗒️ 是时候放弃全栈开发了

计算机网络

🗒️ 同源跨域解决方案

🗒️ whistle和Clash共存双层代理

🗒️ clash 防止规则覆盖

CI

🗒️ Jenkins实践

🗒️ jenkins docker 容器配置 proxy

🗒️ jenkins 远程 Remote root is not absolute, getting absolute directory from PWD；

🗒️ docker安装的jenkins如何在宿主机启动jar包

DB

🗒️ 先ORDER后JOIN引发乱序，附解决方法

🗒️ MySQL 批量修改表名

🗒️ Mysql OPTIMIZE TABLE

🗒️ RDS清理历史数据释放空间··

🗒️ RDS Mysql历史数据清理

🗒️ The MySQL server is running with the --read-only option so it cannot execute this statement

设计

🗒️ 秒杀系统时间配置、Nginx查看服务器系统时间

🗒️ 微服务技术选型

缓存

🗒️ 二级缓存版本号设计

Docker

🗒️ Docker绑定CPU

🗒️ Jenkins Docker构建存在缓存

🗒️ 容器内获取宿主机名称和容器ID

Node

🗒️ 基础使用

🗒️ node nestjs 异步异常处理

🗒️ 飞书群机器人接入

🗒️ 简易并发锁

🗒️ Promise

🗒️ Node文件计算Hash

🗒️ mac arm nvm install node14 failing

🗒️ Node CPU100% 问题分析解决

🗒️ 代码腐化｜Node如何规避致命错误

🗒️ Node原子计数器

操作系统

🗒️ linux系统信息查看

🗒️ cron 规范和不同实现

🗒️ windows美化 mac

🗒️ mac基础软件安装

🗒️ mac host切换

🗒️ linux ssh密钥生成

🗒️ Ubuntu安装Cron

🗒️ Ubuntu安装Redis

🗒️ Ubuntu安装Node

🗒️ Linux系统和负载信息查看

🗒️ Linux使用SSH端口转发

🗒️ conda迁移目录

🗒️ diebian切换镜像源安装基础软件

🗒️ 程序CPU100% | 内存泄漏通用排查步骤

🗒️ CPU每秒多少次运算

🗒️ windows多个音频同时输出

🗒️ ubuntu禁用挂起

🗒️ mac lrzsz iterm 配置

Java

🗒️ 基于布隆过滤器快速匹配敏感词、关键词、品牌词

🗒️ 项目加密措施

🗒️ Java 模板变量替换——字符串替换器{}、${}、${}map

🗒️ spring动态修改service类的属性

🗒️ java反编译；将class变成java；利用idea进行反编译

🗒️ Java微服务生态系统构建指南

🗒️ HashMap初始化容量计算

🗒️ Maven常见问题

🗒️ mac arm Java maven等环境安装

🗒️ maven-assembly-plugin打包 scope system 级别文件

🗒️ maven打包配置SpringBoot

🗒️ Maven引入本地jar包

🗒️ Redisson延迟队列

🗒️ Java字符串比较 == 和 equals 的区别 intern

🗒️ jar包添加到本地

大前端

🗒️ 升级npm-check-updates

🗒️ overrides 覆盖配置

🗒️ 阿里npm镜像源更新不及时

🗒️ 电商平台产品ID｜CDN与预渲染｜前端边缘计算

🗒️ Session Cookie Jwt Token常见web授权

🗒️ nrm｜npm快速切源

🗒️ patch-package|npm补丁修复

🗒️ windows ESLint: Expected linebreaks to be 'LF' but found 'CRLF'.(linebreak-style)

🗒️ npm install reason: certificate has expired

Nestjs

🗒️ nestjs fastify 频繁重启

🗒️ Nestjs Fastify 上传文件

🗒️ Nestjs fastify 接入Swagger

🗒️ typeorm用法

🗒️ Nestjs Pipe用法

🗒️ Nestjs Middleware

🗒️ nestjs/schedule nestjs定时任务

🗒️ proxy 网络代理

🗒️ class-validator nestjs dto参数校验

🗒️ 优雅关闭k8s pod docker pm2 nestjs bull

🗒️ NestJs bull 用法

🗒️ nestjs Cron @handleCron" because it is defined in a non static provider.

其他

PHP

🗒️ PHP配置跨域支持

🗒️ php strtr其他语言实现Node

🗒️ 为什么大家还在用php

🗒️ PHP 实现 redis 分布式锁

RAG ｜ Retrieval Augmented Generation

notion image

检索增强生成（Retrieval Augmented Generation），简称 RAG，已经成为当前最火热的LLM应用方案。经历今年年初那一波大模型潮，想必大家对大模型的能力有了一定的了解，但是当我们将大模型应用于实际业务场景时会发现，通用的基础大模型基本无法满足我们的实际业务需求，主要有以下几方面原因：

知识的局限性：模型自身的知识完全源于它的训练数据，而现有的主流大模型（ChatGPT、文心一言、通义千问…）的训练集基本都是构建于网络公开的数据，对于一些实时性的、非公开的或离线的数据是无法获取到的，这部分知识也就无从具备。

幻觉问题：所有的AI模型的底层原理都是基于数学概率，其模型输出实质上是一系列数值运算，大模型也不例外，所以它有时候会一本正经地胡说八道，尤其是在大模型自身不具备某一方面的知识或不擅长的场景。而这种幻觉问题的区分是比较困难的，因为它要求使用者自身具备相应领域的知识。

数据安全性：对于企业来说，数据安全至关重要，没有企业愿意承担数据泄露的风险，将自身的私域数据上传第三方平台进行训练。这也导致完全依赖通用大模型自身能力的应用方案不得不在数据安全和效果方面进行取舍。

notion image

完整的RAG应用流程主要包含两个阶段：

数据准备阶段：数据提取——>文本分割——>向量化（embedding）——>数据入库

应用阶段：用户提问——>数据检索（召回）——>注入Prompt——>LLM生成答案

Loading...

目录

Last update: 2024-8-3

文章列表

王小扬博客

产品

🗒️ AI产品分析

🗒️ 产品分析

🗒️ Excel AI 助手

Think

🗒️ Saas的困境

🗒️ AI时代下云厂商的困境

🗒️ 2024技术行业的思考

🗒️ The Romance of Coder

🗒️ 为什么要多元化发展

Git

🗒️ fatal: could not read Username Device not configured

🗒️ git github 配置代理

软件开发

🗒️ 软件行业经验

🗒️ 工作量评估

🗒️ CR代码

🗒️ spring Boot、nestjs、flask web服务框架对比

🗒️ 字节5000WQPS 从DNS到Kubernetes集群负载均衡分析

🗒️ 通用软件架构设计参考

🗒️ BizDevOps落地实践

🗒️ 是时候放弃全栈开发了

计算机网络

🗒️ 同源跨域解决方案

🗒️ whistle和Clash共存双层代理

🗒️ clash 防止规则覆盖

CI

🗒️ Jenkins实践

🗒️ jenkins docker 容器配置 proxy

🗒️ jenkins 远程 Remote root is not absolute, getting absolute directory from PWD；

🗒️ docker安装的jenkins如何在宿主机启动jar包

DB

🗒️ 先ORDER后JOIN引发乱序，附解决方法

🗒️ MySQL 批量修改表名

🗒️ Mysql OPTIMIZE TABLE

🗒️ RDS清理历史数据释放空间··

🗒️ RDS Mysql历史数据清理

🗒️ The MySQL server is running with the --read-only option so it cannot execute this statement

设计

🗒️ 秒杀系统时间配置、Nginx查看服务器系统时间

🗒️ 微服务技术选型

缓存

🗒️ 二级缓存版本号设计

Docker

🗒️ Docker绑定CPU

🗒️ Jenkins Docker构建存在缓存

🗒️ 容器内获取宿主机名称和容器ID

Node

🗒️ 基础使用

🗒️ node nestjs 异步异常处理

🗒️ 飞书群机器人接入

🗒️ 简易并发锁

🗒️ Promise

🗒️ Node文件计算Hash

🗒️ mac arm nvm install node14 failing

🗒️ Node CPU100% 问题分析解决

🗒️ 代码腐化｜Node如何规避致命错误

🗒️ Node原子计数器

操作系统

🗒️ linux系统信息查看

🗒️ cron 规范和不同实现

🗒️ windows美化 mac

🗒️ mac基础软件安装

🗒️ mac host切换

🗒️ linux ssh密钥生成

🗒️ Ubuntu安装Cron

🗒️ Ubuntu安装Redis

🗒️ Ubuntu安装Node

🗒️ Linux系统和负载信息查看

🗒️ Linux使用SSH端口转发

🗒️ conda迁移目录

🗒️ diebian切换镜像源安装基础软件

🗒️ 程序CPU100% | 内存泄漏通用排查步骤

🗒️ CPU每秒多少次运算

🗒️ windows多个音频同时输出

🗒️ ubuntu禁用挂起

🗒️ mac lrzsz iterm 配置

Java

🗒️ 基于布隆过滤器快速匹配敏感词、关键词、品牌词

🗒️ 项目加密措施

🗒️ Java 模板变量替换——字符串替换器{}、${}、${}map

🗒️ spring动态修改service类的属性

🗒️ java反编译；将class变成java；利用idea进行反编译

🗒️ Java微服务生态系统构建指南

🗒️ HashMap初始化容量计算

🗒️ Maven常见问题

🗒️ mac arm Java maven等环境安装

🗒️ maven-assembly-plugin打包 scope system 级别文件

🗒️ maven打包配置SpringBoot

🗒️ Maven引入本地jar包

🗒️ Redisson延迟队列

🗒️ Java字符串比较 == 和 equals 的区别 intern

🗒️ jar包添加到本地

大前端

🗒️ 升级npm-check-updates

🗒️ overrides 覆盖配置

🗒️ 阿里npm镜像源更新不及时

🗒️ 电商平台产品ID｜CDN与预渲染｜前端边缘计算

🗒️ Session Cookie Jwt Token常见web授权

🗒️ nrm｜npm快速切源

🗒️ patch-package|npm补丁修复

🗒️ windows ESLint: Expected linebreaks to be 'LF' but found 'CRLF'.(linebreak-style)

🗒️ npm install reason: certificate has expired

Nestjs

🗒️ nestjs fastify 频繁重启

🗒️ Nestjs Fastify 上传文件

🗒️ Nestjs fastify 接入Swagger

🗒️ typeorm用法

🗒️ Nestjs Pipe用法

🗒️ Nestjs Middleware

🗒️ nestjs/schedule nestjs定时任务

🗒️ proxy 网络代理

🗒️ class-validator nestjs dto参数校验

🗒️ 优雅关闭k8s pod docker pm2 nestjs bull

🗒️ NestJs bull 用法

🗒️ nestjs Cron @handleCron" because it is defined in a non static provider.

其他

PHP

🗒️ PHP配置跨域支持

🗒️ php strtr其他语言实现Node

🗒️ 为什么大家还在用php

🗒️ PHP 实现 redis 分布式锁