安装部署

软件下载地址

安装界面

一路点击下一步安装即可。

安装界面2

安装过程需要耐心等待,我可能等了差不多两个小时,最后安装成功。

安装完成之后,在桌面会出现NVIDIA Chat with RTX快捷方式,就是一个启动脚本。 如果是默认路径安装的话,需要修改path

C:\Users\Yang\AppData\Local\NVIDIA\ChatWithRTX\RAG\trt-llm-rag-windows-main\config\preferences.json

1
2
3
4
5
6
{
  "dataset": {
    "path": "C://Users//Yang//Desktop//rtx",
    "isRelative": false
  }
}

加参数

运行

加载模型和参数

根据路径下文件内容生成embeddings

这里有一个问题就是:如果我的数据库当中增加或者减少文件,需要重新生成embeddings,这个过程很慢。

GPU运行情况

问问题

由于我第一次指定的path下文件数量很大,导致无法全部加载成功,我减少文件数量,单独加载一个关于bike fitting的书。

测试

基础比例对判断的影响

使用贝叶斯定理计算概率1

使用贝叶斯定理计算概率2

感受

同样的出租车问题,我几乎使用相同的单词来询问,给出的答案不统一。稳定性不够好。其他的测试后面再补充。