1. 首页
  2. 人工智能
  3. 机器学习
  4. 全球机器学习技术大会姜勇RAG关键技术与未来发展趋势

全球机器学习技术大会姜勇RAG关键技术与未来发展趋势

上传者: 2025-07-07 21:54:50上传 PDF文件 9.75MB 热度 46次

RAG 的混合检索方案挺值得一看。姜勇在全球机器学习技术大会上讲得蛮实在,不光说清楚了基础 RAG 怎么搞的,还重点聊了高级 RAG 怎么用关键词和语义排序提升检索效果。像那种问概念、找事实、搜索网页类型的问题,RAG 都能应付得来。

RAG 技术用起来其实就是靠“先查再说”的思路,先从知识库里捞一波相关内容,再交给大模型生成答案。听起来简单,但坑也不少,比如查不到想要的内容,或者捞出来的东西上下文对不上。这时候,混合检索语义重排序就关键了。

姜勇提到的问题总结得蛮透:像是找不到答案(FP1)、文档排得不对(FP2)、上下文不相关(FP3)、答案瞎编(FP4)这些,基本是做 RAG 都踩过的雷。是垃圾进垃圾出(GIGO)的问题,不好就白跑一圈。

他还提了个方向叫Enterprise RAG,就是面向企业场景来优化 RAG,比如知识管理、员工查询系统这种。不光技术要硬,数据安全、定制化服务也得跟得上。挺适合你如果正在搞公司级的知识平台。

如果你对构建自己的语义检索系统有兴趣,可以看看下面这几个链接,有理论也有实操,像知识库检索模型hnsw 向量检索,用来上手或者优化现有方案都挺合适。

建议你在搞 RAG 相关系统时别太依赖默认的向量引擎,多试试混合检索、语义标签、关键词融合这些手段,能拉开效果差距。嗯,别忘了检索那块性能也得盯好,响应慢了体验就崩了。

下载地址
用户评论