“考公”有捷径?Milvus助力粉笔教育构建个性化考公RAG
![“考公”有捷径?Milvus助力粉笔教育构建个性化考公RAG](https://assets.zilliz.com/cms-cn/_93377be5b6.png)
粉笔教育是中国知名的职业教育培训机构,自2015年成立以来,专注于提供高品质的非学历职业教育服务。粉笔教育利用互联网技术创新教育模式,实现线上线下教学资源整合,并在公务员考试培训等多个领域拓展服务。全国多城市分校为学员提供优质服务,累计服务超过4200万用户。粉笔教育以高水平教学质量和创新技术,如申论智能批改系统,推动教育普惠和公平,荣获多项国家技术专利。
从Milvus单机版开始
在2021年,由于业务需求,粉笔教育开始进行向量数据库的选型。“当时的版本还是1.x单机版,随着时间的推移,Milvus在粉笔教育的业务线中得到了越来越广泛的应用,我们也把Milvus升级到了2.x集群版”,粉笔教育算法团队负责人吕红亮介绍到。
Milvus核心使用场景
为了满足用户多样化的需求,粉笔教育一直坚持科技创新。从2021年到2024年,随着AI技术的发展及应用,粉笔教育也在创新职教行业,以缩短用户的学习链路。
图搜召回
在粉笔教育的应用中,向量搜索召回技术被广泛应用于多个基础功能场景:如大学搜题的拍照搜题涉及到的向量召回推荐,在粉笔公考中,搜索页面的文字搜索、图推题目,使用Milvus作为关键词召回之外的向量召回、推荐中基于双塔模型的向量召回,允许用户通过上传题目的图片来快速搜索题目和答案,为用户提供了便捷的搜题体验。
RAG应用
随着大模型时代的到来,粉笔教育推出了基于RAG技术(Retrieval-Augmented Generation)的“AI老师”功能,而Milvus作为底层支持,为这一业务提供了强大的基础设施。
粉笔AI老师依托于粉笔教育多年积累的丰富教学数据,结合Milvus支持的RAG技术,能够提供更深入、准确、有价值的答案。在言语理解、资料分析、常识判断、逻辑推理和数量关系等多个方面,粉笔AI老师的表现均优于市面上的主流通用教育大模型产品。通过这些功能,粉笔AI老师能够全面覆盖学员的学习流程,提供包括个性化学习规划、学习成果检测、答疑解惑、报考辅导在内的全流程个性化和智能化的专业陪伴。
今年,粉笔教育还推出了AI公文写作功能,其中Milvus同样发挥了重要作用。
Milvus带来的业务价值
便捷的部署和使用:Milvus的部署和使用过程简单方便,减轻了用户的运维负担。吕红亮介绍到:“之前也使用过Vearch、Annoy,自己也动手搭建过搜索功能,但是需要做很多周边的应用开发。而Milvus更加方便,减少了复杂的配置和调整工作。”
支持大规模数据:Milvus能够支持较大规模的数据量,对于需要自行部署的系统来说,这一点尤为重要,因为它能够确保系统性能不会因数据量增加而下降。
高性能、低成本:Milvus提供了快速的检索速度,满足了对性能的要求。同时,相比于其他云厂商提供的方案,写入速度和QPS也会有限制。同时,云厂商的方案要针对存储、内存进行收费,而且部分功能升级单独收费,因此成本也不可控;
不断迭代的功能
算法团队工程化专家张家明说到:“Milvus社区一直以来都发展的比较好,我们在使用当中遇到的一些问题或者是不支持的需求,可能在后续的版本都会解决或者作为新特性推出,免除了很多我们自己去二次开发和维护的工作。”
如Milvus 2.4版本就引入了多向量字段的功能,而在最新发布的Milvus 2.5版本里则引用了更多的特性:
内置全文搜索:集成了Sparse-BM25,无需预先生成向量嵌入即可实现强大的文本处理功能。从而实现语义搜索与关键字搜索相结合的混合搜索以提升搜索精准性。
增强文本过滤:新的文本匹配功能利用Tantivy的分析器进行精确的自然语言匹配,适合与向量相似性搜索相结合。
位图索引:引入了新的索引系统,以加速对低基数字段的过滤,提高了过滤搜索的查询性能
...
提到为什么会选择Milvus,吕红亮介绍到,Milvus已经得到了其他用户的验证,证明了其方法和方向的可行性。由于粉笔教育与猿辅导之间的紧密关系,双方的团队曾进行了深入交流。猿辅导的团队基于他们的使用经验,推荐了Milvus,认为其在向量检索方面的表现和效果都相当出色,因此粉笔教育采纳了这一建议,并开始实施Milvus方案,“我们没有足够的时间和精力去试错,必须尽早避坑。”
技术干货
LangChain 查询使用指「北」
LangChain 是一种 AI 代理工具,可以为以 ChatGPT 为代表的额大语言模型(LLM)增添更多功能。此外,LangChain 还具备 token 和上下文管理功能。本文主要通过查询 GPT 和查询文档两个示例介绍如何使用 LangChain。
2023-5-30技术干货
如何在 Jupyter Notebook 用一行代码启动 Milvus?
本文将基于 Milvus Lite,为大家介绍如何在 Jupyter Notebook 中使用向量数据库。
2023-6-12技术干货
LLMs 诸神之战:LangChain ,以【奥德赛】之名
毫无疑问,大语言模型(LLM)掀起了新一轮的技术浪潮,成为全球各科技公司争相布局的领域。诚然,技术浪潮源起于 ChatGPT,不过要提及 LLMs 的技术发展的高潮,谷歌、微软等巨头在其中的作用不可忽视,它们早早地踏入 AI 的技术角斗场中,频频出招,势要在战斗中一争高下,摘取搜索之王的桂冠。而这场大规模的 AI 之战恰好为 LLMs 技术突破奏响了序曲。LangChain 的加入则成为此番技术演进的新高潮点,它凭借其开源特性及强大的包容性,成为 LLMs 当之无愧的【奥德赛】。
2023-5-17