# HuixiangDou **Repository Path**: MemoryFast/HuixiangDou ## Basic Information - **Project Name**: HuixiangDou - **Description**: No description available - **Primary Language**: Unknown - **License**: BSD-3-Clause - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-08-11 - **Last Updated**: 2025-08-11 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README [English](README.md) | 简体中文
茴香豆是一个基于 LLM 的专业知识助手,优势: 1. 设计预处理、拒答、响应三阶段 pipeline: * `chat_in_group` 群聊场景,解答问题时不会消息泛滥。见 [2401.08772](https://arxiv.org/abs/2401.08772),[2405.02817](https://arxiv.org/abs/2405.02817),[混合检索](./docs/zh/doc_knowledge_graph.md)和[业务数据精度测试](./evaluation) * `chat_with_repo` 实时聊天场景,响应更快 2. 无需训练适用各行业,提供 CPU-only、2G、10G、20G、80G 规格配置 3. 提供一整套前后端 web、android、算法源码,工业级开源可商用 查看[茴香豆已运行在哪些场景](./huixiangdou-inside.md);加入[微信群](resource/figures/wechat.jpg)直接体验群聊助手效果。 如果对你有用,麻烦 star 一下⭐ # 🔆 新功能 茴香豆 Web 版已发布到 [OpenXLab](https://openxlab.org.cn/apps/detail/tpoisonooo/huixiangdou-web),可以创建自己的知识库、更新正反例、开关网络搜索,聊天测试效果后,集成到飞书/微信群。 Web 版视频教程见 [BiliBili](https://www.bilibili.com/video/BV1S2421N7mn) 和 [YouTube](https://www.youtube.com/watch?v=ylXrT-Tei-Y)。 Web 版给 android 的接口,也支持非 android 调用,见[python 样例代码](./tests/test_openxlab_android_api.py)。 - \[2024/09\] 稀疏方法实现[代码检索](./huixiangdou/service/parallel_pipeline.py) - \[2024/08\] ["chat_with readthedocs"](https://huixiangdou.readthedocs.io/zh-cn/latest/) ,见[集成说明](./docs/zh/doc_add_readthedocs.md) - \[2024/07\] 图文检索 & 移除 `langchain` 👍 - \[2024/07\] [混合知识图谱和稠密检索,F1 提升 1.7%](./docs/zh/doc_knowledge_graph.md) 🎯 - \[2024/06\] [评估 chunksize,splitter 和 text2vec 模型](./evaluation) 🎯 - \[2024/05\] [wkteam 微信接入](./docs/zh/doc_add_wechat_commercial.md),整合图片&公众号解析、集成指代消歧 - \[2024/05\] [SFT LLM 处理 NLP 任务,F1 提升 29%](./sft/) 🎯🤗 | LoRA-Qwen1.5-14B | LoRA-Qwen1.5-32B | alpaca 数据 | arXiv |
LLM | 文件格式 | 检索方法 | 接入方法 | 预处理 |
- [InternLM2/InternLM2.5](https://github.com/InternLM/InternLM) - [Qwen/Qwen2](https://github.com/QwenLM/Qwen2) - [浦语](https://internlm.openxlab.org.cn/) - [StepFun](https://platform.stepfun.com) - [KIMI](https://kimi.moonshot.cn) - [DeepSeek](https://www.deepseek.com) - [GLM (ZHIPU)](https://www.zhipuai.cn) - [SiliconCloud](https://siliconflow.cn/zh-cn/siliconcloud) - [Xi-Api](https://api.xi-ai.cn) | - pdf - word - excel - ppt - html - markdown - txt | - 文档用稠密,代码用稀疏 - [知识图谱](./docs/zh/doc_knowledge_graph.md) - [联网搜索](./huixiangdou/service/web_search.py) - [SourceGraph](https://sourcegraph.com) - 图文混合 | - 微信([android](./docs/zh/doc_add_wechat_accessibility.md)/[wkteam](./docs/zh/doc_add_wechat_commercial.md)) - 飞书 - [OpenXLab Web](https://openxlab.org.cn/apps/detail/tpoisonooo/huixiangdou-web) - [Gradio Demo](./huixiangdou/gradio_ui.py) - [HTTP Server](./huixiangdou/server.py) - [Read the Docs](./docs/zh/doc_add_readthedocs.md) | - [指代消歧](https://arxiv.org/abs/2405.02817) |