最近,人工智能领域涌现的新搜索引擎MindSearch正成为行业的新宠。这款开源的搜索引擎具备卓越的信息处理能力,能够在几分钟内完成人类需要数小时才能做到的工作,充分展现出AI在信息检索和整合方面的惊人潜力。
本文带读者了解MindSearch的核心特性,看其如何领先于竞争对手;同时,文章中还会提供指南,指导如何在本地搭建这款AI搜索引擎。
MindSearch是由上海人工智能实验室联合研发团队推出的开源AI搜索框架,擅长大规模信息的收集与整理。
借助InternLM2.5 7B对话模型,MindSearch能够在短时间内从300多个网页中提取关键信息,完成这项通常人类需要3小时的任务。
MindSearch采用多代理框架模拟人类思考过程,先规划然后执行搜索,从而确保信息的精确度和全面性。
该项目完全开源,用户可以免费体验并进行本地部署。
MindSearch由两大核心组件构成:WebPlanner和WebSearcher。
WebPlanner将用户问题细化为搜索任务,并智能规划搜索路径,整个过程通过图结构呈现。WebSearcher则负责执行分层搜索,精准地收集所需信息。
MindSearch的独到之处在于其高效的复杂问题处理和信息提取能力。借助多代理架构,它能在几分钟内完成人类三小时的工作量,确立了其在AI搜索领域的领先地位。
MindSearch之所以能超越ChatGPT和Perplexity.ai,关键在其模仿人类思维的多代理框架。
在实际应用中,MindSearch的性能表现十分出色。它能够迅速从众多网页中搜集并整合信息,面对复杂的查询任务,如“本季《王者荣耀》哪位射手表现最佳?”,它不仅分析赛季特点和射手性能指标,还能综合多方数据,提供全面而精确的答案,效率远超人类专家。在与ChatGPT-web和Perplexity的对比测试中,MindSearch的表现尤为突出。
- 打开终端或命令提示符,准备输入安装命令。
- 从GitHub克隆MindSearch仓库,将所需文件下载到本地:
- 进入克隆后的MindSearch目录:
- 安装项目所需的Python包,仓库中包含requirements.txt文件,列出了所有必需的包。运行以下命令进行安装:
要启动MindSearch API,需要运行一个Python模块。命令有几个选项:
- 使用--lang en参数设置模型语言为英语,若需使用中文,可将en改为cn。
- 通过--model_format参数指定模型格式,例如使用internlm_server来优化中文的InternLM2.5-7b-chat模型,或选择gpt4来使用GPT-4模型。
接下来,启动FastAPI服务器,根据配置调整命令参数:
- 对于开源模型,使用命令:
- 若要使用GPT-4模型,首先需要在项目文件中修改API模型配置,将'YOUR OPENAI API KEY'替换为你的OpenAI实际API密钥:
然后,确保启动服务器的命令正确指向GPT-4模型格式:
- 启动Gradio界面
确保进入 Gradio 脚本所在的 MindSearch 项目根目录,并在终端中使用以下命令启动 Gradio 界面:
- 运行Streamlit应用
使用以下命令运行 Streamlit 应用程序。 Streamlit 会自动在默认网络浏览器中打开网络应用程序.方便你进行操作和使用。
MindSearch以其简洁而强大的功能,为信息检索和整合领域带来了突破性的解决方案。它独有的多代理框架,融合了大型语言模型的认知优势和搜索引擎的数据广度,使其在众多现有工具中脱颖而出。