允许任何人离开没关系的

发表于2026-01-26

Milvus 使用文档目录 Milvus 使用文档目录 1 安装 2 使用案例 2.1 文档搜索（RAG） 2.2 图片检索（以图搜图） 2.3 以文搜图 3 集成 1 安装12345678910111213141516171819202122232425262728# 安装 Docker Composecurl -SL https://github.com/docker/compose/releases/download/v2.30.3/docker-compose-linux-x86_64 -o /usr/local/bin/docker-composesudo chmod +x /usr/local/bin/docker-composesudo ln -s /usr/local/bin/docker-compose /usr/bin/docker-compose# 下载 Milvus 配置文件wget...

LlamaIndex

发表于2026-01-16

LlamaIndex 使用指南简介LlamaIndex 是一个强大的开源工具，帮助开发者构建基于大型语言模型 (LLM) 的应用程序。提供工具和 API 连接 LLM 与外部数据源，功能类似 LangChain。快速入门环境配置123456# 创建虚拟环境python -m venv LlamaIndexsource LlamaIndex/bin/activate# 安装核心库pip install llama-index 基础依赖12345pip install \llama-index-core \llama-index-llms-openai \llama-index-embeddings-openai \llama-index-readers-file 5行入门代码1234567from llama_index.core import VectorStoreIndex, SimpleDirectoryReaderdocuments = SimpleDirectoryReader("data").load_data() # 加载文档index...

Embedding-Reranker

发表于2026-01-06

Embedding 和 Reranker 模型指南 1. 理论1.1 Embedding 模型：文字的「数字身份证」作用：将文字转换为高维向量，建立语义空间中的坐标定位使用场景： 🔍 搜索（”猫” → 匹配”猫咪””橘猫”） 🎥 推荐系统（科幻片→科幻片） 📊 聚类分析（自动分类用户评论）比喻：图书馆管理员快速搬来所有「狗」相关书籍，但顺序杂乱 1.2 Reranker 模型：结果的「智能排序员」作用：对初步结果重新排序，提升精准度使用场景： ❓ 问答系统（从100条答案选最优解） 🔍 搜索引擎（”苹果”优先显示水果） 🎬 推荐系统（按评分/热度排序）比喻：管理员二次整理书籍，按评分/出版时间排序 1.3 两者协作关系 Embedding Reranker 阶段粗筛（召回）精排（排序）速度快较慢目标解决”有没有” 解决”哪个更好” 经典组合案例：电商搜索：Embedding找”运动鞋” → Reranker按价格/销量排序智能客服：Embedding匹配问题 →...

python_tool

发表于2026-01-05|python

Python 多环境管理综合指南1. 源码编译安装 Python操作步骤12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788#!/bin/bash# 用法：./install_python.sh <版本号> [安装目录]# 示例：./install_python.sh 3.8.12 /opt/python3.8set -euo pipefailif [ $# -lt 1 ] || [ $# -gt 2 ]; then echo "错误：参数数量不正确" echo "用法：$0 <python_version> [安装目录]" echo "示例：$0 3.8.12 /opt/python3.8" ...

mcp

发表于2025-12-23|python

MCP 工具使用文档https://gofastmcp.com/getting-started/installation 工具示例基础工具定义12345678mcp = FastMCP("Demo 🚀")Starlette()@mcp.tool(name='加法')def add(a: int, b: int) -> int: """Add two numbers""" return a + b#fastmcp run my_server.py:mcp --transport sse --port 8000 JSON数据处理工具12345678910111213141516171819202122232425262728293031323334353637@mcp.tool(name='从公网URL下载JSON文件并提取产品信息')def extract_product_info(url: str) ->...

cosyvoice2

发表于2025-09-23

CosyVoice 安装与使用指南环境准备1. 克隆代码仓库1234git clone --recursive https://github.com/FunAudioLLM/CosyVoice.gitcd CosyVoice# 若子模块克隆失败，重复执行直到成功git submodule update --init --recursive 2. 安装Miniconda1234wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.shbash Miniconda3-latest-Linux-x86_64.sh~/miniconda3/bin/conda init bashsource ~/.bashrc 3. 创建虚拟环境12conda create -n cosyvoice python=3.10conda activate cosyvoice 4. 安装系统依赖123sudo yum install sox sox-develsudo yum groupinstall...

sglang

发表于2025-09-23

SGLang 部署与使用指南目录 SGLang 部署与使用指南目录环境准备与安装基础环境配置 Docker容器部署服务启动配置单节点启动双节点分布式启动功能测试性能基准测试 PD分离部署环境准备服务部署分布式部署 (2P1D) Prefill节点配置 Decode节点配置环境准备与安装基础环境配置12345678# 禁用IPv6sysctl -w net.ipv6.conf.all.disable_ipv6=1 sysctl -w net.ipv6.conf.default.disable_ipv6=1# 设置网络接口和NCCL参数export GLOO_SOCKET_IFNAME=eth0#export NCCL_DEBUG=infoexport NCCL_IB_DISABLE=1 Docker容器部署12345678docker run -d -t --network=host --gpus all \ --privileged \ --ipc=host \ --cap-add=SYS_PTRACE \ ...

vllm

发表于2025-09-23

vLLM 分布式服务部署与压测指南目录 Docker 部署服务启动 API 测试压力测试 PD分离 https://www.modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-7Bhttps://docs.vllm.com.cn/en/latest/getting_started/quickstart.html#installation Docker 部署启动 vLLM 服务容器1234567891011docker run -t -d \ --name="vllm" \ --ipc=host \ --cap-add=SYS_PTRACE \ --network=host \ --gpus all \ --privileged \ --ulimit memlock=-1 \ --ulimit stack=67108864 \ -v /mnt:/mnt \ ...

常用压测命令

发表于2025-08-28|linux

一、siege1. 下载与安装1234567891011# Ubuntu/Debiansudo apt-get install siege# CentOS/RHELsudo yum install siege# macOSbrew install siege# 验证安装siege --version 2. 核心参数参数说明示例 -c <并发数> 并发用户数（必须参数） -c 100 -t <时间> 压测持续时间（s/m/h） -t 30s -r <次数> 每个用户重复请求次数 -r 50 -f <文件> 从文件读取多个URL进行压测 -f urls.txt -i 随机发送文件中的URL请求 -i -f urls.txt -b 无延迟模式（最大压力测试） -b -v 显示详细请求日志 -v 3. 示例命令12345# 100并发用户，持续30秒压测siege -c 100 -t 30s http://example.com#...

python as_completed

发表于2025-08-26|python

as_completed 方法详解🎯 核心区别：处理顺序方法执行顺序结果获取顺序适用场景 submit + 顺序处理按提交顺序执行按提交顺序获取需要严格保持结果顺序的场景 as_completed 并行执行按完成顺序获取需要及时处理已完成任务的场景 📌 使用场景分析1. submit + 顺序处理典型代码： 123456from concurrent.futures import ThreadPoolExecutorwith ThreadPoolExecutor() as executor: futures = [executor.submit(task, param) for param in params_list] for future in futures: # 按提交顺序处理 print(future.result()) 特点：必须等待前一个任务完成才能处理下一个严格保持任务提交顺序适合场景：日志处理需要按时间顺序记录结果需要顺序写入文件/数据库 2....