May 20, 2025Late Reading time ~6 minute

毕昇bisheng平台工作流注册为工具设计

毕昇bisheng平台工作流注册为工具设计。

May 10, 2025Late Reading time ~6 minute

MCP Server工具调研

Model Context Protocol（MCP）是面向AI代理的通信协议，通过标准化工具接口实现大语言模型与外部系统的深度集成。本次调研覆盖7类典型MCP Server实现，涵盖搜索增强、认知辅助、知识管理等领域。

February 26, 2025Late Reading time ~3 minutes

使用SGLang推理框架部署DeepSeek-R1-Distill-Qwen-32B大模型，并与vLLM部署同类服务性能对比。

February 20, 2025Late Reading time ~9 minutes

基于英伟达triton-inference-server部署大模型做推理加速。

July 06, 2024Late Reading time ~6 minute

由于用户原始查询可能是措辞不准确或缺少语义信息，LLM 难以理解并生成相关的结果，本文介绍了一些重要的Query 重写技术，如HyDE、Query2Doc等。