毕昇bisheng平台工作流注册为工具设计。

ReadMore »



Model Context Protocol(MCP)是面向AI代理的通信协议,通过标准化工具接口实现大语言模型与外部系统的深度集成。本次调研覆盖7类典型MCP Server实现,涵盖搜索增强、认知辅助、知识管理等领域。

ReadMore »



使用SGLang推理框架部署DeepSeek-R1-Distill-Qwen-32B大模型,并与vLLM部署同类服务性能对比。

ReadMore »



基于英伟达triton-inference-server部署大模型做推理加速。

ReadMore »



由于用户原始查询可能是措辞不准确或缺少语义信息,LLM 难以理解并生成相关的结果,本文介绍了一些重要的Query 重写技术,如HyDE、Query2Doc等。

ReadMore »