最新文章
34 articles
HGVAbyte/rlhf-data-agent-full
AgentDPORLHFsynthetic data
100 重要
65 热度
91 综合
ronie-aduana/mcp-ai-memory
AgentMCPmemory
100 重要
80 热度
95 综合
joohw/clovapi
AgentClaude CodeCodex
100 重要
65 热度
91 综合
deepanshumody/discovery-agents
AgentLangGraphMCP
100 重要
65 热度
91 综合
Katta-Nitish/mcp-agentic-rag
AgentLangGraphMCP
100 重要
80 热度
95 综合
proto-dredge424/modus-memory
AgentMCPmemory
100 重要
65 热度
91 综合
Pendragonaffectation426/maestro
Claude CodeCodexCursor
100 重要
65 热度
91 综合
UdayKumarVeera/multi-agent-mcp-system
AgentLangGraphMCP
100 重要
65 热度
91 综合
AI没人教,却偷偷学会了“情绪”
GPU
80 重要
65 热度
76 综合
OpenAI明升,Anthropic暗涨:AI包月折扣没了
Claude CodeCodex
100 重要
80 热度
95 综合
95 重要
65 热度
88 综合
OpenAI官宣退役o3与GPT-4.5!
GPT-5
94 重要
80 热度
90 综合
80 重要
65 热度
76 综合
80 重要
65 热度
76 综合
freeforall06/awesome-claude-code
Claude CodeCodexagentic coding
100 重要
65 热度
91 综合
CadPosting/third-brain
AgentClaude CodeDPOMCPmemory
100 重要
65 热度
91 综合
korbinjoe/openteam
Claude CodeCodex
100 重要
65 热度
91 综合
LeetCode C++近满分!Autogenesis要给智能体装上「自进化操作系统」
AutoGen智能体
100 重要
65 热度
91 综合
80 重要
65 热度
76 综合
80 重要
65 热度
76 综合
80 重要
65 热度
76 综合
92 重要
65 热度
85 综合
80 重要
65 热度
76 综合
超越TurboQuant,面向长上下文推理的真2-bit KV Quantization算法问世
quantization推理系统
92 重要
65 热度
85 综合
Claude Opus 4.8问世,Anthropic估值暴涨至9650亿美元
Claude Opus
80 重要
65 热度
76 综合
Ada-MK: Adaptive MegaKernel Optimization via Automated DAG-based Search for LLM Inference
GPUHBMMLIRTensorRT-LLMmemoryvLLM
100 重要
65 热度
91 综合
Blink: CPU-Free LLM Inference by Delegating the Serving Stack to GPU and SmartNIC
GPUNPURDMASGLangTensorRT-LLMmemory
100 重要
65 热度
91 综合
Comparative Analysis of Large Language Model Inference Serving Systems: A Performance Study of vLLM and HuggingFace TGI
GPUPagedAttentionTGImemoryvLLM推理系统
100 重要
65 热度
91 综合
TokenWeave: Efficient Compute-Communication Overlap for Distributed LLM Inference
GPUNVLinkSGLangTensorRT-LLMvLLM
100 重要
65 热度
91 综合
FlashInfer: Efficient and Customizable Attention Engine for LLM Inference Serving
DiTFlashInferGPUSGLangmemoryvLLM
100 重要
65 热度
91 综合
COMET: Towards Partical W4A4KV4 LLMs Serving
DiTGPUKV cacheTensorRT-LLMmemoryquantization
100 重要
65 热度
91 综合
SCOOT: SLO-Oriented Performance Tuning for LLM Inference Engines
TensorRT-LLMvLLM
100 重要
65 热度
91 综合
QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving
DiTGPUKV cacheTensorRT-LLMmemoryquantization
100 重要
65 热度
91 综合
SGLang: Efficient Execution of Structured Language Model Programs
KV cacheNPUSGLang
100 重要
65 热度
91 综合