Awesome System Papers Wiki

Home

❯

concepts

文件夹: concepts

此文件夹下有15条笔记。

  • 2026年4月24日

    Attention

    • transformer
    • deep-learning
    • llm
  • 2026年4月24日

    Chunked-Prefill

    • llm-inference
    • scheduling
    • batching
  • 2026年4月24日

    Continuous-Batching

    • llm-inference
    • scheduling
    • batching
  • 2026年4月24日

    Disaggregation

    • llm-inference
    • scheduling
    • system-architecture
  • 2026年4月24日

    Expert-Parallelism

    • moe
    • distributed-training
    • llm-inference
    • parallelism
  • 2026年4月24日

    Flash-Attention

    • attention
    • gpu-kernel
    • llm-training
    • llm-inference
  • 2026年4月24日

    KV-Cache

    • memory
    • attention
    • llm-inference
  • 2026年4月24日

    LoRA

    • fine-tuning
    • peft
    • llm-training
    • model-compression
  • 2026年4月24日

    MoE

    • llm-architecture
    • sparse-activation
    • scaling
  • 2026年4月24日

    PagedAttention

    • memory
    • attention
    • kv-cache
    • llm-inference
  • 2026年4月24日

    Pipeline-Parallelism

    • distributed-training
    • parallelism
  • 2026年4月24日

    Quantization

    • model-compression
    • llm-inference
    • efficiency
  • 2026年4月24日

    RDMA

    • networking
    • distributed-training
    • llm-inference
  • 2026年4月24日

    Speculative-Decoding

    • llm-inference
    • decoding
    • latency-optimization
  • 2026年4月24日

    Tensor-Parallelism

    • distributed-training
    • llm-inference
    • parallelism

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community