Awesome System Papers Wiki

标签: speculative-decoding

此标签下有6条笔记。

  • 2026年4月24日

    DAS-MLSys26

    • rl-training
    • speculative-decoding
    • rollout
    • suffix-tree
    • long-tail
  • 2026年4月24日

    PRISM-MLSys26

    • speculative-decoding
    • draft-model
    • llm-inference
    • conditional-computing
    • sglang
  • 2026年4月24日

    SparseSpec-MLSys26

    • reasoning-models
    • speculative-decoding
    • sparse-attention
    • kv-cache
    • inference
  • 2026年4月24日

    SpecDecodeBench-MLSys26

    • speculative-decoding
    • benchmarking
    • llm-inference
    • vllm
    • measurement
  • 2026年4月24日

    SpecDiff-2-MLSys26

    • speculative-decoding
    • diffusion-models
    • llm-inference
    • drafter-verifier-alignment
    • distillation
  • 2026年4月24日

    TiDAR-MLSys26

    • llm
    • diffusion
    • speculative-decoding
    • hybrid-architecture
    • inference

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community