Quantum Virtual Machines (OSDI 2025)

一句话总结：NISQ 云量子计算无多租户、整机串行批处理导致利用率极低；HyperQ 用 repeating-region qVM + 时空 binpacking 合成 composite circuit 提交 IBM Eagle，相对 IBM Quantum 吞吐/利用率最高约一个数量级、平均延迟最高降 40×，且 noise-aware 调度有时还能提升 fidelity。

问题与动机

云量子服务把用户程序当作 batch job 整机串行执行，小电路只占少量 qubit，整机长期空闲；用户排队可达数天。现有 compile-time 多路复用需事先知道共执行程序集，无法像经典 VM 那样独立编译与动态调度。

关键观察 / 隐含假设

观察 1：真实量子机（IBM Eagle、Rigetti 等）由 repeating region（如 I 形 7-qubit unit）网格铺成，可把 qVM 定义为 region 的倍数并映射到物理拓扑。
- 依赖假设：目标机器拓扑确实呈现可重复的 region 结构；编译目标 qVM 而非整机。
- 可能失效场景：拓扑不规则或代际变更使 region 抽象失效。
观察 2：无 QRAM、无法 context switch，只能通过把多个 qVM 合成一个 composite circuit 作为单个 job 提交云端。
- 依赖假设：云 API 接受「大 job」且超时机制可回收（HyperQ 用 1.5× 估计门延迟作 timeout）。
- 可能失效场景：动态电路/条件门使执行时间难估计（论文列为 future work）。
假设 1：qubit 间插入 unused qubit 即可有效隔离 crosstalk，保证 qVM 间 fault isolation。
- 证据强度：中——实验显示 fidelity 不劣于 baseline，但依赖当日 calibration 与具体噪声模型。

核心方法

qVM 接口：与真实 backend 同 gate set / coupling map；basic qVM 对应 repeating unit（Eagle 上 7-qubit I 形），scaled/fractional qVM 弹性分配 qubit。

编译：Qiskit virtual backend，程序独立编译到 rightsized qVM，无需知晓共驻程序。

调度：三维 binpacking——space scheduling（greedy 放置 qVM region）+ time scheduling（短 job 后追加 qVM 填满最长 batch 时间）+ 可选 noise-aware（避开最差 n 个 region）。

执行：重标号 virtual→physical qubit，提交 composite job；完成后拆分测量结果。

设计取舍

取舍 1：合成大 job 提高利用率，但短程序需等 batch 内最长 qVM，略增 run time（相对 queue 等待可忽略）。
取舍 2：greedy 调度保证不低于 FIFO 串行，但未必全局最优 binpack。
边界条件：IBM Eagle 127-qubit、35 个 benchmark；Poisson 到达时增益小于 all-at-once（队列中可共调度 qVM 更少）。

实验与结果

IBM Quantum Eagle，35 个程序：相对 IBM Quantum 吞吐最高 ~11×（utilization ~11×），平均延迟最高 ~40× 降低（all-at-once small-only）。
Poisson 到达：吞吐/利用率约 3× 改进。
Noise-aware：部分配置 fidelity 优于 IBM Quantum，同时保持高 utilization。
qVM 隔离实验：共执行时 fidelity 不 compromised。

Critical Analysis

论证链条

「小程序占整机 → repeating region 可映射 qVM → composite job 合法提交」链条在 IBM 栈上闭合。性能 claim 强依赖 queue waiting 主导延迟的测量设定；对单次 job 纯执行时间改善较小。

假设压力测试

非 IBM 拓扑、更大规模 fault-tolerant 机、或云厂商限制 composite job 大小时方案需重做。Dynamic circuits 破坏门延迟估计。Crosstalk 隔离用 spacer qubit 是否对所有噪声通道足够论文未穷举。

实验可信度

Baseline 为 IBM Quantum FIFO，公平且实用；模拟器与真实机混合评估需区分。Fidelity 指标与 workload 覆盖 35 程序，但仍是 NISQ 规模。

系统性缺陷

依赖云 API 与 calibration 数据新鲜度；scheduling 失败/timeout 的运维策略论文简述；多租户计费与 SLO 未讨论。

局限与 Future Work

局限 1：无真正抢占式 qVM，time multiplex 仅在 batch 内追加。
局限 2：architecture-specific qVM，跨厂商不可移植。
Future work 1：支持 conditional/dynamic circuit 的运行时间估计与调度。
Future work 2：与更多云 backend（Braket 等）的端到端部署验证。

Awesome System Papers Wiki

探索

HyperQ-OSDI25