PGX_Spark

NVIDIA Grace Blackwell 與 vLLM 推理效能探討

NVIDIA Grace Blackwell 與 vLLM 推理效能探討

雖然不少網上測試認為PGX Spark可支援每秒300 Tokens速度,我們使用兩部ASUS Ascent GX10桌上型AI超級電腦進行測試。這平台與NVIDIA DGX Spark完全一致,同樣 …

了解更多