4x faster LLM inference (Flash Attention guy's company)

Surdeus Forum

Inn
Solo

4x faster LLM inference (Flash Attention guy's company)

📅 2025-10-12 ⚓ Hacker News 🌐 Source 🖼️ Load Image

version: v0.7.6-rc.2

sha256: c80abcbe75...

commit: b136330