Got 32GB so was hoping I could use ollm to offload it to my SSD. Slower but maki...

		cahaya 6 months ago \| parent \| context \| favorite \| on: Show HN: Run Qwen3-Next-80B on 8GB GPU at 1tok/2s ... Got 32GB so was hoping I could use ollm to offload it to my SSD. Slower but making it possible to run bigger models (in emergencies)