AI 인텔리전스Mar 24, 2026AI 인텔리전스
기사
Hypura는 GPU, RAM 및 NVMe에 걸쳐 모델을 분산시키는 Apple Silicon용 새로운 LLM 추론 스케줄러입니다.
이를 통해 물리적 메모리보다 큰 모델을 시스템 충돌 없이 실행할 수 있습니다. 이 기술을 사용하면 31GB Mixtral 모델이 32GB Mac Mini에서 실행될 수 있습니다.
Data Cube AI 편집팀출처: Hacker News
01
출처 브리프
Hypura는 GPU, RAM 및 NVMe에 걸쳐 모델을 분산시키는 Apple Silicon용 새로운 LLM 추론 스케줄러입니다. 이를 통해 물리적 메모리보다 큰 모델을 시스템 충돌 없이 실행할 수 있습니다. 이 기술을 사용하면 31GB Mixtral 모델이 32GB Mac Mini에서 실행될 수 있습니다.
02