Skip to content
AI 인텔리전스Mar 24, 2026AI 인텔리전스
기사

Hypura는 GPU, RAM 및 NVMe에 걸쳐 모델을 분산시키는 Apple Silicon용 새로운 LLM 추론 스케줄러입니다.

이를 통해 물리적 메모리보다 큰 모델을 시스템 충돌 없이 실행할 수 있습니다. 이 기술을 사용하면 31GB Mixtral 모델이 32GB Mac Mini에서 실행될 수 있습니다.

Data Cube AI 편집팀출처: Hacker News
01

출처 브리프

Hypura는 GPU, RAM 및 NVMe에 걸쳐 모델을 분산시키는 Apple Silicon용 새로운 LLM 추론 스케줄러입니다. 이를 통해 물리적 메모리보다 큰 모델을 시스템 충돌 없이 실행할 수 있습니다. 이 기술을 사용하면 31GB Mixtral 모델이 32GB Mac Mini에서 실행될 수 있습니다.