https://kone.gg/s/nymphet/bywKBFM8KyGTH8k0-5Kj0b?p=1
전에 쓴 젬마 로컬 사용법임 못봤으면 이거부터 봐
https://huggingface.co/zerofata/G4-MeroMero-26B-A4B-gguf
일단 글쓰기 한정으론 다들 순정 젬마대신 이걸로 모델 바꾸는거 개추
처음부터 글쓰기 목적으로 해외에서 파인튜닝된 거라 스토리나 대사 처리도 조금 더 자연스러워지고 heretic 안 써도 검열 빈도가 매우 줄어듬(더럽게 긴 프롬포트 안써도 됨)
31b버전도있으니까 듀얼 gpu나 5090, 맥, dgx 유저는 그거 써봐 비추론으로도 확실히 나아짐
그리고 llama cpp, vllm 유저면 이제 mtp 지원돼서 적용하면 한 20퍼 빨라짐
슈퍼젬마/supergemma 받았으면 벤치마크만 잘푸는 사기니까 지워
