Untitled
Khamis, 18 Jun 2026, 12:14 am
saya pilih gemma4:12b saja buat masa skrg.
tadi dah try beberapa model, antaranya qwen 3.6 25b yg custom made di host kat hugging face, tapi dia hardcode context length ke 128k, tak dpt nak run kat 16gb vram.
tukar pula ke satu gemma 4 12b model yg dah custom quantization juga kat hugging face. boleh run tp risau kalau model tu lambat up to date.
jadi saya pilih model yg di host kat mainstream registry, iaitu kat ollama sendiri, official gemma 4 12b. kat gambar tunjuk cara nak check & guna model tu yg run kat ollama. just guna curl, inilah basic kpd semua agentic ai workflow yg ada skrg.
satu lagi, kalau nak pakai gemma4:12 kena run ollama at least 0.30.9, baru dpt pull model tu
17 Jun 2026
