Untitled

Khamis, 18 Jun 2026, 12:14 am

saya pilih gemma4:12b saja buat masa skrg.

tadi dah try beberapa model, antaranya qwen 3.6 25b yg custom made di host kat hugging face, tapi dia hardcode context length ke 128k, tak dpt nak run kat 16gb vram.

tukar pula ke satu gemma 4 12b model yg dah custom quantization juga kat hugging face. boleh run tp risau kalau model tu lambat up to date.

jadi saya pilih model yg di host kat mainstream registry, iaitu kat ollama sendiri, official gemma 4 12b. kat gambar tunjuk cara nak check & guna model tu yg run kat ollama. just guna curl, inilah basic kpd semua agentic ai workflow yg ada skrg.

satu lagi, kalau nak pakai gemma4:12 kena run ollama at least 0.30.9, baru dpt pull model tu

28 Jun 2026

17 Jun 2026

Artikel berkaitan:

Cara setup devcontainer untuk develop Laravel app 15 September 2025 #devcontainer #Docker #Laravel #webdev

Deploying WordPress to minikube, k3s & k0s 28 Februari 2025 #Docker #Kubernetes #webdev #wordpress

All I want for keris emas is another 32GB DDR4

25 Disember 2025 #ArgoCD #Docker #GitLab #homelabserver #K3s #Kubernetes #laptop

Main game guna Thinkpad X260 28 April 2021 #game #GTA5 #laptop #Thinkpad #Windows

Belajar setup VPN sendiri untuk access komputer di rumah 25 Mei 2025 #5G #AWS #router #VPN #WiFi #WireGuard #wordpress

Terlambat ke parti, baru sekarang merasa kuasa – Docker + PHP 5 Oktober 2021 #Docker #laptop #PHP

4 hari tak dapat berjalan 21 Februari 2022 #gout #ubat

Auto restart NodeJS web app when made changes to source code using nodemon 4 Disember 2023 #NodeJS #webdev

Tema trip raya tahun ni: manis, spontan & jem 6 April 2025 #jalan #Kelantan #makan #minum #raya #Terengganu

PHP async request with auth 5 September 2011

Komentar (0):