LLM: ollama install ubuntu 24.04 docker open-webio
Jump to navigation
Jump to search
Sumber: https://www.jeremymorgan.com/blog/generative-ai/local-llm-ubuntu/
Pastikan:
- OS bisa linux server, seperti ubuntu server.
- Memory RAM pastikan cukup untuk menyimpan model-nya. Model llama3 butuh memory paling tidak 8GB.
- Kalau mau lebih enak/lebih cepat sebaiknya pakai GPU, seperti nvidia telsa yang agak baru.
Install aplikasi pendukung
sudo apt update sudo apt install curl net-tools ffmpeg
Download
curl -fsSL https://ollama.com/install.sh | sh
Sebagai user biasa run & download model
ollama pull llama3 ollama pull bge-m3:latest
ollama pull qwen2.5-coder:7b ollama pull deepseek-r1:7b ollama pull llama3.3:1b ollama pull gemma3:4b
ollama pull adijayainc/bhsa-deepseek-r1-1.5b ollama pull adijayainc/bhsa-llama3.2
optional,
ollama pull llama3.2:1b
ollama pull rizkiagungid/deeprasx ollama pull fyandono/chatbot-id ollama pull rexyb10/codeai ollama pull fahlevi20/DeepSeek-R1-TechSchole-Indonesia
ollama pull all-MiniLM
Kalau punya GPU dengan RAM besar
ollama pull llama3.3 systemctl status ollama
Install docker open-webui
Persiapan
sudo apt install docker.io sudo docker pull ghcr.io/open-webui/open-webui:main
Tanpa GPU
sudo docker run -d --network=host -v open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://127.0.0.1:11434 --name open-webui --restart always ghcr.io/open-webui/open-webui:main
docker run -d -p 3000:8080 -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:main
sudo docker run -d -p 3000:8080 -v ollama:/usr/share/ollama/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama
sudo docker run -d -p 3000:8080 -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama
Dengan GPU
docker run -d -p 3000:8080 --gpus all -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:cuda
sudo docker run -d -p 3000:8080 --gpus=all -v ollama:/usr/share/ollama/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama
Contoh
curl http://localhost:11434/api/generate -d '{ "model" : "llama3", "prompt" : "tell me a joke", "stream" : false }'