中古GPU（RTX 3060/12GB）でローカルLLM検証-2 ～ llama.cpp で TinyLlama 1.1B を試す #CUDA

By インモビ運営局

2025年5月5日

0

【Amazon.co.jp限定】バッファロー WiFi 無線LAN 中継機 Wi-Fi 5 11ac 866 + 300 Mbps ハイパワーコンセント直挿しコンパクトモデル簡易パッケージ日本メーカー【 iPhone 16 / 15 / 14 / 13 / Nintendo Switch / PS5 動作確認済み】エコパッケージ WEX-1166DHPL/N

(1609)

￥2,980 (2025年5月5日 13:15 GMT +09:00 時点 - )

Logicool G ゲーミングヘッドセット G335 ゲーミングヘッドセット G335BK 超軽量 222g 3.5mm 有線立体音響ステレオ 2.1ch フリップミュートマイク付き PS5 PS4 PC Switch Xbox スマホ対応ヘッドホンヘッドフォンブラック国内正規品

(2236)

￥8,061 (2025年5月5日 13:12 GMT +09:00 時点 - )

中古GPU（RTX 3060/12GB）でローカルLLM検証-2 ～ llama.cpp で TinyLlama 1.1B を試す #CUDA

前回は、Docker コンテナでGPUが使えるところまで設定出来ましたので、今回は、コンテナでローカルLLMを試していきます。
[前回記事] 中古GPU（RTX 3060/12GB）でローカルLLM検証-1 ～初期設定とGPUコンテナ

ChatGPT o3 に、どのLLMを試すか相談したら、次の３ルートをおススメされました。

（１）llama.cpp ルート
（２）Ollama ルート
（３）vLLM ルート

違いを表にするとこんな感じ

用途	手軽さ	REST/UI	バッチ性能	迷ったら
llama.cpp	◎ 軽い	あり (8080)	○	まず試す
Ollama	◎ （pull 自動）	あり (11434) + WebUI	△	GUI で遊ぶ
vLLM	○ 要 HF モデル	あり (8000)	◎ 高速	API 負荷テスト

ちなみにRTX 3060 のVRAM 12 GB で動くモデルとしては、

モデル	サイズ (4-bit)	備考
TinyLlama-1.1B-Chat	≈0.5 GB	英語中心。実装確認に最適
Phi-2 2.7B	≈1.2 GB	英語・数学強め
CALM2-3B-Instruct-ja	≈1.6 GB	日本語◎（ELYZA系より軽量）
open-calm-3b	≈2.4 GB	日本語汎用・Apache 2.0

こんな感じにおススメされました。もっと他にも試したいモデルはあるのですが、まずは、英語の応答でいいので、ダウンロードに認証とか要らないものをお手軽に試してみます。

中古GPU（RTX 3060/12GB）でローカルLLM検証-2 ～ llama.cpp で TinyLlama 1.1B を試す #CUDA

Logicool G ゲーミングヘッドセット G335 ゲーミングヘッドセット G335BK 超軽量 222g 3.5mm 有線立体音響ステレオ 2.1ch フリップミュートマイク付き PS5 PS4 PC Switch Xbox スマホ対応ヘッドホンヘッドフォンブラック国内正規品

Crucial(クルーシャル) SSD 内蔵2.5インチ SATA接続 BX500 シリーズ 500GB 国内正規代理店品 CT500BX500SSD1JP

【JavaScript】JavaScriptのシャローコピーとディープコピーの違いについて #JavaScript – Qiita

カドー、海外へ持ち運べる布団乾燥機。トコジラミ対策にも – 家電 Watch

shadcnを理解する

返事を書く返事をキャンセル

Most Popular

Minecraft 村人移送(拉致)編相方はサイコパス #ゲーム実況 #minecraft

【ポケポケ】カード引きたいだけのおじさんです(/・ω・)/＃ポケモン#Pokemon#ゲーム配信#ポケポケ#Maha3150#ミュウ#Шайлушай#Ernest Merkel#クラウン引きたい

【今日の計算】「627＋373」を計算せよ

初代『マリカー』は、なぜ“カート”だったのか？レースゲームの歴史から俯瞰しても極めて画期的な作品

Recent Comments

EDITOR PICKS

Minecraft 村人移送(拉致)編相方はサイコパス #ゲーム実況 #minecraft

【ポケポケ】カード引きたいだけのおじさんです(/・ω・)/＃ポケモン#Pokemon#ゲーム配信#ポケポケ#Maha3150#ミュウ#Шайлушай#Ernest Merkel#クラウン引きたい

【今日の計算】「627＋373」を計算せよ

POPULAR POSTS

Minecraft 村人移送(拉致)編相方はサイコパス #ゲーム実況 #minecraft

【ポケポケ】カード引きたいだけのおじさんです(/・ω・)/＃ポケモン#Pokemon#ゲーム配信#ポケポケ#Maha3150#ミュウ#Шайлушай#Ernest Merkel#クラウン引きたい

【今日の計算】「627＋373」を計算せよ

POPULAR CATEGORY

ABOUT US

FOLLOW US

中古GPU（RTX 3060/12GB）でローカルLLM検証-2 ～ llama.cpp で TinyLlama 1.1B を試す #CUDA

llama.cpp で TinyLlama 1.1B を試す

1. モデルを取ってくる

2. Docker で llama.cpp サーバーを起動

3. curl で推論を試す

共有:

返事を書く 返事をキャンセル

Most Popular

Recent Comments

EDITOR PICKS

POPULAR POSTS

POPULAR CATEGORY

ABOUT US

FOLLOW US

返事を書く返事をキャンセル