🧠 概要:
この記事は、日本語の大規模言語モデル(LLM)である「ELYZA」をGoogle Cloud Platform(GCP)上の仮想マシンで動かす過程を初心者向けに解説した記録です。著者は専門知識ゼロからスタートし、何度も挫折しながらも成功に至った様子を共有しています。
概要
- 著者は高専卒の企業研究者で、機械学習を用いたマテリアルズインフォマティクスに取り組んでいる。
- GCPとELYZAについての紹介が含まれ、自らの体験をもとに移行手順を詳しく述べている。
- 具体的な手順やコマンド例が示されており、読み手が同様の試みをする際の参考にできる。
要約の箇条書き
- 自己紹介:著者の経歴や現在の職務を説明。
- ELYZAについて:日本語特化型の大規模言語モデルで、日本語の文書生成や要約が可能。
- GCPについて:Googleが提供するクラウドサービスで、仮想マシンを通じて強力なコンピュータを借りて利用できる。
- 仮想マシン(VM):クラウド上の仮想コンピュータで、好きなOSが使用でき、必要なスペックを選べる。
- 無料トライアル:GCP登録時に90日間使える無料クレジットの紹介。
- 手順の詳細:
- Google アカウントを用意。
- GCPの無料トライアルに申し込み。
- VMを設定してELYZAを動かすための手順を説明(コマンド例含む)。
- 成功体験:最後にELYZAが正常に動作したことを報告し、次のステップへの意欲を示す。
😅専門知識ゼロからのスタート!
今回は、**日本語の大規模言語モデル(LLM)「ELYZA」**を、Google Cloud Platform(GCP)上の仮想マシン(VM)で動かすまでのチャレンジの記録を、初心者にもわかりやすくまとめてみました。専門知識ゼロからスタートし、何度もつまずきながらようやくたどり着いた成功の道のり…。
同じようにチャレンジしてみたい方の参考になれば嬉しいです!
1. 日本語の大規模言語モデル「ELYZA」とは?
「ELYZA」は、日本のスタートアップELYZA株式会社が開発した**日本語に特化したAI(大規模言語モデル)**です。ChatGPTのようなAIと同じ“言語モデル”の一種で、日本語のテキストを理解し、生成するのが得意です。たとえば、ELYZAを使えばこんなことができます:•日本語の文書の要約•日本語での質問応答•日本語の文章の生成(ブログ記事・メールのドラフトなど)
日本語特化型という点がポイントで、ChatGPTのような多言語モデルに比べて、日本語独自の言い回しや文法への対応が優れている場合があります
2. Google Cloud Platform(GCP)とは?
GCP(Google Cloud Platform)は、Googleが提供するクラウドサービスです。クラウドサービスとは、「パソコンがなくても、インターネット上にある強力なコンピューターを借りて使える」サービスのことです。GCPでは以下のようなことができます:•サーバーを立てて、アプリやAIモデルを動かす•データベースを使って情報を保存する•強力なGPUマシンを使って機械学習モデルを訓練する特にELYZAのようなAIモデルは高性能なコンピューター(GPU)が必要ですが、GCPなら一時的に借りて使うことができるので便利です。
90日間使える300ドルの無料クレジットがあるので、今回トライしてみました!
3. 仮想マシン(VM)とは?
仮想マシン(VM:Virtual Machine)とは、クラウド上にある仮想のコンピューターのことです。たとえば:•WindowsやLinuxなど、好きなOSを使える•実際に家にあるパソコンのように、操作が可能•必要なスペック(メモリ、CPU、GPUなど)を選べるつまり、ELYZAのようなAIモデルをGCPで動かすには、
**「GCPでVMを作成 → その中にELYZAをインストール」**という流れになります。
実際にやってみよう❣️
まずはGoogle Cloud Platformへ登録!
【STEP 0】無料トライアルでできること
今なら、**90日間有効な43,000円分のクレジット(無料利用枠)**がもらえます!できることの例:•仮想マシン(VM)の作成•GPUを使ったAIの学習
•データ保存(Cloud Storage)
【STEP 1】Google アカウントを用意しよう
GmailなどのGoogleアカウントをすでにお持ちの方は、それでOKです。まだの方は、以下から作成できます。
→ Google アカウントを作成する
【STEP 2】GCPの無料トライアルに申し込もう
1.GCPの公式サイトにアクセス→ https://cloud.google.com/2.右上の「無料で開始」をクリック3.Googleアカウントでログイン4.地域(日本)や利用規約に同意5.支払い情報の入力※無料でもクレジットカードの登録が必要ですが、勝手に課金されることは絶対にありません。安心してください!
6.「無料トライアルに申し込む」をクリック
【STEP 3】43,000円の無料クレジットを確認!
登録が完了すると、自動的に以下が表示されます。•利用可能なクレジット:¥43,000•有効期限:登録から90日間これで準備完了です!
VMを動かそう‼️
ここから写真でわかりやすく!
まずはスペックをきめる!今回はこれにしました!(ChatGPTのおすすめを選択)
↓実際の操作の流れ
作成を押すと下記の通り、画面が遷移!
上図のSSHを押すと、コンソールが立ち上がる!そしたら、下記コマンドを実行して、llama.cppをビルドして、ELYZAモデルのダウンロードまで実行します!
🦙 llama.cppとは?
llama.cpp(ラマ・ドット・シーピーピー)は、Meta社の大規模言語モデル(LLaMA)を手元のパソコンやクラウド環境で軽量に動かせるようにしたオープンソースの推論エンジンです。•C/C++で書かれているため、超軽量•CPUだけで動作可能(GPU不要)•量子化対応でメモリを節約できる(例:7Bモデルが16GBでも動く)
llama.cppをビルド
sudo apt update && sudo apt upgrade -ysudo apt install -y git build-essential cmake wget libcurl4-openssl-dev
git clone https:cd llama.cppmkdir build && cd buildcmake ..cmake --build . --config Release
始まり
終わり
Hugging Face でトークンを確認
export HF_TOKEN="トークン"
モデルを選定
mkdir -p ~/llama.cpp/models/elyzacd ~/llama.cpp/models/elyza wget --header="Authorization: Bearer $HF_TOKEN" "https://huggingface.co/mmnga/ELYZA-japanese-Llama-2-7b-fast-instruct-gguf/resolve/main/ELYZA-japanese-Llama-2-7b-fast-instruct-q4_K_M.gguf" -O elyza-q4.gguf
~/llama.cpp/build/bin/llama-cli -m ~/llama.cpp/models/elyza/elyza-q4.gguf -p "日本の文化について説明してください。" -n 128 --temp 0.7 --top-p 0.9 --repeat_penalty 1.1 --frequency_penalty 0.5 --presence_penalty 0.5
パラメータ 意味 -p プロンプト(入力文) -n 出力する最大トークン数 –temp 温度。高いほどランダム性が上がる(例:0.7) –top-p nucleus sampling(確率上位pまでから選ぶ) –repeat_penalty 同じ語句の繰り返し抑制 –frequency_penalty 出現頻度が高い語を抑制
–presence_penalty 新しい語彙の出現を促進
動いたよ❣️
めちゃくちゃ時間がかかりましたが、正常にうごきました!次はpythonと組み合わせて、どうなるかを確認していきます!
Views: 2