RunPod で Qwen 3-4B を激安サーバーレスホスティング #API

2025年5月13日

0

こんにちは！ノベルワークスのザワッチ(@zawatti)です！

今回は、最近性能が良いと話題のQwen3シリーズの4BモデルをサーバーレスAPIとしてセルフホストして、フロントまで統合してしまってチャットできるインターフェースまで仕上げてみます。

大手LLMプロバイダに頼らないと性能の良い AI モデルを低価格・低レイテンシで提供できないのかと思った矢先に、ローカルLLM「Qwen3」のリリースを見て、もしかしたら結構いい精度のLLMをセルフホストで動かすことができるのではないかと思ったのがきっかけです。

あと、Runpodも使ってみたかった。

Runpodとは
RunPod は GPU サーバーレス実行環境を数クリックで用意でき、秒単位課金・ゼロスケールなど、“Lambda × GPU” 的な体験を実現できます。

1. Runpodの新規登録＆クレジット追加