編集する

Deepseekの日本語版をローカルマシンで動かす【超初心者向け】

DeepSeek をローカルマシンで動かしてみたい+初心者向けのメモです。

以下のローカル環境下で Deepseek の派生モデルを試してみました。マシンは生成AI向けではないが小さいモデルなら動くかなという程度のマシンです。

念のためですが、これらの結果は DeepSeek本家のサイトの実行結果ではありません。本家サイトが使用しているモデルのさらに、ヨワヨワモデルをローカルマシンで試したという感じです。

GPU: GeForceGTX1060(6GB),
メモリ: 32GB
CPU: i7 10700 *Windows
先に結果: モデルの14Bは動作しますが、32B無理でした

で Cyberagent さんが用意した DeepSeek-R1 の日本語版の 14Bの DeepSeek-R1-Distill-Qwen-14B-Japanese をためしてみみました。以下はその動画です。

「東京から横浜への行き方を教えて」というプロンプトに対する回答がまったりと生成されています。(後日LLMStudioで試すともう少し早かったので、設定の問題かもしれません)

他にもさまざまなプロンプトでAIとしての回答結果は 14Bだと違うだろうという結果がおおいのですが、回答前の <think></think> (コンソールの場合は thinkタグ、webui の場合は Thought Process) で囲まれているAIの自問自答ようなものはシゴデキの思考回路みたいでとても興味深く。日本語能力や思考能力は十分で、知識をあたえれば使えるのではと思いました。*本家サイトで同じプロンプトをなげると高速かつ回答もあっていました。