M1チップのMacにLM StudioとOllamaを入れて、ローカルLLMをあれこれ試していた。VScodeのClineと組み合わせれば、Claude Codeのようなコーディング支援もできるらしい。できるらしい、というのが正直なところで、実際にやってみると、思っていたのとはだいぶ違った。
ローカルで動かしてみたら、思ったより手強かった
Clineの設定自体はそれほど難しくない。ローカルのLLMサーバーを指定して、あとはClaude Codeと同じように使えばいい——はずだった。
ところが、コードを生成させようとすると、時間がかかる。エラーが出る。修正させると、また別のエラーが出る。そのループが続く。Claude Codeと同じことをさせているつもりなのに、結果がぜんぜん違う。
原因はおそらくはっきりしている。M1 MacでメモリがI6GBしかないから、動かせるモデルが軽量なものに限られる。賢いローカルLLMを選びたくても、そもそも選べない。環境の制約が、体験の質をそのまま決めている。
じゃあ、Chatとして使ってみる、という話
コーディング支援は難しいとわかったので、方向を変えた。LM Studioでローカルサーバーを立てて、Typingmindというアプリと組み合わせてChatとして使ってみる。ウェブの情報を調べながら会話できる環境を作りたかった。
ここでまた壁にぶつかった。MacのセキュリティのせいかHTTP接続が弾かれる。プロキシサーバーを立てて回避することになった。この作業自体はClineにスクリプトを書かせて解決したけど、「チャットとして使いたいだけなのに、なんでここまでやるんだろう」という感覚は正直あった。
使ってみると、動く。動くけど、Claude Sonnetのほうが賢い。これも結局、同じ問題に戻ってくる。軽量モデルしか使えない環境では、賢さに限界がある。
使えないことと、ポテンシャルは別の話だと思う
以前、IBM出身の方から面白い話を聞いたことがある。ソフトウェアによる日本語化が始まった初期のころ、表示が遅くて「これは使い物にならない」と感じたらしい。ところがその開発者から、「ハードウェアが進化すれば、この遅さは問題にならなくなる」と言われたそうだ。
その後の話はご存知のとおりで、DOS/Vが普及し、ハードウェアで日本語処理を担っていたPC-9801は急速に駆逐されていった。「今は使えない」が「使えるようになる」に変わるまで、そう時間はかからなかった。
ローカルLLMの現状は、あの初期の日本語表示に似ているかもしれないと思う。今の僕の環境では、実用にはまだ遠い。でも、Apple Intelligenceのように半導体に組み込まれた形でAIが動くようになれば、話は変わってくる。ハードウェアの進化が、今のもどかしさを、過去のものにしてしまう可能性がある。
そのときのために、環境を試し続けておくことには意味があるんじゃないかと、うまくいかなかった今日も、なんとなくそう思っている。