2024-01-03から1日間の記事一覧

2024-01-03

Llama.cppをGPUを使用して実行してみた

LLM

llama-cpp-pythonをGPUも活用して実行してみたので、動かし方をメモポイント GPUを使うために環境変数に以下をセットする CMAKE_ARGS="-DGGML_CUDA=on" FORCE_CMAKE=1 n_gpu_layersにGPUにオフロードされるモデルのレイヤー数を設定。7Bは32、13Bは40が最…

2024-01-03

日本語ローカルLLMまとめ※作成中

データ分析 LLM

日本語ローカルLLMの情報をこの記事にまとめ中です。 ※2023年10月31日現在の情報を記入したつもりですが、正確性は保証できません。まとめ lightblue/karasu-7B-chat-plus-unleashed lightblue/qarasu-14B-chat-plus-unleashed rinna/nekomata-14b-instruct…

SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024-01-03から1日間の記事一覧

Llama.cppをGPUを使用して実行してみた

日本語ローカルLLMまとめ※作成中