SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023年4月10日の週に気になった記事などまとめ

プロンプトを管理しやすくするツールを作ってみた / I created a tool to make the prompts easier to manage.

speakerdeck.com

  • プロンプトを生成するツール
    • Markdownで記述する
    • 変数を定義し、テンプレート構文に展開できる
  • LLMに投げた後の戻り値も変数に格納できる

DeepSpeed Chat: ChatGPTライクなモデルを簡単・高速・低コストに、あらゆるスケールで学習

github.com

  • ChatGPTスタイルのモデルを訓練できる仕組み
    • 学習済モデルから開始して、InstructGPT学習の3ステップを実行し、独自のモデルを作成できる
    • 学習後に会話形式のインタラクションをテストするための、推論APIも提供する
  • OPT30Bを18時間で訓練出来、コストは600ドル以下
    • A100-80AGB×8のノード1台で訓練した場合
  • 175Bの巨大モデルの訓練もできる
    • A100 ×64を用意して、5120ドルで20時間

大規模言語モデル(LLM)に関するビジネスと法律~LLMやデータセットの構築と提供(レイヤー1)~

storialaw.jp

Text generation web UI

github.com

  • LLaMA, llama.cpp, GPT-J, Pythia, OPT, and GALACTICAのようなLLMを動かすためのWebUI

生成AI(Generative AI)の倫理的・法的・社会的課題(ELSI)論点の概観:2023年3月版

elsi.osaka-u.ac.jp

  • 生成AI分野の2023年3月までのELSI動向
  • データ、著作権、バイアス、プライバシー&セキュリティなどの論点が掲載されている

【GPT】今日から使えるOSSライブラリまとめ

qiita.com