SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023年6月5日の週に気になった記事などまとめ

SageMaker での LLM Instruction Tuning

github.com

  • AWSがSageMaker上でのLLMをファインチューニング/デプロイするためのサンプルノートブックを公開している
    • ファインチューニングに関しては通常の方法とLoRAメソッドを利用した方法のノートブックが存在する

GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り

blog.brainpad.co.jp

  • GPT4の登場から5月31日までの間に登場した論文をまとめた記事

JP Language Model Evaluation Harness

github.com

「大規模言語モデル(LLM)カオスマップ」2023年度6月版が公開

digital-shift.jp

  • 株式会社ANOBAKAは、「大規模言語モデル(LLM)カオスマップ」2023年度6月版を公開した

製造業のニーズに最適な機械学習サービスの選択

aws.amazon.com

  • AWSのAutoMLサービスを利用して、解決できる製造業の課題が紹介されている

saldra/sakura_japanese_dataset

huggingface.co

  • 商用利用可能な超小規模高品質日本語データセットが公開されている
  • 常識問題と数学問題が半々で含まれている

JSAI2023 Tutorial 「基盤モデルの技術と展望」

speakerdeck.com

  • 基盤モデルの技術的な動向について概観し、今後の展望について述べられた資料

LLMを制御するには何をするべきか?

blog.brainpad.co.jp

  • LLMを制御するアプローチ
    • モデルを調整するアプローチ
      • プロンプトエンジニアリング
      • ファインチューニング
      • アライメント
    • モデルの前後を管理するアプローチ
      • データクリーニング
      • モデル監視
      • 出力フィルタリング