SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023年11月6日の週に気になった記事などまとめ

LLMのための日本語インストラクションデータ作成プロジェクト

liat-aip.sakura.ne.jp

  • 日本語インストラクションを開発するプロジェクトを開始した
  • 共同研究以外の企業・団体に対しても、データ完成時に有償にてデータの商用ライセンスを提供する予定

拡散モデルによる金融時系列生成

tech.preferred.jp

  • 拡散モデルによる金融時系列生成について取り組んだ記事

ブラウザでリロードしながらキャッシュの挙動を確認してる全ての開発者へ

blog.jxck.io

  • ブラウザから発生するリクエストの説明と、ユーザが体験するキャッシュの挙動の検証方法について

Retrieval-based LM (RAG system) ざっくり理解する

speakerdeck.com

  • Retrival-based LMの推論フレームに沿って、RAGを改善するためにはどのようなことを気を付ければよいかを説明した資料
  • 引用元の論文が多数掲載されており、非常に参考になる資料

日英・英日機械翻訳モデルALMA-7B-Ja-V2の公開

webbigdata.jp

  • 日英・英日機械翻訳モデルALMA-7B-Jaの性能を更に向上したV2が公開された
  • 翻訳機能に特化されたモデル
  • 一般消費者向けのGPU付きパソコンで実用的な速度で動かせる
  • Llama 2ライセンスで公開されている

New models and developer products announced at DevDay

openai.com

  • OpenAI社のDevDayで以下のような多くの発表がされた
    • 128Kに対応したGPT-4 Turbo
    • Assistans API
      • RetrievalやCodeIntepreterを活用したアプリを簡単に作成できる
    • GPT-4Turbo with Vision
      • 画像ファイルを入力として受け付ける
    • モデル利用価格の引き下げ
    • 以下の記事で日本語訳でまとめられている

cloud.google.com

  • Vertex AI Searchプラットフォームのベクトル検索が改善された

OpenAIのgpt-4-vision-previewに画像を投げてどんなことをしてくれるのか試してみた

note.com

Google Colab で DALL-E 3 のAPIを試す

note.com

  • DALL-2とは違い、テキストからの画像生成しかできない

OpenAI Python API Library v1.0 入門

note.com

  • 「OpenAI Python API Library v1.0」のインタフェースについてまとめた記事

OpenAI APIJSON modeを使ってみる

note.com

  • 出力を必ずJSONフォーマットにするJSONモードを試した記事
  • システムメッセージ側でJSONを出力するように指定する必要がある

Google Colab で OpenAI API の Retrieval を試す

note.com

指示学習済み大規模言語モデル PLaMo-13B-Instruct を公開しました

tech.preferred.jp

  • Preferred Networks では、11月1日に指示学習(instruction tuning)を行った大規模言語モデルPLaMo-13B-Instruct」と「PLaMo-13B-Instruct-NC」を公開した
  • 公開したモデルは商用・非商用でそれぞれ2モデル「PLaMo-13B-Instruct」「PLaMo-13B-Instruct-NC」に分かれている
    • 非商用のモデルでは、商用不可のデータセットを加えて、よりスコアが高くなっている

【緊急生配信】OpenAI『DevDay』から考える、これからのAIがどうなるか。

www.youtube.com

CyberAgentにおける日本語LLMの開発について CyberAgent石上様

www.youtube.com

  • LLMモデルの開発方法の振り返り
  • OpenCalmの開発にみる実際のLLM開発
  • 新しい取り組み

OpenAI Assistants API(Playground)を使ってコーディングのアドバイスをしてくれるアシスタントを作る

zenn.dev

  • OpenAI Assistants APIをPlaygroundを試した記事

OpenAI API の Assistant API のしくみ

note.com

  • OpenAI API の 「How Assistants work 」を日本語でまとめた記事
  • アシスタントは永続的なスレッドにアクセスできる。
    • スレッドはメッセージ履歴を保存し、会話長がモデルのコンテキスト長より長すぎる場合の切り捨てが自動的に行われる
  • アシスタントごとに最大20個のファイルを添付できる
    • 各ファイルの最大サイズは512MB
    • 組織がアップロードする全ファイル限界サイズは100GB
  • メッセージに注釈が含まれる場合がある
    • ファイルの引用した場合、回答を作成するために使用した特定のファイル内への特定の引用への参照が含まれる

Come build with us: Microsoft and OpenAI partnership unveils new AI opportunities

www.microsoft.com

  • Azure OpenAI Serviceでも年内にGPT-4 Turboなどの今回発表されたモデルを利用できるようになる

AIが「言語生成AIとの対話」で賢くなり続ける自動成長モデル 米Meta含む研究者らが開発

www.itmedia.co.jp

  • 環境と直接対話せずに大規模言語モデル(LLM)からのフィードバックを用いてAIエージェントを強化学習で訓練する手法が提案された
  • 事前に学習されたLLMから報酬関数を抽出し、その報酬を利用してAIエージェントを訓練する
    • LLMを活用して観測データから得られたイベントの説明のペアの重要性を判定し、その結果を報酬として定義する
    • 報酬は、単体で最大化することも、環境から得られる外部報酬と併用することもできる
  • Motifの核心的なアイデアは、イベントを評価することが、イベントを0から生成するよりも容易であるという点

Google Colab で OpenAI API の Function Calling を試す

note.com

  • Google Colab」で「OpenAI API」の「Assistant API」の「Function Calling」を試した記事

Google Colab で OpenAI API の Code Interpreter を試す

note.com

Quality at a Glance: An Audit of Web-Crawled Multilingual Datasets

arxiv.org

  • (CCAligned、ParaCrawl、WikiMatrix、OSCAR、mC4) とともにリリースされた 205 の言語固有のコーパスの品質を手動で監査した論文

Amazon Bedrock を利用した Alexa スキル「AI 基盤くん」を公開しました!

blog.serverworks.co.jp

  • Amazon Bedrock を利用した Alexa スキル「AI 基盤くん」を説明した記事
  • 東京リージョンだとClaude Instant V1しか利用できない

OpenAI API で提供されている モデル まとめ

note.com

マルチモーダルな GPT-4V は画像形式の文章をマークダウン化するのに使えるんじゃないか説

zenn.dev

  • GPT-4V を使って画像形式の文章を簡単にマークダウン形式に変換できるかを検証した記事
  • 英語はほぼ完ぺきにマークダウン化できている
  • 日本語は文字認識の精度がやや低い

Function callingをローカルLLMで動かしてみよう。

note.com

  • Function callingをローカルLLMで動かすことにトライした記事

OpenAI の Assistant Playuground の Function Calling を試す

note.com

OpenAI の Assistant Playground の Code Interpreter を試す

note.com

GPT-4-1106-Previewの日本語能力を試す

note.com

rinnaのYouri 7Bで8GB GPUでもLLM翻訳ができるかも

nowokay.hatenablog.com

  • rinna/youri-7b-instruction-gptqのGPUメモリ使用量を計測
    • 8GBメモリのGPUでも動きそう

OpenAIの音声テキスト変換whisperの新モデル"large-v3"を試す

note.com

  • google colab の無料GPU(T4)でWhisperのlarge-v3を試した記事

A Survey of Large Language Models for Autonomous Driving

arxiv.org

  • 自動運転のためのLLMに関する研究ラインを体系的にレビューする論文

GitHub Universe 2023 での AI に関する発表まとめ!Copilot Chat の12月からの一般提供開始など

dev.classmethod.jp

  • GitHub Copilot Chatが12月から一般提供開始
  • GitHub Copilot Enterprise が 2024年2月より一般提供開始
  • GitHub Copilot Workspaceの発表
    • タスクを与えるとそれを解決するためのプランや実際のコードを提案してくれる
    • それをビルドテストする環境がセットになったもの

Instruction Tuningを行なった130億パラメータの日本語LLMの公開:Stockmark-13b-instruct

tech.stockmark.co.jp

  • Stockmark-13bに対して追加の学習を行い、ユーザーの指示に従うように訓練したStockmark-13b-instructが公開された
  • Stockmark-13b-instructのライセンスはCC BY-NC-SAで、研究目的のみに利用できる

RAGにおけるドキュメント検索精度向上について(概要編)

zenn.dev

  • RAG(Retrieval Augmented Generative)の構築において、ドキュメント検索精度の向上にどのように取り組んだ内容の概要が紹介された記事

Labsから事業部へ、生成AIによるプロセスのリデザイン

note.com

  • LLMは多様なタスクを一つのモデルで取り組むことができるため、一部の部門のニーズを満たすだけでもコストに見合う形でAIによる業務変化を生み出せる可能性がある
  • LLMや生成AIによる業務の自動化は、置き換えることではなく、より良いユーザーエクスペリエンス(UX)を追求し、生産性の向上を目指すもの
  • これまでのSaaSでは「システムに人が合わせる」という時代でしたが、LLMを組み合わせることで「人にシステムが合わせる」が実現できる時代が来た

GPTs はシュッと作れるけど注意が必要よ

note.com

  • 一般公開するGPTsには他の人に見られて困る情報は絶対に入れてはだめなことを説明した記事