2023年9月18日の週に気になった記事などまとめ - SEが最近起こったことを書くブログ

OptimumライブラリのBetter Transformerの機能を使うことで、Hugging Face形式のモデルでPytorch 2のFlash Attentionを使用可能にする方法を試した記事
Flash Attentionを使用する方法と元モデルと計測時間、VRAM使用量を比較
key-value cacheの有無による計測時間、VRAM使用量も比較されている

LLMに自身のハルシネーション（幻覚）を「自覚」させ、減らす方法

aiboom.net

LLMが生成した参照（引用文献などの情報）が幻覚を減らすために取り入れることができる工夫について説明されている
- 前処理と後処理で工夫している

CulturaX: A Cleaned, Enormous, and Multilingual Dataset for Large Language Models in 167 Languages

huggingface.co

適切にクリーニングされた多言語のデータセットが公開された
167言語、6.3兆トークンのデータセット

aiwaves-cn/agents

github.com

自律的な言語エージェントを構築するためのライブラリ/フレームワークが公開された
長短期記憶、ツールの使用、Web検索、エージェント間通信などの機能をサポートするエージェントを構築できる

自律言語エージェントを構築するためのフレームワーク Agents を試す

note.com

自律言語エージェントを構築するためのフレームワーク「Agents」を試した記事

NII Today 第100号特集生成AIに挑む

www.nii.ac.jp

画像や音声を含む生成AIの進化は、その技術や活用に期待がかかる一方、データの真偽、正当性、フェイクによる情報の錯乱や犯罪の脅威に人々を晒している。何が本当で何が偽物なのか。「生成AIに挑む」NIIの取り組みと研究成果を紹介した記事

NExT-GPT/NExT-GPT

github.com

インプット、アウトプットともに、以下を利用できるマルチモーダルLLM
- テキスト
- 画像
- 音声
- ビデオ

Owl : A Large Language Model for IT Operations

arxiv.org

IT起案連の幅広い知識を持つ大規模言語モデルowlを構築した論文
訓練用のデータセットを構築しただけでなく、学習用のアダプター戦略も提案されている

Multimodal Foundation Models: From Specialists to General-Purpose Assistants

arxiv.org

マルチモーダルモデルの分類と進化について記載されたサーベイ論文

最近話題の Vision-Languageモデルまとめ

note.com

「Vision-Languageモデル」をまとめた記事

ローカルLLM のリリース年表

note.com

主な「ローカルLLM」のリリース年表をまとめた記事
日本語データで学習したモデルが多く紹介されており、非常に参考になる

Stability AI Japanにおける大規模言語モデルの研究開発

speakerdeck.com

Japanese StableLMの紹介
より強力な日本語LLMを作成するために考えていること

AzureのGPU搭載VMを安い順に並べる（2023年9月版）

note.com

Azure でGPUが使えるVMについてまとめた記事

Demystifying Azure OpenAI Networking for Secure Chatbot Deployment

techcommunity.microsoft.com

Azure OpenAI Serviceを活用活用したアプリを安全に展開するためのネットワーク構成を説明した記事

JR西日本カスタマーリレーションズとLLM DXパートナー ELYZA、通話内容要約業務に言語生成AIを導入

prtimes.jp

株式会社JR西日本カスタマーリレーションズと株式会社ELYZAは、JWCRのコンタクトセンターにおける通話内容要約業務に、マイクロソフト社のAzure OpenAI GPTシリーズ(以下GPTシリーズ)をベースとしELYZAが開発した言語生成AIを導入した
LLMがようやくしやすい形式にデータを整える前処理や要約出力後に記載を修正する後処理システムも設計した

kani: 軽量LLMフレームワーク

note.com

ツールの使用/関数呼び出しを備えたチャットベースの言語モデルのための軽量でハッキング可能なフレームワークkani (カニ) を試した記事

大規模言語モデル(Llama2など)を正攻法でファインチューニングする際のメモ(ZeRO-Offload, not QLoRA)

note.com

deepspeedを使って、「elyza/ELYZA-japanese-Llama-2-7b-instruct」をフルファインチューニングした記事

LMSYS-Chat-1M: A Large-Scale Real-World LLM Conversation Dataset

arxiv.org

vicunaデモとChatbotArenaウェブサイトで収集したデータセットを分析した論文

LLM Fine-Tuning (東大松尾研LLM講座 Day5資料)

speakerdeck.com

東大松尾研サマースクール2023「大規模言語モデル」Day5の講義の資料
主にInstruction TuningとPEFTについて分かりやすく説明がなされている

生成AI・LLMのツール拡張に関する論文の動向調査 2023年8月版

blog.brainpad.co.jp

LLM論文レビュー会のツール拡張のトピックで取り上げた４つの論文の紹介
以下の論文が紹介されている
- コンテキストへの外部情報の入力方法やモデルのコンテキスト長がQAタスクの回答精度への影響
- 事実誤認を検知する最新のフレームワーク
- ハルシネーションへ対処できるように標準作業手順（SOP）を組み込んだ「MetaGPT」
- 公開されているAPIを利用能力を引き出す研究

self-attentionを代替する各種手法について

zenn.dev

self-attentionの計算量の課題に対応することを目的として提案されたTransFormerの代替アーキテクチャについてまとめた記事

【インターンレポート】量子化による大規模言語モデル軽量化の効果測定

engineering.linecorp.com

量子化による大規模言語モデル（LLM）の軽量化について検証した記事
『FP8を用いた言語モデルの高速化』と『GPTQによる量子化モデルの効果測定』の調査結果

Google Colab で Xwin-LM-70B-V0.1-GPTQ を試す。

note.com

「Google Colab」で「Xwin-LM-70B-V0.1-GPTQ」を試した記事

[AI 論文]基礎知識"NeRF"の論文のやさしい日本語訳

zenn.dev

NeRFの論文を翻訳した記事

Open Interpreterを誰でも使えるSlack botにしました

zenn.dev

Open InterpreterをSlack botにした記事
Cloud Runを使ってサーバーレスなOpen Interpreter実行環境を構築している
ファイルや会話履歴をGCSに保存している

ReactPy

reactpy.dev

ReactのようにComponentベースでインターフェースを構築できるPythonライブラリ

サーバーレスで仮想待合室を作ろう！ / Serverless Virtual Waiting Room

speakerdeck.com

大規模なバースト中にダウンしないようなシステムをサーバーレスで構築する方法
Virtual Waiting Room on AWSの紹介

LLM 時代におさえておきたい Azure Serverless ファミリーまとめ / serverlessdaystokyo2023-llm-aoai

speakerdeck.com

ServerlessによるLLM活用アーキテクチャの紹介

失敗から学ぶAPIファースト / API first learning from failure

speakerdeck.com

APIファーストの考え方と実践方法についての紹介

足りないパッケージを自分で判断して、インストールして再実行してくれる機能の実装例

yoheinakajima/instagraph

【ChatGPTにできることを正しく理解する③】グノシーのChatGPT活用法とは

Open InterpreterをDockerで動かす

GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する

text-generation-webuiで、ELYZA-japanese-Llama-2-7n-fast-instructのLoRAトレーニングを試す。

シュッと gpt-3.5-turbo-instruct を流してみる

Flash Attentionを使ってLLMの推論を高速・軽量化できるか？

LLMに自身のハルシネーション（幻覚）を「自覚」させ、減らす方法

CulturaX: A Cleaned, Enormous, and Multilingual Dataset for Large Language Models in 167 Languages

aiwaves-cn/agents

自律言語エージェントを構築するためのフレームワーク Agents を試す

NII Today 第100号 特集生成AIに挑む

NExT-GPT/NExT-GPT

Owl : A Large Language Model for IT Operations

Multimodal Foundation Models: From Specialists to General-Purpose Assistants

最近話題の Vision-Languageモデル まとめ

ローカルLLM のリリース年表

Stability AI Japanにおける大規模言語モデルの研究開発

AzureのGPU搭載VMを安い順に並べる（2023年9月版）

Demystifying Azure OpenAI Networking for Secure Chatbot Deployment

JR西日本カスタマーリレーションズとLLM DXパートナー ELYZA、通話内容要約業務に言語生成AIを導入

kani: 軽量LLMフレームワーク

大規模言語モデル(Llama2など)を正攻法でファインチューニングする際のメモ(ZeRO-Offload, not QLoRA)

LMSYS-Chat-1M: A Large-Scale Real-World LLM Conversation Dataset

LLM Fine-Tuning (東大松尾研LLM講座 Day5資料)

生成AI・LLMのツール拡張に関する論文の動向調査 2023年8月版

self-attentionを代替する各種手法について

【インターンレポート】量子化による大規模言語モデル軽量化の効果測定

Google Colab で Xwin-LM-70B-V0.1-GPTQ を試す。

[AI 論文]基礎知識"NeRF"の論文のやさしい日本語訳

Open Interpreterを誰でも使えるSlack botにしました

ReactPy

サーバーレスで仮想待合室を作ろう！ / Serverless Virtual Waiting Room

LLM 時代におさえておきたい Azure Serverless ファミリーまとめ / serverlessdaystokyo2023-llm-aoai

失敗から学ぶAPIファースト / API first learning from failure

NII Today 第100号特集生成AIに挑む

最近話題の Vision-Languageモデルまとめ