- 外部データをRetrievalしてLLM活用する上での課題と対策案
- GPT系の日本語LLMモデル
- sudy-super/CoTangent
- 日本語に特化した大規模言語モデル(生成AI)を試作
- 第2回 LLM 勉強会
- OpenAIの埋め込みよりも高性能?多言語E5を日本語で評価してみる
- 複数の ChatGPT プラグインを開発し AI オーケストレーションを実行するサンプルコード
- Using Azure OpenAI like a Pro to build powerful AI applications
- GPT-4 API general availability and deprecation of older models in the Completions API
- Prompt Flowが使えるようになったから、もうLangChainとか自分でホストしなくていい世界になったのかもしれない。
外部データをRetrievalしてLLM活用する上での課題と対策案
- 社内ドキュメントを元に回答するLLMを作成するケースに関する課題と対策案について紹介した記事
- 紹介されている課題
- 関連テキストを抽出するRetrievalがうまくいかない
GPT系の日本語LLMモデル
- GPT系の日本語LLMのリンクをまとめた記事
sudy-super/CoTangent
- 人手で作成した高品質でクリーンな100セットの日本語用CoT用データセット
日本語に特化した大規模言語モデル(生成AI)を試作
第2回 LLM 勉強会
- 国立情報学研究所にて開催された第2回 LLM 勉強会の資料
- LLM開発に実際に取り組んだ方がどのような点で苦労したかが共有されている
OpenAIの埋め込みよりも高性能?多言語E5を日本語で評価してみる
- 多言語のテキスト埋め込み用のモデルであるMultilingual-E5-largeの性能を日本語のデータセットで評価した記事
- 日本語のデータセットであるJSTSを利用して、text-embedding-ada-002と比較した
- 日本語データに対して、E5の小さなモデルはtext-embedding-ada-002と同じくらいの性能であり、大きなモデルは上回る性能となった
複数の ChatGPT プラグインを開発し AI オーケストレーションを実行するサンプルコード
- 2 つの異なるシステムを ChatGPT プラグインとして公開し、これを AI オーケストレーターである LangChain から呼ぶデモ
Using Azure OpenAI like a Pro to build powerful AI applications
- Azure OpenAI Serviceを使用したソリューションの作成方法を学ぶワークショップ資料
- アプリ側をAppServiceで作成している例が多い
- Azure Functionでバックエンド側を作成している
GPT-4 API general availability and deprecation of older models in the Completions API
- GPT-4 APIがGAされた
- GPT-4とGPT-3.5 Turboのファインチューニングが今年後半に利用可能になる
- Completion APIを使用する古いモデルが2024年1月4日以降利用できなくなる
- 古いembeddingsモデルも2024年1月4日に利用できなくなる
- Azure OpenAI Serviceも同様の発表をしている
Prompt Flowが使えるようになったから、もうLangChainとか自分でホストしなくていい世界になったのかもしれない。
- Prompt Flowの紹介記事
- フローが完成したらデプロイできる
- 作成したフローをAPIとして呼び出せる