SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年9月2日の週に気になった記事などまとめ

気になったものまとめ

ITエンジニアのためのプロンプトエンジニアリング
Serverless AI Chat with RAG using LangChain.js
AutoGen Studio: A No-Code Developer Tool for Building and Debugging Multi-Agent Systems
【最大90%の時間削減】生成AI最前線、トヨタコネクティッド社のAI効率化事例と全社的生成AI導入戦略の全容
モダンアプリケーションにおけるユーザー認証・認可の実装のために考慮しておきたいこと
LangGraph での Human-in-the-loop の実装
ハイパーパラメータ自動最適化フレームワークOptunaの最新版となるv4.0をリリース
LangChainの現在とv0.3にむけて
「ELYZA-japanese-Llama-2-70b」開発における、大規模モデル学習ノウハウの解説
GraphRAG Analysis, Part 2: Graph Creation and Retrieval vs Vector Database Retrieval
オープンソースのRAG UI「kotaemon」を試す
基盤モデル時代に言語で音声を処理したい
RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う
LLMに日本語テキストを学習させる意義
101 Gen AI Cheat Sheets
Introducing GPT-4o-2024-08-06 API with Structured Outputs on Azure
General availability of Prompt Shields in Azure AI Content Safety and Azure OpenAI Service
Azure OpenAIでStructured Outputsを使う！
Difyで作る！RAGの精度を向上させるSelf-Routeについて解説してみた
Web アプリケーションにおける Amazon ECS / AWS Fargate アーキテクチャデザインパターン
SoftMatcha: A Fast and Soft Pattern Matcher
In Defense of RAG in the Era of Long-Context Language Models
音声AIエージェントの世界とRetell AI入門
生成AIの二大潮流と自動運転
mattshumer/Reflection-Llama-3.1-70B
2024年版運用者たちのLLM
World Models
Self-Routeの詳しめな解説【ずんだもん解説】
技術ブログや登壇資料を秒で作るコツ伝授します
[Azure] Terraform or Bicep を考えてみた
カグルとワタシ ~ kaggle GM振り返りポエム ~
DeepSeek-V2.5 を試す
Prompt Cachingは本当に効果的なのか検証してみた
はじめに教わるデザインの基本。気をつけるべき28のポイント
Neo4j LLM Knowledge Graph Builderを試す
【完全ガイド】生成AI社内推進で終わらせない、組織定着への道筋
【2024/09/05】【LT大会#8】LLMの活用・機械学習・データ分析関係のいろいろな話題にふれよう【アーカイブ】
Late Chunking: Balancing Precision and Cost in Long Context Retrieval
Building A Generative AI Platform
2024年夏: 生成AI普及後のコンテンツの在り方と未来を予想してみる
OP-RAGの詳しめな解説【ずんだもん解説】
LlamaIndex + Amazon Neptune GraphRAG やってみた

ITエンジニアのためのプロンプトエンジニアリング

ITエンジニアに効果的にプロンプトエンジニアリングを活用するためのコツを伝授する記事

Serverless AI Chat with RAG using LangChain.js

LangChain.jsとAzureを利用したサーバーレスのチャットボットのサンプルリポジトリ

AutoGen Studio: A No-Code Developer Tool for Building and Debugging Multi-Agent Systems

AutoGenにノーコードのインターフェースを追加したAutogen Studioを紹介した論文

【最大90%の時間削減】生成AI最前線、トヨタコネクティッド社のAI効率化事例と全社的生成AI導入戦略の全容

chatgpt-lab.com

トヨタコネクティッド株式会社の生成AIの具体的な活用事例などAIへの取り組みを紹介した記事

モダンアプリケーションにおけるユーザー認証・認可の実装のために考慮しておきたいこと

serverless.co.jp

サーバーレスアーキテクチャを導入した構成でのユーザー認証認可において考慮しておきたい点をまとめた記事

LangGraph での Human-in-the-loop の実装

github.com speakerdeck.com

LangGraphに人間による承認を実装した例

ハイパーパラメータ自動最適化フレームワークOptunaの最新版となるv4.0をリリース

www.preferred.jp

OptunaHubが正式に公開された
実験管理機能が強化された
分散最適化機能が強化された

LangChainの現在とv0.3にむけて

speakerdeck.com

単純なエージェントは、AgentExecutorはレガシーであるため、create_react_agentへの移行がおすすめされている。

「ELYZA-japanese-Llama-2-70b」開発における、大規模モデル学習ノウハウの解説

「ELYZA-japanese-Llama-2-70b」の開発の過程で得られた知見を紹介する記事

GraphRAG Analysis, Part 2: Graph Creation and Retrieval vs Vector Database Retrieval

GrapghRAGとFAISSを使ったベクターDBによる検索を比較する記事
正確性が必要なケースではGraphRAGの方が有利な場合がある

オープンソースのRAG UI「kotaemon」を試す

ollamaで動かす方法を紹介した記事
GrapghRAGの場合は、モデルがgpt-4-turbo限定となる

基盤モデル時代に言語で音声を処理したい

https://takamichi-lab.github.io/assets/pdf/slide/2024/takamichi24nl-invited.pdf

RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う

RAGシステムを専門用語に強くするための手法「HybridRAG」について日本語で簡単にまとめた記事

LLMに日本語テキストを学習させる意義

speakerdeck.com

日本語資源の学習効果顕著なタスクがあった
- 日本の知識に関する質も納富
- 英日機械翻訳
35種類のLLMに日英19件のタスクで評価

101 Gen AI Cheat Sheets

生成AIの様々な側面に関するチートシートをまとめた記事

Introducing GPT-4o-2024-08-06 API with Structured Outputs on Azure

techcommunity.microsoft.com

AzureでGPT-4o-2024-08-06を利用可能になったことを紹介する記事

General availability of Prompt Shields in Azure AI Content Safety and Azure OpenAI Service

techcommunity.microsoft.com

Azure AI Content SafetyとPrompt ShieldsがGAになった

Azure OpenAIでStructured Outputsを使う！

APIバージョンが2024-08-01-preview 以上で利用できる
スキーマを自然言語ではなく、pydanticで指定できる

Difyで作る！RAGの精度を向上させるSelf-Routeについて解説してみた

www.youtube.com

Web アプリケーションにおける Amazon ECS / AWS Fargate アーキテクチャ デザインパターン

Amazon ECS / AWS Fargate を中⼼とした代表的なアーキテクチャパターンを紹介した記事
CloudShellを特定のVPCで利用できるようになった

SoftMatcha: A Fast and Soft Pattern Matcher

softmatcha.github.io

単語埋込みを用いて、柔らかい上に高速な単語列マッチングを実現する研究

In Defense of RAG in the Era of Long-Context Language Models

長いコンテキストを扱う言語モデルでRAG用のコンテキストを入力する際に元のテキストの順序を保持して入力する方法を提案した論文

音声AIエージェントの世界とRetell AI入門

speakerdeck.com

生成AIの二大潮流と自動運転

speakerdeck.com

生成AIではLLMと拡散モデルが二大トレンド
走行データから得られる経験では不十分な場合にWeb助―いるデータからの知識を取り入れる
アクションで条件付け可能な未来の動画生成を生成AIで行う

mattshumer/Reflection-Llama-3.1-70B

Glaiveによって生成された合成データでトレーニングされた
チャット形式はLlama3.1と同じ

2024年版運用者たちのLLM

speakerdeck.com

World Models

世界モデルを持たないLLMにとって難しい質問のリストを記載したリポジトリ

Self-Routeの詳しめな解説【ずんだもん解説】

www.youtube.com

技術ブログや登壇資料を秒で作るコツ伝授します

speakerdeck.com

ネタだしと執筆を分離する
冒頭から書き始めない
完成度60%でリリースする

[Azure] Terraform or Bicep を考えてみた

TerraformとBicepのメリット、デメリットを比べた記事
Bicepは状態管理がない

カグルとワタシ ~ kaggle GM振り返りポエム ~

DeepSeek-V2.5 を試す

DeepSeek-V2.5 は 236B / Active Parameter 21B の MoE
Function CallingやJSON出力もできる

Prompt Cachingは本当に効果的なのか検証してみた

Anthoropic APIのPrompt Cacheingの使い方と実際にコスト削減や応答速度向上にどの程度貢献するかを検証した記事
キャッシュの有効期間は5分
- 5分以内にキャッシュにアクセスがあった場合は、期限は更新される
長いコンテキストを多用するシナリオでは大きな効果が期待できる

はじめに教わるデザインの基本。気をつけるべき28のポイント

Neo4j LLM Knowledge Graph Builderを試す

非構造化テキストをナレッジグラフに変換するアプリケーション
Docker Composeでローカルに環境を構築することもできる

【完全ガイド】生成AI社内推進で終わらせない、組織定着への道筋

「生成AI社内推進の成功と失敗」のレポート記事

【2024/09/05】【LT大会#8】LLMの活用・機械学習・データ分析関係のいろいろな話題にふれよう【アーカイブ】

www.youtube.com

Late Chunking: Balancing Precision and Cost in Long Context Retrieval

制度とコストのバランスをとったチャンキングの方法を紹介した記事

Building A Generative AI Platform

生成AIプラットフォームでシステムの性能を向上させる単に利用できるコンポーネントを紹介する記事

2024年夏: 生成AI普及後のコンテンツの在り方と未来を予想してみる

OP-RAGの詳しめな解説【ずんだもん解説】

www.youtube.com

LlamaIndex + Amazon Neptune GraphRAG やってみた

Amazon Neptune AnalyticsとLlamaIndexを活用してGraphRAGをやってみた記事