- ITエンジニアのためのプロンプトエンジニアリング
- Serverless AI Chat with RAG using LangChain.js
- AutoGen Studio: A No-Code Developer Tool for Building and Debugging Multi-Agent Systems
- 【最大90%の時間削減】生成AI最前線、 トヨタコネクティッド社のAI効率化事例と全社的生成AI導入戦略の全容
- モダンアプリケーションにおけるユーザー認証・認可の実装のために考慮しておきたいこと
- LangGraph での Human-in-the-loop の実装
- ハイパーパラメータ自動最適化フレームワークOptunaの最新版となるv4.0をリリース
- LangChainの現在とv0.3にむけて
- 「ELYZA-japanese-Llama-2-70b」開発における、大規模モデル学習ノウハウの解説
- GraphRAG Analysis, Part 2: Graph Creation and Retrieval vs Vector Database Retrieval
- オープンソースのRAG UI「kotaemon」を試す
- 基盤モデル時代に言語で音声を処理したい
- RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う
- LLMに日本語テキストを学習させる意義
- 101 Gen AI Cheat Sheets
- Introducing GPT-4o-2024-08-06 API with Structured Outputs on Azure
- General availability of Prompt Shields in Azure AI Content Safety and Azure OpenAI Service
- Azure OpenAIでStructured Outputsを使う!
- Difyで作る!RAGの精度を向上させるSelf-Routeについて解説してみた
- Web アプリケーションにおける Amazon ECS / AWS Fargate アーキテクチャデザインパターン
- SoftMatcha: A Fast and Soft Pattern Matcher
- In Defense of RAG in the Era of Long-Context Language Models
- 音声AIエージェントの世界とRetell AI入門
- 生成AIの二大潮流と自動運転
- mattshumer/Reflection-Llama-3.1-70B
- 2024年版 運用者たちのLLM
- World Models
- Self-Routeの詳しめな解説【ずんだもん解説】
- 技術ブログや登壇資料を秒で作るコツ伝授します
- [Azure] Terraform or Bicep を考えてみた
- カグルとワタシ ~ kaggle GM振り返りポエム ~
- DeepSeek-V2.5 を試す
- Prompt Cachingは本当に効果的なのか検証してみた
- はじめに教わるデザインの基本。気をつけるべき28のポイント
- Neo4j LLM Knowledge Graph Builderを試す
- 【完全ガイド】生成AI社内推進で終わらせない、組織定着への道筋
- 【2024/09/05】【LT大会#8】LLMの活用・機械学習・データ分析関係のいろいろな話題にふれよう【アーカイブ】
- Late Chunking: Balancing Precision and Cost in Long Context Retrieval
- Building A Generative AI Platform
- 2024年夏: 生成AI普及後のコンテンツの在り方と未来を予想してみる
- OP-RAGの詳しめな解説【ずんだもん解説】
- LlamaIndex + Amazon Neptune GraphRAG やってみた
ITエンジニアのためのプロンプトエンジニアリング
- ITエンジニアに効果的にプロンプトエンジニアリングを活用するためのコツを伝授する記事
Serverless AI Chat with RAG using LangChain.js
- LangChain.jsとAzureを利用したサーバーレスのチャットボットのサンプルリポジトリ
AutoGen Studio: A No-Code Developer Tool for Building and Debugging Multi-Agent Systems
- AutoGenにノーコードのインターフェースを追加したAutogen Studioを紹介した論文
【最大90%の時間削減】生成AI最前線、 トヨタコネクティッド社のAI効率化事例と全社的生成AI導入戦略の全容
- トヨタコネクティッド株式会社の生成AIの具体的な活用事例などAIへの取り組みを紹介した記事
モダンアプリケーションにおけるユーザー認証・認可の実装のために考慮しておきたいこと
- サーバーレスアーキテクチャを導入した構成でのユーザー認証認可において考慮しておきたい点をまとめた記事
LangGraph での Human-in-the-loop の実装
- LangGraphに人間による承認を実装した例
ハイパーパラメータ自動最適化フレームワークOptunaの最新版となるv4.0をリリース
- OptunaHubが正式に公開された
- 実験管理機能が強化された
- 分散最適化機能が強化された
LangChainの現在とv0.3にむけて
- 単純なエージェントは、AgentExecutorはレガシーであるため、create_react_agentへの移行がおすすめされている。
「ELYZA-japanese-Llama-2-70b」開発における、大規模モデル学習ノウハウの解説
- 「ELYZA-japanese-Llama-2-70b」の開発の過程で得られた知見を紹介する記事
GraphRAG Analysis, Part 2: Graph Creation and Retrieval vs Vector Database Retrieval
- GrapghRAGとFAISSを使ったベクターDBによる検索を比較する記事
- 正確性が必要なケースではGraphRAGの方が有利な場合がある
オープンソースのRAG UI「kotaemon」を試す
- ollamaで動かす方法を紹介した記事
- GrapghRAGの場合は、モデルがgpt-4-turbo限定となる
基盤モデル時代に言語で音声を処理したい
https://takamichi-lab.github.io/assets/pdf/slide/2024/takamichi24nl-invited.pdf
RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う
- RAGシステムを専門用語に強くするための手法「HybridRAG」について日本語で簡単にまとめた記事
LLMに日本語テキストを学習させる意義
- 日本語資源の学習効果顕著なタスクがあった
- 日本の知識に関する質も納富
- 英日機械翻訳
- 35種類のLLMに日英19件のタスクで評価
101 Gen AI Cheat Sheets
- 生成AIの様々な側面に関するチートシートをまとめた記事
Introducing GPT-4o-2024-08-06 API with Structured Outputs on Azure
- AzureでGPT-4o-2024-08-06を利用可能になったことを紹介する記事
General availability of Prompt Shields in Azure AI Content Safety and Azure OpenAI Service
- Azure AI Content SafetyとPrompt ShieldsがGAになった
Azure OpenAIでStructured Outputsを使う!
Difyで作る!RAGの精度を向上させるSelf-Routeについて解説してみた
Web アプリケーションにおける Amazon ECS / AWS Fargate アーキテクチャデザインパターン
- Amazon ECS / AWS Fargate を中⼼とした代表的なアーキテクチャパターンを紹介した記事
- CloudShellを特定のVPCで利用できるようになった
SoftMatcha: A Fast and Soft Pattern Matcher
- 単語埋込みを用いて、柔らかい上に高速な単語列マッチングを実現する研究
In Defense of RAG in the Era of Long-Context Language Models
- 長いコンテキストを扱う言語モデルでRAG用のコンテキストを入力する際に元のテキストの順序を保持して入力する方法を提案した論文
音声AIエージェントの世界とRetell AI入門
生成AIの二大潮流と自動運転
- 生成AIではLLMと拡散モデルが二大トレンド
- 走行データから得られる経験では不十分な場合にWeb助―いるデータからの知識を取り入れる
- アクションで条件付け可能な未来の動画生成を生成AIで行う
mattshumer/Reflection-Llama-3.1-70B
- Glaiveによって生成された合成データでトレーニングされた
- チャット形式はLlama3.1と同じ
2024年版 運用者たちのLLM
World Models
- 世界モデルを持たないLLMにとって難しい質問のリストを記載したリポジトリ
Self-Routeの詳しめな解説【ずんだもん解説】
技術ブログや登壇資料を秒で作るコツ伝授します
- ネタだしと執筆を分離する
- 冒頭から書き始めない
- 完成度60%でリリースする
[Azure] Terraform or Bicep を考えてみた
- TerraformとBicepのメリット、デメリットを比べた記事
- Bicepは状態管理がない
カグルとワタシ ~ kaggle GM振り返りポエム ~
DeepSeek-V2.5 を試す
- DeepSeek-V2.5 は 236B / Active Parameter 21B の MoE
- Function CallingやJSON出力もできる
Prompt Cachingは本当に効果的なのか検証してみた
- Anthoropic APIのPrompt Cacheingの使い方と実際にコスト削減や応答速度向上にどの程度貢献するかを検証した記事
- キャッシュの有効期間は5分
- 5分以内にキャッシュにアクセスがあった場合は、期限は更新される
- 長いコンテキストを多用するシナリオでは大きな効果が期待できる
はじめに教わるデザインの基本。気をつけるべき28のポイント
Neo4j LLM Knowledge Graph Builderを試す
- 非構造化テキストをナレッジグラフに変換するアプリケーション
- Docker Composeでローカルに環境を構築することもできる
【完全ガイド】生成AI社内推進で終わらせない、組織定着への道筋
- 「生成AI社内推進の成功と失敗」のレポート記事
【2024/09/05】【LT大会#8】LLMの活用・機械学習・データ分析関係のいろいろな話題にふれよう【アーカイブ】
Late Chunking: Balancing Precision and Cost in Long Context Retrieval
- 制度とコストのバランスをとったチャンキングの方法を紹介した記事
Building A Generative AI Platform
- 生成AIプラットフォームでシステムの性能を向上させる単に利用できるコンポーネントを紹介する記事
2024年夏: 生成AI普及後のコンテンツの在り方と未来を予想してみる
OP-RAGの詳しめな解説【ずんだもん解説】
LlamaIndex + Amazon Neptune GraphRAG やってみた
- Amazon Neptune AnalyticsとLlamaIndexを活用してGraphRAGをやってみた記事