SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年9月2日の週に気になった記事などまとめ

ITエンジニアのためのプロンプトエンジニアリング

zenn.dev

  • ITエンジニアに効果的にプロンプトエンジニアリングを活用するためのコツを伝授する記事

Serverless AI Chat with RAG using LangChain.js

github.com

  • LangChain.jsとAzureを利用したサーバーレスのチャットボットのサンプルリポジトリ

AutoGen Studio: A No-Code Developer Tool for Building and Debugging Multi-Agent Systems

arxiv.org

  • AutoGenにノーコードのインターフェースを追加したAutogen Studioを紹介した論文

【最大90%の時間削減】生成AI最前線、 トヨタコネクティッド社のAI効率化事例と全社的生成AI導入戦略の全容

chatgpt-lab.com

  • トヨタコネクティッド株式会社の生成AIの具体的な活用事例などAIへの取り組みを紹介した記事

モダンアプリケーションにおけるユーザー認証・認可の実装のために考慮しておきたいこと

serverless.co.jp

  • サーバーレスアーキテクチャを導入した構成でのユーザー認証認可において考慮しておきたい点をまとめた記事

LangGraph での Human-in-the-loop の実装

github.com speakerdeck.com

  • LangGraphに人間による承認を実装した例

ハイパーパラメータ自動最適化フレームワークOptunaの最新版となるv4.0をリリース

www.preferred.jp

  • OptunaHubが正式に公開された
  • 実験管理機能が強化された
  • 分散最適化機能が強化された

LangChainの現在とv0.3にむけて

speakerdeck.com

  • 単純なエージェントは、AgentExecutorはレガシーであるため、create_react_agentへの移行がおすすめされている。

「ELYZA-japanese-Llama-2-70b」開発における、大規模モデル学習ノウハウの解説

zenn.dev

  • 「ELYZA-japanese-Llama-2-70b」の開発の過程で得られた知見を紹介する記事

GraphRAG Analysis, Part 2: Graph Creation and Retrieval vs Vector Database Retrieval

  • GrapghRAGとFAISSを使ったベクターDBによる検索を比較する記事
  • 正確性が必要なケースではGraphRAGの方が有利な場合がある

オープンソースのRAG UI「kotaemon」を試す

zenn.dev

  • ollamaで動かす方法を紹介した記事
  • GrapghRAGの場合は、モデルがgpt-4-turbo限定となる

基盤モデル時代に言語で音声を処理したい

https://takamichi-lab.github.io/assets/pdf/slide/2024/takamichi24nl-invited.pdf

RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う

zenn.dev

  • RAGシステムを専門用語に強くするための手法「HybridRAG」について日本語で簡単にまとめた記事

LLMに日本語テキストを学習させる意義

speakerdeck.com

  • 日本語資源の学習効果顕著なタスクがあった
    • 日本の知識に関する質も納富
    • 英日機械翻訳
  • 35種類のLLMに日英19件のタスクで評価

101 Gen AI Cheat Sheets

medium.com

Introducing GPT-4o-2024-08-06 API with Structured Outputs on Azure

techcommunity.microsoft.com

  • AzureでGPT-4o-2024-08-06を利用可能になったことを紹介する記事

General availability of Prompt Shields in Azure AI Content Safety and Azure OpenAI Service

techcommunity.microsoft.com

  • Azure AI Content SafetyとPrompt ShieldsがGAになった

Azure OpenAIでStructured Outputsを使う!

zenn.dev

Difyで作る!RAGの精度を向上させるSelf-Routeについて解説してみた

www.youtube.com

Web アプリケーションにおける Amazon ECS / AWS Fargate アーキテクチャデザインパターン

aws.amazon.com

SoftMatcha: A Fast and Soft Pattern Matcher

softmatcha.github.io

  • 単語埋込みを用いて、柔らかい上に高速な単語列マッチングを実現する研究

In Defense of RAG in the Era of Long-Context Language Models

arxiv.org

  • 長いコンテキストを扱う言語モデルでRAG用のコンテキストを入力する際に元のテキストの順序を保持して入力する方法を提案した論文

音声AIエージェントの世界とRetell AI入門

speakerdeck.com

生成AIの二大潮流と自動運転

speakerdeck.com

  • 生成AIではLLMと拡散モデルが二大トレンド
  • 走行データから得られる経験では不十分な場合にWeb助―いるデータからの知識を取り入れる
  • アクションで条件付け可能な未来の動画生成を生成AIで行う

mattshumer/Reflection-Llama-3.1-70B

huggingface.co

  • Glaiveによって生成された合成データでトレーニングされた
  • チャット形式はLlama3.1と同じ

2024年版 運用者たちのLLM

speakerdeck.com

World Models

github.com

  • 世界モデルを持たないLLMにとって難しい質問のリストを記載したリポジトリ

Self-Routeの詳しめな解説【ずんだもん解説】

www.youtube.com

技術ブログや登壇資料を秒で作るコツ伝授します

speakerdeck.com

  • ネタだしと執筆を分離する
  • 冒頭から書き始めない
  • 完成度60%でリリースする

[Azure] Terraform or Bicep を考えてみた

zenn.dev

  • TerraformとBicepのメリット、デメリットを比べた記事
  • Bicepは状態管理がない

カグルとワタシ ~ kaggle GM振り返りポエム ~

qiita.com

DeepSeek-V2.5 を試す

note.com

  • DeepSeek-V2.5 は 236B / Active Parameter 21B の MoE
  • Function CallingやJSON出力もできる

Prompt Cachingは本当に効果的なのか検証してみた

zenn.dev

  • Anthoropic APIのPrompt Cacheingの使い方と実際にコスト削減や応答速度向上にどの程度貢献するかを検証した記事
  • キャッシュの有効期間は5分
    • 5分以内にキャッシュにアクセスがあった場合は、期限は更新される
  • 長いコンテキストを多用するシナリオでは大きな効果が期待できる

はじめに教わるデザインの基本。気をつけるべき28のポイント

liginc.co.jp

Neo4j LLM Knowledge Graph Builderを試す

zenn.dev

  • 非構造化テキストをナレッジグラフに変換するアプリケーション
  • Docker Composeでローカルに環境を構築することもできる

【完全ガイド】生成AI社内推進で終わらせない、組織定着への道筋

newspicks.com

  • 「生成AI社内推進の成功と失敗」のレポート記事

【2024/09/05】【LT大会#8】LLMの活用・機械学習・データ分析関係のいろいろな話題にふれよう【アーカイブ

www.youtube.com

Late Chunking: Balancing Precision and Cost in Long Context Retrieval

weaviate.io

  • 制度とコストのバランスをとったチャンキングの方法を紹介した記事

Building A Generative AI Platform

huyenchip.com

  • 生成AIプラットフォームでシステムの性能を向上させる単に利用できるコンポーネントを紹介する記事

2024年夏: 生成AI普及後のコンテンツの在り方と未来を予想してみる

note.com

OP-RAGの詳しめな解説【ずんだもん解説】

www.youtube.com

LlamaIndex + Amazon Neptune GraphRAG やってみた

qiita.com

  • Amazon Neptune AnalyticsとLlamaIndexを活用してGraphRAGをやってみた記事