SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年7月22日の週に気になった記事などまとめ

A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks

arxiv.org

  • 様々なNLPタスクへのプロンプトエンジニアリングの方法をまとめた論文

Vortex under Ripplet: An Empirical Study of RAG-enabled Applications

web3.arxiv.org

  • 100個のRAGアプリケーションを調査し、19個の欠陥パターンに一般化し、それらに対するガイドラインを提案する論文

LLM Evaluation doesn't need to be complicated

www.philschmid.de

  • LLMアプリケーション用の簡略化された評価ワークフローをセットアップする方法を学ぶ記事

深津式プロンプトを超える、ロング コンテキスト時代のテクニック指南

note.com

  • ロング コンテキストはビジネスデータの分析、対話履歴の分析、コード生成など、幅広い活用が可能

Exploring the Advanced RAG (Retrieval Augmented Generation) Service

techcommunity.microsoft.com

  • RAGの様々なインデックス作成方法を試すことができるリポジトリが公開された

Build Powerful RAG Apps Without Code Using LangFlow and Azure OpenAI

techcommunity.microsoft.com

  • LangFlowで簡単にRAGアプリを構築する方法を示した記事

実務におけるRAG 〜学びと現場のノウハウ〜

www.docswell.com

  • 回答のヒット率が上がると業務開演もされるという循環の構築と計測が大事
  • 同義語辞書を作成し、全文検索で活用する

Artifacts and Tools for Bedrock

github.com

RAGで複数のLLMを使う「Speculative RAG」の解説

zenn.dev

  • 複数の言語モデルで回答生成と最良の回答を選別する手法
  • RAGで取得したドキュメント群を関連度が近い複数のクラスタに分け、各クラスタからランダムにドキュメントを取得し、小さい言語モデルに回答生成させる
  • 複数の回答を大きいLLMが評価し、最良の回答を選択

iOSで生成AIを扱う方法のまとめ

www.docswell.com

  • llama.cppのSwift PackageでローカルLLMを動かす

LLMのシステム導入時に行いたい動作検証について

tech.algomatic.jp

エンジニアの生存戦略 〜クラウド潮流の経験から紐解く技術トレンドのメカニズムと乗りこなし方〜

speakerdeck.com

  • 人は「重要にみえるもの」を選びがち
  • 「重要なもの」は使って判断する
  • 「重要なもの」を選んだとしてもコンセプトを理解していないと役に立たない

Llama-3.1 の概要

note.com

Introducing Rerank 3 Nimble: Faster Reranking for Enterprise Search & Retrieval-Augmented Generation (RAG) Systems

cohere.com

  • Cohere Rerankモデルシリーズの最新の基盤モデルRerank 3 Nimbleが発表された
  • 高い精度のまま、Rerank3よりも約3倍高速

The Llama 3 Herd of Models

ai.meta.com

  • Lllama3を紹介する論文

RAGの精度向上! CohereからRerank 3 Nimbleが登場。SageMakerでリランク試してみよう

qiita.com

  • AWS MarketplaceでCohere Rerank3 Nimbleを利用した記事

面倒な分析はGoogle Colabにやらせよう

zenn.dev

  • Geminiに指示してコードを生成することもできる

Mistral Large 2 の概要

note.com

  • 日本語にも対応している
  • Function Callingの機能を持つ

GPT-4o超えのオープンモデル「llama 3.1」を解説&ローカルで使ってみた

www.youtube.com

Microsoft、Bing検索結果のメインを生成AIによる回答に(従来の検索結果は脇に)

www.itmedia.co.jp

  • 検索結果ページの中央トップにLLMおよび、SLMが生成した回答が表示される

ABEMAにおけるLLMを用いたコンテンツベース推薦システム導入と効果検証

speakerdeck.com

AOAI Dev Day LLMシステム開発 Tips集

speakerdeck.com

  • System Promptは構造化・再利用を考慮する
    • Prompt Storeを作って複数のエージェントでプロンプトの部品を共有
  • LLMは中盤の内容を忘れてしまう傾向があるため、会話履歴の適度な圧縮を行う
  • ユーザーの重要なキーワードやRAGで取得した情報を永続化させたい場合は、システムプロンプトに入れる

Llama 3の日本語継続事前学習モデル「Llama 3 Youko」シリーズを公開

rinna.co.jp

LLMでできる!使える!生成AIエージェント

speakerdeck.com

  • AIエージェントは、自分でやることを考えて、様々なツールを活用して目標に向かってタスクをこなしていくAIの仕組み
  • 知覚のためのツール群、出力のためのツール群を整備することが大事

AWS Cloud Quest 生成AI 日本語版」の概要と感想:AWSの生成AI/LLM関連サービスをまとめてハンズオン・トレーニン

zenn.dev

生成AI時代のソフトウェアエンジニアが持つべきケイパビリティを考える

speakerdeck.com

  • プロンプトの抽象化および変更容易性を担保する必要がある
    • プロンプトをルール、パラメータ、テクニックに分類する
  • 思考過程をプロンプトに落とし込むことで望ましいアウトプットを得ることができる
  • ドメインエキスパートの思考過程を適切な粒度の課題に分解する必要がある
  • 思考以外にやることは柔軟にシステム化する必要がある
  • LLMの失敗ケースを修正するために、指標を適切に設定・モニタリングした上で改善していく

JMED-LLM: 日本語医療LLM評価データセットの公開

speakerdeck.com

AOAI Dev Day - Opening Session

speakerdeck.com

RAGのサービスをリリースして1年3ヶ月が経ちました

speakerdeck.com

  • 条件不足時の聞き返しで適切な条件追加を促し再検索後のページ到達率があがった
  • FAQやガイドラインの追加は比較的実施しやすくRAGの精度を大きく上げられる
  • 検索のUIのほうが利用者の期待値を調整しやすい

Failure Analysis Assistant – AIOps で障害分析を効率化してみよう –

aws.amazon.com

20240725 LLMによるDXのビジョンと、今何からやるべきか

speakerdeck.com

  • 人間による確認を挟めるならば、既存のやり方いかにLLMの利用のリスクを抑えることができる
  • かなり細かくやり方を指示・タスク分割しないと精度が出ない
  • マニュアル化できる業務からQuick Winを作る

LLM experimentation at scale using Amazon SageMaker Pipelines and MLflow

aws.amazon.com

  • SageMaker PipelinesとML flowを用いて、LLMのファインチューニングと評価の実験を大規模に実行する方法

Promptyでプロンプトセントリックな生成AIアプリ開発をしよう

zenn.dev

  • プロンプトと関連パラメーターをアプリケーションの開発ライフサイクルのエンドツーエンドで一元的に管理するためのもの
  • プロンプトに変数を定義できる
  • モデルの設定は環境変数から設定することもできる
  • Langchain、Semantic Kernel、Prompt Flowに組み込むことができる

LLM for 時系列分析の世界

zenn.dev

Introducing Rerank 3 on Microsoft Azure AI

cohere.com

  • Azure AI StudioでCohereのrenrak3を利用できるようになった

Gemini 1.5 のロングコンテキストを活かして AI を育てるアプローチ 〜 RAG の限界を軽やかに突破するために

zenn.dev

Tool support

ollama.com

  • Ollamaで以下のモデルを利用する場合にTool Callingに対応した
    • Llama 3.1
    • Mistral Nemo
    • Firefunction v2
    • Command-R +

2024年版のDockerfileの考え方&書き方

future-architect.github.io

  • ソースファイルをそのものを実行環境で使う場合以外は、RUNコマンドのbindマウントでも対応できるようになった

BigQueryとGemini 1.5 Proによるラーメン店クチコミの定量分析

blog.g-gen.co.jp

Announcing Deploy To Teams from Azure OpenAI Studio

techcommunity.microsoft.com

  • Azure OpenAI StudioからTeamsアプリへのデプロイ機能が追加された

独自の生成AI環境構築ができる Copilot Studio & Azure AI Studio

speakerdeck.com

[Azure OpenAI Service Dev Day]参加レポート・登壇資料まとめ

zenn.dev

Microsoft Loop を布教する会に参加してみた

zenn.dev

  • Vote機能がある
  • OneNoteは個人の生産性と情報の整理に重点が置かれている
  • Loopは複数メンバー間での共同作業やリアルタイムのコラボレーションに重点が置かれている

ブラウザ完結型のチュートリアルを手軽に作れるツールキットが出たので触ってみる

qiita.com

完全に理解した!生成AI自社プロダクトのアジャイル開発の進め方!

speakerdeck.com

  • まず動くものをラフに作る
    • コードを書かなくても、AOAIのプレイグラウンドなどを活用する
  • トレードオフ要素を優先順位に並び替えた
    • 納期
    • スコープ
    • コスト
    • 品質
    • UI/UX
    • セキュリティ
    • 回答の精度

データ可視化をやりたくて北海道におひっこし

speakerdeck.com

開発生産性 Conference 2024 で登壇してきました。

kaminashi-developer.hatenablog.jp