A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks
arxiv.org
- 様々なNLPタスクへのプロンプトエンジニアリングの方法をまとめた論文
Vortex under Ripplet: An Empirical Study of RAG-enabled Applications
web3.arxiv.org
- 100個のRAGアプリケーションを調査し、19個の欠陥パターンに一般化し、それらに対するガイドラインを提案する論文
LLM Evaluation doesn't need to be complicated
www.philschmid.de
- LLMアプリケーション用の簡略化された評価ワークフローをセットアップする方法を学ぶ記事
深津式プロンプトを超える、ロング コンテキスト時代のテクニック指南
note.com
- ロング コンテキストはビジネスデータの分析、対話履歴の分析、コード生成など、幅広い活用が可能
Exploring the Advanced RAG (Retrieval Augmented Generation) Service
techcommunity.microsoft.com
- RAGの様々なインデックス作成方法を試すことができるリポジトリが公開された
Build Powerful RAG Apps Without Code Using LangFlow and Azure OpenAI
techcommunity.microsoft.com
- LangFlowで簡単にRAGアプリを構築する方法を示した記事
実務におけるRAG 〜学びと現場のノウハウ〜
www.docswell.com
- 回答のヒット率が上がると業務開演もされるという循環の構築と計測が大事
- 同義語辞書を作成し、全文検索で活用する
github.com
- BedrockでArtifactsを試せるリポジトリ
RAGで複数のLLMを使う「Speculative RAG」の解説
zenn.dev
- 複数の言語モデルで回答生成と最良の回答を選別する手法
- RAGで取得したドキュメント群を関連度が近い複数のクラスタに分け、各クラスタからランダムにドキュメントを取得し、小さい言語モデルに回答生成させる
- 複数の回答を大きいLLMが評価し、最良の回答を選択
iOSで生成AIを扱う方法のまとめ
www.docswell.com
- llama.cppのSwift PackageでローカルLLMを動かす
LLMのシステム導入時に行いたい動作検証について
tech.algomatic.jp
エンジニアの生存戦略 〜クラウド潮流の経験から紐解く技術トレンドのメカニズムと乗りこなし方〜
speakerdeck.com
- 人は「重要にみえるもの」を選びがち
- 「重要なもの」は使って判断する
- 「重要なもの」を選んだとしてもコンセプトを理解していないと役に立たない
Llama-3.1 の概要
note.com
Introducing Rerank 3 Nimble: Faster Reranking for Enterprise Search & Retrieval-Augmented Generation (RAG) Systems
cohere.com
- Cohere Rerankモデルシリーズの最新の基盤モデルRerank 3 Nimbleが発表された
- 高い精度のまま、Rerank3よりも約3倍高速
The Llama 3 Herd of Models
ai.meta.com
RAGの精度向上! CohereからRerank 3 Nimbleが登場。SageMakerでリランク試してみよう
qiita.com
- AWS MarketplaceでCohere Rerank3 Nimbleを利用した記事
面倒な分析はGoogle Colabにやらせよう
zenn.dev
- Geminiに指示してコードを生成することもできる
Mistral Large 2 の概要
note.com
- 日本語にも対応している
- Function Callingの機能を持つ
GPT-4o超えのオープンモデル「llama 3.1」を解説&ローカルで使ってみた
www.youtube.com
Microsoft、Bing検索結果のメインを生成AIによる回答に(従来の検索結果は脇に)
www.itmedia.co.jp
- 検索結果ページの中央トップにLLMおよび、SLMが生成した回答が表示される
ABEMAにおけるLLMを用いたコンテンツベース推薦システム導入と効果検証
speakerdeck.com
AOAI Dev Day LLMシステム開発 Tips集
speakerdeck.com
- System Promptは構造化・再利用を考慮する
- Prompt Storeを作って複数のエージェントでプロンプトの部品を共有
- LLMは中盤の内容を忘れてしまう傾向があるため、会話履歴の適度な圧縮を行う
- ユーザーの重要なキーワードやRAGで取得した情報を永続化させたい場合は、システムプロンプトに入れる
Llama 3の日本語継続事前学習モデル「Llama 3 Youko」シリーズを公開
rinna.co.jp
LLMでできる!使える!生成AIエージェント
speakerdeck.com
- AIエージェントは、自分でやることを考えて、様々なツールを活用して目標に向かってタスクをこなしていくAIの仕組み
- 知覚のためのツール群、出力のためのツール群を整備することが大事
「AWS Cloud Quest 生成AI 日本語版」の概要と感想:AWSの生成AI/LLM関連サービスをまとめてハンズオン・トレーニング
zenn.dev
生成AI時代のソフトウェアエンジニアが持つべきケイパビリティを考える
speakerdeck.com
- プロンプトの抽象化および変更容易性を担保する必要がある
- プロンプトをルール、パラメータ、テクニックに分類する
- 思考過程をプロンプトに落とし込むことで望ましいアウトプットを得ることができる
- ドメインエキスパートの思考過程を適切な粒度の課題に分解する必要がある
- 思考以外にやることは柔軟にシステム化する必要がある
- LLMの失敗ケースを修正するために、指標を適切に設定・モニタリングした上で改善していく
JMED-LLM: 日本語医療LLM評価データセットの公開
speakerdeck.com
AOAI Dev Day - Opening Session
speakerdeck.com
RAGのサービスをリリースして1年3ヶ月が経ちました
speakerdeck.com
- 条件不足時の聞き返しで適切な条件追加を促し再検索後のページ到達率があがった
- FAQやガイドラインの追加は比較的実施しやすくRAGの精度を大きく上げられる
- 検索のUIのほうが利用者の期待値を調整しやすい
Failure Analysis Assistant – AIOps で障害分析を効率化してみよう –
aws.amazon.com
20240725 LLMによるDXのビジョンと、今何からやるべきか
speakerdeck.com
- 人間による確認を挟めるならば、既存のやり方いかにLLMの利用のリスクを抑えることができる
- かなり細かくやり方を指示・タスク分割しないと精度が出ない
- マニュアル化できる業務からQuick Winを作る
LLM experimentation at scale using Amazon SageMaker Pipelines and MLflow
aws.amazon.com
- SageMaker PipelinesとML flowを用いて、LLMのファインチューニングと評価の実験を大規模に実行する方法
Promptyでプロンプトセントリックな生成AIアプリ開発をしよう
zenn.dev
- プロンプトと関連パラメーターをアプリケーションの開発ライフサイクルのエンドツーエンドで一元的に管理するためのもの
- プロンプトに変数を定義できる
- モデルの設定は環境変数から設定することもできる
- Langchain、Semantic Kernel、Prompt Flowに組み込むことができる
LLM for 時系列分析の世界
zenn.dev
Introducing Rerank 3 on Microsoft Azure AI
cohere.com
- Azure AI StudioでCohereのrenrak3を利用できるようになった
Gemini 1.5 のロングコンテキストを活かして AI を育てるアプローチ 〜 RAG の限界を軽やかに突破するために
zenn.dev
ollama.com
- Ollamaで以下のモデルを利用する場合にTool Callingに対応した
- Llama 3.1
- Mistral Nemo
- Firefunction v2
- Command-R +
2024年版のDockerfileの考え方&書き方
future-architect.github.io
- ソースファイルをそのものを実行環境で使う場合以外は、RUNコマンドのbindマウントでも対応できるようになった
BigQueryとGemini 1.5 Proによるラーメン店クチコミの定量分析
blog.g-gen.co.jp
Announcing Deploy To Teams from Azure OpenAI Studio
techcommunity.microsoft.com
- Azure OpenAI StudioからTeamsアプリへのデプロイ機能が追加された
独自の生成AI環境構築ができる Copilot Studio & Azure AI Studio
speakerdeck.com
[Azure OpenAI Service Dev Day]参加レポート・登壇資料まとめ
zenn.dev
Microsoft Loop を布教する会に参加してみた
zenn.dev
- Vote機能がある
- OneNoteは個人の生産性と情報の整理に重点が置かれている
- Loopは複数メンバー間での共同作業やリアルタイムのコラボレーションに重点が置かれている
ブラウザ完結型のチュートリアルを手軽に作れるツールキットが出たので触ってみる
qiita.com
完全に理解した!生成AI自社プロダクトのアジャイル開発の進め方!
speakerdeck.com
- まず動くものをラフに作る
- コードを書かなくても、AOAIのプレイグラウンドなどを活用する
- トレードオフ要素を優先順位に並び替えた
- 納期
- スコープ
- コスト
- 品質
- UI/UX
- セキュリティ
- 回答の精度
データ可視化をやりたくて北海道におひっこし
speakerdeck.com
開発生産性 Conference 2024 で登壇してきました。
kaminashi-developer.hatenablog.jp