SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023年11月20日の週に気になった記事などまとめ

Amazon OpenSearch ServiceとBedrockを組み合わせてRAGを作る(LangChainいらず)

qiita.com

  • OpenSearchのRAG機能でドキュメント登録時に自動でベクトル情報を保存することができる
  • 検索時は質問を自動的にベクトル化し、類似ドキュメントを検索することができる

検索付き LLM 手法 REPLUG の再現実験

tech.preferred.jp

  • RAGのREPLUGの再現に取り組んだ記事
  • REPLUGはRetriever 側に追加学習を施すことも可能

生成AI活用により9万6,000時間/月、 国内パートナー数の10%にあたる600人月相当の業務時間を創出 ~「AI活用No.1企業グループ」に向けて調査を実施~

www.gmo.jp

自分の文章がAIに学習されているか調べるツール 米国チームが開発

www.itmedia.co.jp

  • 検出手法として「MIN-K% PROB」というアプローチが提案された
    • モデルが未知のテキストを処理する際、低い確率で出現する単語(外れ値)が含まれる傾向があるが、既知のテキストではそうした単語が含まれることは少ないと仮定して判断する
    • MIN-K% PROBはこれらの予期せぬトークンの平均確率を計算し、モデルが特定のテキストを知っているかどうかを推測する

FAQ検索におけるベクトルベースのRetrieverの比較

www.ai-shift.co.jp

  • 以下の手法を比較している
    • OpenAI Ada
    • Japanese SimCSE
    • TF-IDF
  • 各手法で問い合わせをベクトル化し、同じくベクトル化したFAQとのcos類似度を計算し、正しい解答となるFAQを予測し検証した

Copilot Studioの現時点での機能を一通り触って試してみた。

michikusa.tech

Introducing Claude 2.1

www.anthropic.com

  • 200Kのコンテキストウィンドウを持つClaude2.1がリリースされた
  • 幻覚が2倍減少した
  • ツールを使用できるようになった

Stable Video Diffusion のご紹介

ja.stability.ai

  • 研究用途にしか利用できない

LangChainとフルサーバーレスですばやくセキュアなRAGアプリをつくるための実践解説

speakerdeck.com

Awesome LLMs Evaluation Papers

github.com

Google ColabでStreamlitを動かす方法

note.com

【令和最新版】何もわからない人向けのローカル LLM 入門

zenn.dev

  • text generation webui を使って環境構築し、ローカルLLMで推論する方法を紹介した記事

LangChainを使ってHyDEによるクエリ変換の効果を検証する

hironsan.hatenablog.com

  • HyDEとは入力されたクエリに対して仮の文書を生成し、その文書を埋め込み、検索に使用する手法
  • LangChainの場合は、RePhraseQueryRetrieverを使う

誰でもわかる強化学習

speakerdeck.com

Work Trend Index スペシャルレポート Copilot の初期ユーザーから学ぶ、生成 AI の職場での可能性

news.microsoft.com

  • Copilot の初期ユーザーへのアンケートと実験を組み合わせた調査を実施し、どの程度業務が効率化された紹介した記事

Microsoftの研究者ら、比較的小さなサイズでもタスクによってはOpenAIのGPT-4を凌駕する言語モデル『Orca2』を開発

aiboom.net

  • 『Orca2』は、OpenAIのGPT-4などの大規模言語モデル(LLM)に匹敵し、時には凌駕する性能を発揮する

LLM時代の強化学習

horomary.hatenablog.com

  • 強化学習へのLLM活用アプローチに関する研究動向を調査した記事

ChatGPT for Developer - 超入門

speakerdeck.com

  • ChatGPTとGitHub Copilotの機能概要を説明する資料