SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年8月19日の週に気になった記事などまとめ

EfficientRAG: Efficient Retriever for Multi-Hop Question Answering

arxiv.org

  • LLMを利用せずに新しいクエリを生成し、不要な情報をフィルタリングすることで効率的な検索を実現する「EfficientRAG」を提案する論文
  • EfficientRAGは「ラベラー」と「フィルター」という2つの軽量コンポーネントから構成される

RAGChecker: A Fine-grained Framework for Diagnosing Retrieval-Augmented Generation

arxiv.org

  • RAGシステムの評価フレームワークを提案する論文
  • 検索モジュールと生成モジュールの両方に診断メトリックを組み込んだ

新しいStable Diffusion WebUI ForgeでFLUX.1を試す(Windows

note.com

Training Language Models on the Knowledge Graph: Insights on Hallucinations and Their Detectability

arxiv.org

  • 言語モデルのスケールがハルシネーションに与える影響を確認した論文
  • ナレッジグラフを用いて、言語モデルをトレーニングし、規模ごとにデータをどの程度再現できるかを確認した

“2万単語”を一発生成する言語AI「LongWriter」、論文執筆や査読など科学研究全般を自動化する「The AI Scientist」など生成AI技術5つを解説(生成AIウィークリー)

www.techno-edge.net

子ども向け生成AIワークショップ @ こども科学博2024

note.com

Google Colab で LongWriter を試す

note.com

【E2E連載企画 第4回】End-to-End自動運転のための三次元物体検出モデルの開発

zenn.dev

RAGの回答を自動評価する手法(LINEヤフーのSeekAIでの事例)

techblog.lycorp.co.jp

今さら聞けない生成AI・LLM・ChatGPT - 使いこなすためのポイント

news.mynavi.jp

フルリモート第1号の自分が、働く上で大切にしている5つのこと

tech.findy.co.jp

Automated Design of Agentic Systems

github.com

  • エージェントが自身で強力なエージェントシステムを設計するプログラムのリポジトリ

Google Colab で EZO-InternVL2-26B を試す

note.com

AI Agents That Matter

arxiv.org

  • AIエージェントの現行ベンチマークの問題点を指摘し、新たな評価手法を提案する論文
  • コスト面の考慮やベンチマークへの過度な適用への対策が必要なことなどが述べられている

LLMを用いてブログ記事の文法間違い・誤字脱字検出を自動化する

zenn.dev

Azure AI Document Intelligence now previewing field extraction with Generative AI and more

techcommunity.microsoft.com

  • Document Intelligenceに生成AIを活用した文書フィールドの抽出既往が追加された
  • 文書の分析結果を検索可能なPDFとして出力できるようになった
  • レイアウトAPIで特定の図を取得する機能が追加された

可読性の高いコードを書くための実践ガイド

qiita.com

RAGを専門用語に強くする手法「Golden-Retriever」

zenn.dev

LLMのRAGアプリケーションにおけるオブザーバビリティを向上するツール「Phoenix」の紹介

tech.assured.jp

LLMプロダクト開発のことはじめ #03 ~ プロンプトエンジニアリング

tech.algomatic.jp

1兆 (1T) パラメータ規模のLLMの事前学習検証

tech.preferred.jp

データ基盤の負債を生まない技術と技術以外の話

speakerdeck.com

OpenAI Chat Completion、Gemini、ClaudeのSDKインターフェースを揃えようとしてハマった

tech-blog.abeja.asia

【APIM ❤️ OpenAI】Azure API ManagementとAzure OpenAIを組み合わせて効率的な運用を実現する

zenn.dev

話題のGraphRAGとは - 内部構造の解析と実用性の考察

www.alpha.co.jp

phi 3.5がリリースされた

huggingface.co

huggingface.co

huggingface.co

GPT-4o のファインチューニング

note.com

GPT-4o-miniのファインチューニングのすゝめ

zenn.dev

AWSで生成AIエージェントを操る! 話題のLangGraphにBedrockで入門しよう

qiita.com

OpenAIのStructured Outputsを試してみた ~LLMを活用した機械学習モデルのアノテーション効率化を目指して~

speakerdeck.com

旅行業のDXから新サービス創出まで: 令和トラベルのDify活用戦略と挑戦

docswell.com

「日本の判例HTMLデータ」提供開始のお知らせ

www.nii.ac.jp

Claude最新機能!Prompt Cache機能について解説してみた

www.youtube.com

Google Colab で Phi-3.5-mini-instruct を試す

note.com

松尾豊の弟子・今井翔太が語る「理系人材の終焉」で問われる能力

type.jp

AIと著作権について

www.bunka.go.jp

www.youtube.com

ChatGPT Enterpriseを社内推進!OpenAI Japan社を招いてセッションを開催しました!

note.com

Gemini API によるドキュメント処理機能の詳細

ai.google.dev

  • Geminiで1,000ページまたは2GBのPDFをアップロード可能となった

Welcome to Anthropic's Prompt Engineering Interactive Tutorial

github.com

Speculative RAG: Enhancing retrieval augmented generation through drafting

research.google

  • 小型モデルが下書きを作成し、大型モデルが検証するRAGシステムの提案

Run your AI inference applications on Cloud Run with NVIDIA GPUs

cloud.google.com

  • Cloud RunでL4 GPUをサポートするようになり、最大9Bのパラメータのモデルをサーバーレスで利用できる
  • コールドスタート時間はモデルによるが11~35秒ぐらい

組織横断支援チームによるFour Keys計測基盤の構築と活用に向けた取り組み / サイボウズ株式会社開発本部 三村 遼

www.youtube.com

LLMアプリケーション開発者目線での新しいLLMモデルが出たときの検証と運用

zenn.dev

企業で生成AIを導入するための施策と生成AI全社研修の全体設計を公開します

note.com

Sakana AIの「AI科学者」の読解メモ

note.com

LlamaIndex 0.11 の概要

note.com

ColPali: Efficient Document Retrieval with Vision Language Models

arxiv.org

  • 視覚情報が豊富なドキュメントのリトリーバルを評価するベンチマークを導入した
  • VLMをベースにした新しい文書検索モデルを提案した

Discover the New Multi-Lingual, High-Quality Phi-3.5 SLMs

techcommunity.microsoft.com

  • Microsoftが新たに発表したPhi-3.5シリーズを紹介する記事

Phi-3 Cookbook: Hands-On Examples with Microsoft's Phi-3 Models

github.com

  • Phi-3のクックブック

GPTCacheでのLLMのレスポンスキャッシュを試してみる

zenn.dev

「対話知能学 旅行代理店タスク対話コーパス(Tabidachi)」提供開始のお知らせ

www.nii.ac.jp

streamlitでLangGraphによる自己修正RAGを実装してみよう!

zenn.dev

Polars を Kaggle コンペで使ってみた(LMSYS Chatbot Arena)

speakerdeck.com