SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年7月15日の週に気になった記事などまとめ

www.microsoft.com

  • AI Searchのセマンティック検索を紹介した記事

Data Flywheels for LLM Applications

www.sh-reya.com

  • LLMの評価セットと評価基準をどのように育てるかを説明した記事

ローカルLLMでGraphRAGを実装して「クリスマスキャロル」を分析してみた

hamaruki.com

SpreadsheetLLM: Encoding Spreadsheets for Large Language Models

arxiv.org

  • 大量のスプレッドシートデータをLLMに入力する際にトークン長の問題を解決する方法を提案する論文
  • スプレッドシート中の必要な箇所を選択するステップと必要な箇所のデータを入力し、回答の数式を生成するステップに分かれる

検索エンジンのBM25-rankを試す

ayousanz.hatenadiary.jp

プロンプト生成プロンプトの作り方:Create a meta-prompt that generates system prompts for [specific purpose or domain].

note.com

  • ドメインの特定の目的に対応させるメタプロンプトを生成する方法を紹介した記事

ローカルLLMでGraphRAGを動かしてみた

zenn.dev

  • GraphRAG Local with Interactive UIを使って、GraphRAGを実現する方法を書いた記事

Weekly AI Agents News!

speakerdeck.com

  • ProductAgent
    • ECにおいてユーザーの曖昧なクエリに関する確認質問をおこなうことで、より正確な商品検索を実現する
    • arxiv.org
  • LLM-Based Open-Domain Integrated Task and Knowledge Assistants with Programmable Policies
    • タスク指向対話エージェントは、ユーザーのリクエストを理解し、会話を誘導し関連情報を提供する
    • 従来のダイアログツリーによる会話のレールからはみ出せない限界を克服する手法を提案
    • arxiv.org

なぜ無名のエンジニアは都知事選で15万票獲得できたのか【御礼と振り返り】

note.com

生成AI時代のプロダクトをPMはどう思考すべきか?

note.com

  • 生成AIを使うと、ルール化されていない柔らかい条件分岐も今までと比べ物にならないくらい簡単に再現できる
    • 思考フローもプロダクトに落とし込むことができる

<社員インタビュー Vol.3> なぜKaggle Grandmaster 荒居は自動運転 × 生成AIというフィールド選んだのか

tur.ing

SNS研究者から見た都知事選〜ここがすごいよTTTC〜 #安野たかひろ

note.com

Microsoft Build Japan 2024 オンデマンド配信

www.youtube.com

RTX4090で最近の日本語ローカルLLMたちを動かしてみた

zenn.dev

「本を読んでも身に付かない」はどう解消する? 七つの“読書術”を岩瀬義昌が伝授

type.jp

  • 記憶に定着させるためには反復作業が不可欠
  • 要点だけを振り返りできるように本を読みながらメモを取る
  • 振り返る習慣をわすれないことが大事
  • 読んだ本について、自分の言葉で発信する

医療・ヘルスケア領域における大規模言語モデルの構築に向けて

tech.preferred.jp

  • 継続事前学習をQLoRAで行った
    • A1002台のみで実現した

コード生成を伴う LLM エージェント

speakerdeck.com

  • エージェント活用の第一歩はドメインエキスパートのAI活用
  • 簡単たタスク設定ではコードを伴うプロンプト手法は実用的
  • 目的が限定されるタスクはAgentlessで十分な場合がある

AIエージェントを現場に導入する目線とは

speakerdeck.com

「つくりながら学ぶ!生成AIアプリ&エージェント開発入門」を出版しました

zenn.dev

GPT-4o mini: advancing cost-efficient intelligence

GPT-4o mini: advancing cost-efficient intelligence | OpenAI

  • OpenAIがGPT-4o miniを発表した
  • GPT-3.5 Turboよりも60%以上安価
  • コンテキストウィンドウは128K
  • 最大出力トークンは16K
  • 画像の入力にも対応
  • 日本語への翻訳記事

mistralai/Mistral-Nemo-Base-2407

huggingface.co

  • Mistralから日本語にも対応したモデルが公開された

選挙でGitHubを使うことに意味はあったのか?――GitHubを用いた政策リポジトリの公開について振り返る

note.com

【生成AI】知らないと後悔する、GPT-4oだけでシステム開発を300%効率化するハック【CodeAGI】

qiita.com

第5回 生成AIのトレンドは「低価格化、高速化、多様化」 ――ちょっとだけマニアックなAIの話

bcg-jp.com

AIエージェントのイベントで「コード生成を伴うLLMエージェント」について登壇しました

tech.algomatic.jp

コスパ最強!OpenAIの最新モデルGPT4o-miniがどんな感じか解説してみた

www.youtube.com

PFEの開発したLLMのPLaMo-100Bを用いた金融ベンチマーク評価と結果の分析

tech.preferred.jp

[07/13~07/19] 生成AI Weekly News #46|GPT-4o mini をピックアップ

note.com

シュッと gpt-4o-mini

note.com

  • Python SDKがまたGPT-4o miniに対応してない

ヘルプデスクの事例で学ぶAIエージェント

speakerdeck.com

  • AIエージェントの業務に依存する部分をチューニングすることで、業務特化にできる
  • プランニングでは、どのツールを使って何を得たいかを生成させる
    • Reflectionしやすいように
  • 複数の検索インデックスは用途ごとにそれぞれ関数にする

AWS IAMのアンチパターン/AWSが考える最低権限実現へのアプローチ概略

speakerdeck.com

Gemini のロングコンテキストの使い方

note.com

  • コンテキストキャッシュを使うことでコスト最適化できる

異次元の高効率モデル「GPT-4o mini」の登場と3.5 Turboは永遠の別れ

www.youtube.com

GraphRAG Local with Interactive UI

github.com

実務において回帰分析を行うに当たっての注意点を改めて挙げてみる

tjo.hatenablog.com

Announcing Custom Categories Public Preview in Azure AI Content Safety

techcommunity.microsoft.com

  • Azure AIコンテンツセーフティにカスタムカテゴリ機能が追加された
    • 機密コンテンツの検出、ユーザー生成コンテンツのモデレート、地域の規制への準拠など独自にカスタマイズされた分類子を作成できる
    • 標準でカスタムカテゴリをトレーニングするために50行の自然言語のサンプルが必要

Tracing LangChain Code on Azure with OpenTelemetry and Application Insights

techcommunity.microsoft.com

  • OpenTelemetryとApplication Insightsを用いて、AzureでLangchainコードをトレースする方法を説明した記事