SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年7月15日の週に気になった記事などまとめ

気になったものまとめ

The science behind semantic search: How AI from Bing is powering Azure Cognitive Search
Data Flywheels for LLM Applications
ローカルLLMでGraphRAGを実装して「クリスマスキャロル」を分析してみた
SpreadsheetLLM: Encoding Spreadsheets for Large Language Models
検索エンジンのBM25-rankを試す
プロンプト生成プロンプトの作り方：Create a meta-prompt that generates system prompts for [specific purpose or domain].
ローカルLLMでGraphRAGを動かしてみた
Weekly AI Agents News!
なぜ無名のエンジニアは都知事選で15万票獲得できたのか【御礼と振り返り】
生成AI時代のプロダクトをPMはどう思考すべきか？
<社員インタビュー Vol.3> なぜKaggle Grandmaster 荒居は自動運転 × 生成AIというフィールド選んだのか
SNS研究者から見た都知事選〜ここがすごいよTTTC〜 #安野たかひろ
Microsoft Build Japan 2024 オンデマンド配信
RTX4090で最近の日本語ローカルLLMたちを動かしてみた
「本を読んでも身に付かない」はどう解消する？七つの“読書術”を岩瀬義昌が伝授
医療・ヘルスケア領域における大規模言語モデルの構築に向けて
コード生成を伴う LLM エージェント
AIエージェントを現場に導入する目線とは
「つくりながら学ぶ！生成AIアプリ＆エージェント開発入門」を出版しました
GPT-4o mini: advancing cost-efficient intelligence
mistralai/Mistral-Nemo-Base-2407
選挙でGitHubを使うことに意味はあったのか？――GitHubを用いた政策リポジトリの公開について振り返る
【生成AI】知らないと後悔する、GPT-4oだけでシステム開発を300%効率化するハック【CodeAGI】
第5回　生成AIのトレンドは「低価格化、高速化、多様化」 ――ちょっとだけマニアックなAIの話
AIエージェントのイベントで「コード生成を伴うLLMエージェント」について登壇しました
コスパ最強！OpenAIの最新モデルGPT4o-miniがどんな感じか解説してみた
PFEの開発したLLMのPLaMo-100Bを用いた金融ベンチマーク評価と結果の分析
[07/13~07/19] 生成AI Weekly News #46｜GPT-4o mini をピックアップ
シュッと gpt-4o-mini
ヘルプデスクの事例で学ぶAIエージェント
AWS IAMのアンチパターン/AWSが考える最低権限実現へのアプローチ概略
Gemini のロングコンテキストの使い方
異次元の高効率モデル「GPT-4o mini」の登場と3.5 Turboは永遠の別れ
- GraphRAG Local with Interactive UI
実務において回帰分析を行うに当たっての注意点を改めて挙げてみる
Announcing Custom Categories Public Preview in Azure AI Content Safety
Tracing LangChain Code on Azure with OpenTelemetry and Application Insights

The science behind semantic search: How AI from Bing is powering Azure Cognitive Search

www.microsoft.com

AI Searchのセマンティック検索を紹介した記事

Data Flywheels for LLM Applications

www.sh-reya.com

LLMの評価セットと評価基準をどのように育てるかを説明した記事

ローカルLLMでGraphRAGを実装して「クリスマスキャロル」を分析してみた

SpreadsheetLLM: Encoding Spreadsheets for Large Language Models

大量のスプレッドシートデータをLLMに入力する際にトークン長の問題を解決する方法を提案する論文
スプレッドシート中の必要な箇所を選択するステップと必要な箇所のデータを入力し、回答の数式を生成するステップに分かれる

検索エンジンのBM25-rankを試す

ayousanz.hatenadiary.jp

プロンプト生成プロンプトの作り方：Create a meta-prompt that generates system prompts for [specific purpose or domain].

ドメインの特定の目的に対応させるメタプロンプトを生成する方法を紹介した記事

ローカルLLMでGraphRAGを動かしてみた

GraphRAG Local with Interactive UIを使って、GraphRAGを実現する方法を書いた記事

Weekly AI Agents News!

speakerdeck.com

ProductAgent
- ECにおいてユーザーの曖昧なクエリに関する確認質問をおこなうことで、より正確な商品検索を実現する
- arxiv.org
LLM-Based Open-Domain Integrated Task and Knowledge Assistants with Programmable Policies
- タスク指向対話エージェントは、ユーザーのリクエストを理解し、会話を誘導し関連情報を提供する
- 従来のダイアログツリーによる会話のレールからはみ出せない限界を克服する手法を提案
- arxiv.org

なぜ無名のエンジニアは都知事選で15万票獲得できたのか【御礼と振り返り】

生成AI時代のプロダクトをPMはどう思考すべきか？

生成AIを使うと、ルール化されていない柔らかい条件分岐も今までと比べ物にならないくらい簡単に再現できる
- 思考フローもプロダクトに落とし込むことができる

<社員インタビュー Vol.3> なぜKaggle Grandmaster 荒居は自動運転 × 生成AIというフィールド選んだのか

SNS研究者から見た都知事選〜ここがすごいよTTTC〜 #安野たかひろ

Microsoft Build Japan 2024 オンデマンド配信

www.youtube.com

RTX4090で最近の日本語ローカルLLMたちを動かしてみた

「本を読んでも身に付かない」はどう解消する？七つの“読書術”を岩瀬義昌が伝授

記憶に定着させるためには反復作業が不可欠
要点だけを振り返りできるように本を読みながらメモを取る
振り返る習慣をわすれないことが大事
読んだ本について、自分の言葉で発信する

医療・ヘルスケア領域における大規模言語モデルの構築に向けて

tech.preferred.jp

継続事前学習をQLoRAで行った
- A1002台のみで実現した

コード生成を伴う LLM エージェント

speakerdeck.com

エージェント活用の第一歩はドメインエキスパートのAI活用
簡単たタスク設定ではコードを伴うプロンプト手法は実用的
目的が限定されるタスクはAgentlessで十分な場合がある

AIエージェントを現場に導入する目線とは

speakerdeck.com

「つくりながら学ぶ！生成AIアプリ＆エージェント開発入門」を出版しました

GPT-4o mini: advancing cost-efficient intelligence

GPT-4o mini: advancing cost-efficient intelligence | OpenAI

OpenAIがGPT-4o miniを発表した
GPT-3.5 Turboよりも60%以上安価
コンテキストウィンドウは128K
最大出力トークンは16K
画像の入力にも対応
日本語への翻訳記事
- note.com

mistralai/Mistral-Nemo-Base-2407

Mistralから日本語にも対応したモデルが公開された

選挙でGitHubを使うことに意味はあったのか？――GitHubを用いた政策リポジトリの公開について振り返る

【生成AI】知らないと後悔する、GPT-4oだけでシステム開発を300%効率化するハック【CodeAGI】

第5回　生成AIのトレンドは「低価格化、高速化、多様化」 ――ちょっとだけマニアックなAIの話

AIエージェントのイベントで「コード生成を伴うLLMエージェント」について登壇しました

tech.algomatic.jp

コスパ最強！OpenAIの最新モデルGPT4o-miniがどんな感じか解説してみた

www.youtube.com

PFEの開発したLLMのPLaMo-100Bを用いた金融ベンチマーク評価と結果の分析

tech.preferred.jp

[07/13~07/19] 生成AI Weekly News #46｜GPT-4o mini をピックアップ

シュッと gpt-4o-mini

Python SDKがまたGPT-4o miniに対応してない

ヘルプデスクの事例で学ぶAIエージェント

speakerdeck.com

AIエージェントの業務に依存する部分をチューニングすることで、業務特化にできる
プランニングでは、どのツールを使って何を得たいかを生成させる
- Reflectionしやすいように
複数の検索インデックスは用途ごとにそれぞれ関数にする

AWS IAMのアンチパターン/AWSが考える最低権限実現へのアプローチ概略

speakerdeck.com

Gemini のロングコンテキストの使い方

コンテキストキャッシュを使うことでコスト最適化できる

異次元の高効率モデル「GPT-4o mini」の登場と3.5 Turboは永遠の別れ

www.youtube.com

GraphRAG Local with Interactive UI

インタラクティブUIを備え、ローカルLLMをサポートするGraghRagのリポジトリ

実務において回帰分析を行うに当たっての注意点を改めて挙げてみる

tjo.hatenablog.com

Announcing Custom Categories Public Preview in Azure AI Content Safety

techcommunity.microsoft.com

Azure AIコンテンツセーフティにカスタムカテゴリ機能が追加された
- 機密コンテンツの検出、ユーザー生成コンテンツのモデレート、地域の規制への準拠など独自にカスタマイズされた分類子を作成できる
- 標準でカスタムカテゴリをトレーニングするために50行の自然言語のサンプルが必要

Tracing LangChain Code on Azure with OpenTelemetry and Application Insights

techcommunity.microsoft.com

OpenTelemetryとApplication Insightsを用いて、AzureでLangchainコードをトレースする方法を説明した記事