2024年9月16日の週に気になった記事などまとめ - SEが最近起こったことを書くブログ

LermoAI
Paper Copilot: A Self-Evolving and Efficient LLM System for Personalized Academic Assistance
What is the Role of Small Models in the LLM Era: A Survey
Advanced RAG Techniques: Elevating Your Retrieval-Augmented Generation Systems
LLM用のデータセットを作ってみる
PdMはどのように全てのスピードを上げられるか　~ 非連続進化のための具体的な取り組み ~
Prompt evaluations
RAGで文書検索の精度を上げるには、複数の埋め込みモデルを使う
約1720億パラメータ（GPT-3級）の大規模言語モデルのフルスクラッチ学習を行い、プレビュー版「LLM-jp-3 172B beta1」を公開
プロンプトエンジニアリングをしよう - 一休.comでの検索システム改善事例
生成AIの二大潮流と自動運転 / チューリング株式会社
ついに出た！OpenAIの最新モデル「o1」って何がすごいの？
LangChain v0.3 の変更点
AIエージェントキャッチアップ #1 - AutoGen / AutoGen Studio
「技術だけで、良いものは作れない」ヒットメーカー糸井重里が半世紀働いて気付いた、熱狂を生むプロダクトに不可欠なもの
o1のAPIで実験してみたが制限きつすぎて辛かった話
LLMによる日本語タイポ修正ベンチマーク
o1モデルのプロンプトエンジニアリングって？
RAGの処理で、リランクとベクトル検索でできることの違いを検証／解説してみる
大規模言語モデル Tanuki-8x8Bの紹介と開発経緯など
【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました！
暇そうに見えるマネージャーとはどういう状態か
【E2E連載企画最終回】：自動運転データセットのためのセンサキャリブレーション技術
【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました！
大規模言語モデルの研究動向の調査：時系列データ分析とData-centric AIの視点から
GitHub Models を使って 20 種類以上の LLM の日本語性能を測定してみた
kotoba-tech/kotoba-whisper-v2.0
OpenAI o1はどんなアカデミック用途に向いているか？
Kurage
GRIN: GRadient-INformed MoE
A replaceable curiosity-driven candidate agent exploration approach for task-oriented dialog policy learning
Pythonで改めて考える「クラス（class）」の使いどころ
白金鉱業 Meetup Vol.15 :『Pythonで学ぶ効果検証入門』の歪なところ、その理由
サーバレスアプリケーションのデプロイにおけるSAMとAWS CDKとServerless Frameworkの比較
AIセーフティに関する評価観点ガイドの公開
ec-genai-demo: E コマースにおける生成AI 4大ユースケースデモ
Amazon Bedrock で企業会計基準チャットボットを作ってみた !~ 金融機関における生成 AI を使った業務効率化 ~
名古屋地区NLPセミナー
Difyを活用した「内省支援」エージェント開発の所感
日本メイドのLLMを構築する
Introducing Contextual Retrieval
React Native のアプリ作成から Google Play Console での内部テストまでの流れ
LLMマルチエージェントのフローエンジニアリングを支えるLLM Ops
サーバーレスなユーザー認証認可の考慮事項と実践的プラクティス紹介
生成 AI による新しい UI/UX 〜サーバーレスで実現する Generative UI の世界
いまあるチームにフィットさせる Serverless そして Platform Engineeringへの挑戦
サーバーレスAPIのパフォーマンステストとアプリの未来
実践！サーバーレス RAG 構築：Firestore ベクトル検索と VertexAI LLM 活用
Routine maintenance for Azure App Service, restarts, and downtime
ServerlessDays Tokyo 2024
AWS Lambda を支える技術
白金鉱業Meetup_経験値ゼロから始める A/B テスト布教活動と意思決定に活かしやすいA/Bテスト設計の一案
Qwen2-VL-7B-InstructのLoRA
AWS Lambda Web Adapterを活用する新しいサーバーレスの実装パターン
正しく評価される自己評価の書き方
意見を言ってくれた人を孤立させない立ち振る舞い
LLM時代にLabは何をすべきか聞いて回った1年間
WSUS非推奨化発表に伴う感想と今後どうするのか
How streaming LLM APIs work

LermoAI

github.com

ユーザーに合わせた学習教材を作成するGtihubリポジトリ

Paper Copilot: A Self-Evolving and Efficient LLM System for Personalized Academic Assistance

arxiv.org

ユーザープロファイルに基づいてパーソナライズされた研究アシスタントのように機能するシステムを紹介する論文
毎日再思惟のArxiv論文をデータベースに追加する
ユーザープロファイルは、入力された名前を用いてArxivの過去の発表論文を基に構築する

What is the Role of Small Models in the LLM Era: A Survey

arxiv.org

LLMとSMの関係を体系的に調査した論文

Advanced RAG Techniques: Elevating Your Retrieval-Augmented Generation Systems

github.com

RAGシステムのための高度な技術を紹介する包括的なリポジトリ

LLM用のデータセットを作ってみる

bwgift.hatenadiary.jp

ローカルLLMでのデータセットの作成を紹介する記事
JSON形式の出力した

PdMはどのように全てのスピードを上げられるか　~ 非連続進化のための具体的な取り組み ~

speakerdeck.com

継続的改善を行う前提なのでスピードが必要
PDCAを高速に回ることで非連続進化できる
作業よりも先に整理を行う

Prompt evaluations

github.com

Anthoropicが提供するプロンプト評価に関する包括的なコースの内容

RAGで文書検索の精度を上げるには、複数の埋め込みモデルを使う

zenn.dev

ユーザーの質問のジャンルに応じて、複数の埋め込みモデルを使い分ける
ジャンルごとの埋め込みモデルを複数作成しておく
ドキュメントの埋め込みは一つのモデルで行う
どの埋込モデルを使うのが最適かを判断する仕組みを用意する

約1720億パラメータ（GPT-3級）の大規模言語モデルのフルスクラッチ学習を行い、プレビュー版「LLM-jp-3 172B beta1」を公開

～学習データを含めすべてオープンにしたモデルとしては世界最大〜

www.nii.ac.jp

モデルアーキテクチャはLlaMA-2ベース
学習モデル・ツール・コーパスを公開している

プロンプトエンジニアリングをしよう - 一休.comでの検索システム改善事例

user-first.ikyu.co.jp

ユーザーの入力を基に検索条件のJSONに変換する処理をLLMで実施
GPT-4を使うと高いので、プロンプトチューニングしてGPT-3.5 Turboを使った
簡潔な言葉で何をしてほしいかを指示した
1つの指示+複数のルールではなく、ステップバイステップで記載した

メンバーから相談されやすい状態を作る

【E2E連載企画最終回】：自動運転データセットのためのセンサキャリブレーション技術

zenn.dev

【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました！

zenn.dev

大規模言語モデルの研究動向の調査：時系列データ分析とData-centric AIの視点から

research.sakura.ad.jp

GitHub Models を使って 20 種類以上の LLM の日本語性能を測定してみた

engineers.ntt.com

kotoba-tech/kotoba-whisper-v2.0

huggingface.co

OpenAI o1はどんなアカデミック用途に向いているか？

note.com

Kurage

huggingface.co

GRIN: GRadient-INformed MoE

github.com

A replaceable curiosity-driven candidate agent exploration approach for task-oriented dialog policy learning

https://ieeexplore.ieee.org/document/10681405

Pythonで改めて考える「クラス（class）」の使いどころ

speakerdeck.com

白金鉱業 Meetup Vol.15 :『Pythonで学ぶ効果検証入門』の歪なところ、その理由

speakerdeck.com

サーバレスアプリケーションのデプロイにおけるSAMとAWS CDKとServerless Frameworkの比較

serverless.co.jp

AIセーフティに関する評価観点ガイドの公開

aisi.go.jp

ec-genai-demo: E コマースにおける生成AI 4大ユースケースデモ

github.com

Amazon Bedrock で企業会計基準チャットボットを作ってみた !~ 金融機関における生成 AI を使った業務効率化 ~

aws.amazon.com

名古屋地区NLP セミナー

sites.google.com

Difyを活用した「内省支援」エージェント開発の所感

speakerdeck.com

日本メイドのLLMを構築する

www.nii.ac.jp

Introducing Contextual Retrieval

www.anthropic.com

React Native のアプリ作成から Google Play Console での内部テストまでの流れ

note.com

LLMマルチエージェントのフローエンジニアリングを支えるLLM Ops

speakerdeck.com

サーバーレスなユーザー認証認可の考慮事項と実践的プラクティス紹介

speakerdeck.com

生成 AI による新しい UI/UX 〜サーバーレスで実現する Generative UI の世界

speakerdeck.com

いまあるチームにフィットさせる Serverless そして Platform Engineeringへの挑戦

speakerdeck.com

サーバーレスAPIのパフォーマンステストとアプリの未来

speakerdeck.com

実践！サーバーレス RAG 構築：Firestore ベクトル検索と VertexAI LLM 活用

speakerdeck.com

Routine maintenance for Azure App Service, restarts, and downtime

learn.microsoft.com

AppServiceがどのようにリスタートするかを解説した記事

ServerlessDays Tokyo 2024

www.youtube.com

AWS Lambda を支える技術

speakerdeck.com

白金鉱業Meetup_経験値ゼロから始める A/B テスト布教活動と意思決定に活かしやすいA/Bテスト設計の一案

speakerdeck.com

Qwen2-VL-7B-InstructのLoRA

note.com

AWS Lambda Web Adapterを活用する新しいサーバーレスの実装パターン

speakerdeck.com

正しく評価される自己評価の書き方

naopr.hatenablog.com

書いたことしか評価されない
加点アピールは具体例・エビデンス・主張を書く
日頃から書き溜める
事実を用いて評価者が認識・観測できる形で書く

意見を言ってくれた人を孤立させない立ち振る舞い

konifar-zatsu.hatenadiary.jp

LLM時代にLabは何をすべきか聞いて回った1年間

speakerdeck.com

WSUS非推奨化発表に伴う感想と今後どうするのか

kkamegawa.hatenablog.jp

How streaming LLM APIs work

til.simonwillison.net

LermoAI

Paper Copilot: A Self-Evolving and Efficient LLM System for Personalized Academic Assistance

What is the Role of Small Models in the LLM Era: A Survey

Advanced RAG Techniques: Elevating Your Retrieval-Augmented Generation Systems

LLM用のデータセットを作ってみる

PdMはどのように全てのスピードを上げられるか ~ 非連続進化のための具体的な取り組み ~

Prompt evaluations

RAGで文書検索の精度を上げるには、複数の埋め込みモデルを使う

約1720億パラメータ（GPT-3級）の大規模言語モデルのフルスクラッチ学習を行い、プレビュー版「LLM-jp-3 172B beta1」を公開

プロンプトエンジニアリングをしよう - 一休.comでの検索システム改善事例

生成AIの二大潮流と自動運転 / チューリング株式会社

ついに出た！OpenAIの最新モデル「o1」って何がすごいの？

LangChain v0.3 の変更点

AIエージェントキャッチアップ #1 - AutoGen / AutoGen Studio

「技術だけで、良いものは作れない」ヒットメーカー糸井重里が半世紀働いて気付いた、熱狂を生むプロダクトに不可欠なもの

o1のAPIで実験してみたが 制限きつすぎて辛かった話

LLMによる日本語タイポ修正ベンチマーク

o1モデルのプロンプトエンジニアリングって？

RAGの処理で、リランクとベクトル検索でできることの違いを検証／解説してみる

大規模言語モデル Tanuki-8x8Bの紹介と開発経緯など

【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました！

暇そうに見えるマネージャーとはどういう状態か

【E2E連載企画 最終回】：自動運転データセットのためのセンサキャリブレーション技術

【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました！

大規模言語モデルの研究動向の調査：時系列データ分析とData-centric AIの視点から

GitHub Models を使って 20 種類以上の LLM の日本語性能を測定してみた

kotoba-tech/kotoba-whisper-v2.0

OpenAI o1は どんなアカデミック用途に向いているか？

Kurage

GRIN: GRadient-INformed MoE

A replaceable curiosity-driven candidate agent exploration approach for task-oriented dialog policy learning

Pythonで改めて考える「クラス（class）」の使いどころ

白金鉱業 Meetup Vol.15 :『Pythonで学ぶ効果検証入門』の歪なところ、その理由

サーバレスアプリケーションのデプロイにおけるSAMとAWS CDKとServerless Frameworkの比較

AIセーフティに関する評価観点ガイドの公開

ec-genai-demo: E コマースにおける生成AI 4大ユースケースデモ

Amazon Bedrock で企業会計基準チャットボットを作ってみた !~ 金融機関における生成 AI を使った業務効率化 ~

名古屋地区NLPセミナー

Difyを活用した「内省支援」エージェント開発の所感

日本メイドのLLMを構築する

Introducing Contextual Retrieval

React Native の アプリ作成から Google Play Console での内部テストまでの流れ

LLMマルチエージェントのフローエンジニアリングを支えるLLM Ops

サーバーレスなユーザー認証認可の考慮事項と実践的プラクティス紹介

生成 AI による新しい UI/UX 〜サーバーレスで実現する Generative UI の世界

いまあるチームにフィットさせる Serverless そして Platform Engineeringへの挑戦

サーバーレスAPIのパフォーマンステストとアプリの未来

実践！サーバーレス RAG 構築：Firestore ベクトル検索と VertexAI LLM 活用

Routine maintenance for Azure App Service, restarts, and downtime

ServerlessDays Tokyo 2024

AWS Lambda を支える技術

白金鉱業Meetup_経験値ゼロから始める A/B テスト布教活動と意思決定に活かしやすいA/Bテスト設計の一案

Qwen2-VL-7B-InstructのLoRA

AWS Lambda Web Adapterを活用する新しいサーバーレスの実装パターン

正しく評価される自己評価の書き方

意見を言ってくれた人を孤立させない立ち振る舞い

LLM時代にLabは何をすべきか聞いて回った1年間

WSUS非推奨化発表に伴う感想と今後どうするのか

How streaming LLM APIs work

PdMはどのように全てのスピードを上げられるか　~ 非連続進化のための具体的な取り組み ~

o1のAPIで実験してみたが制限きつすぎて辛かった話

【E2E連載企画最終回】：自動運転データセットのためのセンサキャリブレーション技術

OpenAI o1はどんなアカデミック用途に向いているか？

名古屋地区NLP セミナー

React Native のアプリ作成から Google Play Console での内部テストまでの流れ