2024年9月23日の週に気になった記事などまとめ - SEが最近起こったことを書くブログ

curiosity
【ServerlessDays 2024】生成AIアプリ実装におけるトレンド3選
スクラムに必要な知的生産性を上げるソフトスキル
ArXivから論文を参照してLLMをColabでファインチューニングしてみる。
【株式会社ELYZA】｜GENIAC成果報告会自社開発モデルプレゼンテーション
話題のGraphRAGにAWSで挑戦しよう！（LlamaIndexとNeptuneに入門）
Axcxept社、EZO×Qwen2.5シリーズでGPT-4-Turboを凌ぐ日本語LLM/自動CoT・RAGを採用
Amazon SageMaker Studio now supports automatic shutdown of idle applications
LLMの効率化を支えるアルゴリズム
Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more
LLM-jp-3 1.8B・3.7B・13B の公開
Google Colab で LLM-jp-3 1.8B を試す
Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely
大規模言語モデルの性能の自動評価に関する問題点のメモ書き：Tanuki-8x8Bの事例から
Gemini-1.5-Pro-002・Gemini-1.5-Flash-002・Gemini-1.5-Flash-8B-Exp-0924 の概要
Azure AI Confidential Inferencing Preview
待望の新機能！OpenAIのボイスモードの使用感を解説してみた
第10回フィッシング対策勉強会
Llama 3.2 の概要
Llama 3.2 を試す
Small Language Models: Survey, Measurements, and Insights
Enterprise trust in Azure OpenAI Service strengthened with Data Zones
仕事を前に進めるためのコツ - 判断と決断と共有
【Python】VSCodeで関数の引数名を表示する神機能
RAGに関する主要な論文を時系列順にまとめていく(2024年度版)
Beyond Bots: How AI Agents Are Driving the Next Wave of Enterprise Automation
Upgrading the Moderation API with our new multimodal moderation model
コンテンツモデレーション入門の入門
OpenAI の新しくなった Moderation API を試す
憧れている人はいるか
LLM-jp-3 を gguf に変換する手順
生成AIを用いた音声データ活用：記事作成プロセスの自動化
Microsoft、物議醸した「Recall」（リコール）を再設計　10月にプレビューへ
Cursorを1年弱触っているエンジニアの最近の使い方
生成AIの推論が高度になればなるほど、使う人間の側にも高度な知識が求められる
LLM-jp-3 を llama.cpp を使って iPhone・Android で動かす
Llama-3.2-1B-Instructを少しだけファインチューニングしてColabでためす。
Llama 3.2 の使い方
RAGの性能を評価しよう
CreateInquiryViaBedrock
Step FunctionsからはじめるBedrock @ JAWS-UG AI/ML
Amazon Q data integration in AWS Glue 試してみた
Amazon Titan Image Generator v2 の全機能を徹底検証：機能解説と実践ガイド
AI時代のアジャイル開発（XP祭り2024版）
llm-jp-3-1.8b-instruct-Q4_K_MをollamaとColabでうごかしてみる。
コード生成AI時代のテスト駆動開発
つよつよリーダーが抜けたらどうする？〜ナビタイムのAgile⽀援組織の変遷〜

curiosity

github.com

Perplexityのようなユーザ体験を持つチャットボットを構築する試みのリポジトリ
Tavilyを利用して検索して実現する

【ServerlessDays 2024】生成AIアプリ実装におけるトレンド3選

qiita.com

スクラムに必要な知的生産性を上げるソフトスキル

speakerdeck.com

判断者がモブに入り込むことが重要

ArXivから論文を参照してLLMをColabでファインチューニングしてみる。

bwgift.hatenadiary.jp

ローカルLLMを使い論文のabstractの解析を行い、そのデータセットでLoRAによるファインチューニングを試した記事

【株式会社ELYZA】｜GENIAC成果報告会自社開発モデルプレゼンテーション

speakerdeck.com

話題のGraphRAGにAWSで挑戦しよう！（LlamaIndexとNeptuneに入門）

qiita.com

Neptune Analyticsは大規模ワークロード向け

Axcxept社、EZO×Qwen2.5シリーズでGPT-4-Turboを凌ぐ日本語LLM/自動CoT・RAGを採用

prtimes.jp

内部的に複数のステップを踏んで思考を深化させるAuto-CoTやリアルタイムでWeb検索する機能もある

Amazon SageMaker Studio now supports automatic shutdown of idle applications

aws.amazon.com

SageMaker Studioにアイドル時間が続くとシャットダウンする機能が追加された

LLMの効率化を支えるアルゴリズム

speakerdeck.com

Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more

developers.googleblog.com

Gemini-1.5-Pro-002とGemini-1.5-Flash-002がリリースされた

LLM-jp-3 1.8B・3.7B・13B の公開

llmc.nii.ac.jp

Google Colab で LLM-jp-3 1.8B を試す

note.com

Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely

arxiv.org

RAGの種類とタスクに基づいて、4つの種類のクエリに分類することを提案した論文

大規模言語モデルの性能の自動評価に関する問題点のメモ書き：Tanuki-8x8Bの事例から

zenn.dev

CoTを用いた推論と単純な回答のみを返すことを求める場合で評価が異なってしまう

Gemini-1.5-Pro-002・Gemini-1.5-Flash-002・Gemini-1.5-Flash-8B-Exp-0924 の概要

note.com

Gemini 1.5 Proの価格が50%以上下がっている
Gemini 1.5 Flashはレイテンシーが削減されている

Azure AI Confidential Inferencing Preview

techcommunity.microsoft.com

Whisperの機密推論機能が公開された

画像エンコーダーと言語モデルの間にアダプターが挿入された
Llama 3.2 1B、3Bでも128Kトークンのコンテキスト長をサポートしている

Llama 3.2 を試す

note.com

1Bと3Bの軽量LLMはマルチリンガルの文章生成やツールの呼び出し能力に優れている

Small Language Models: Survey, Measurements, and Insights

arxiv.org

SLMのサーベイ論文

Enterprise trust in Azure OpenAI Service strengthened with Data Zones

azure.microsoft.com

Azure OpenAI Serviceにデータゾーンデプロイメントが追加される

仕事を前に進めるためのコツ - 判断と決断と共有

speakerdeck.com

問題を理解するうえで重要なこと
- 未知のものは何か
- 与えられているものはなにか
- 条件はなにか
タスクを分解するときには5W1Hを最初に整理する
タスクの終了の定義と完成の定義が重要
情報を集めることができない中で答えを出すのが決断
決断が必要な場面のために基準を持つ

【Python】VSCodeで関数の引数名を表示する神機能

qiita.com

VS Codeで設定をいれることで引数名が表示される

RAGに関する主要な論文を時系列順にまとめていく(2024年度版)

note.com

Beyond Bots: How AI Agents Are Driving the Next Wave of Enterprise Automation

menlovc.com

ドメインへの特化性とLLMの自立性でエージェント市場をマップした記事

Upgrading the Moderation API with our new multimodal moderation model

openai.com

OpenAIが新たなモデレーションモデルを導入した
テキストと画像の両方のモデレーションを実現する
非英語コンテンツで以前のモデルよりも正確になった

コンテンツモデレーション入門の入門

speakerdeck.com

日本語の安全性に特化したモデルはほとんどない
安全性に関する評価データセットもモデルと同様の状況

OpenAI の新しくなった Moderation API を試す

note.com

英語以外の言語でよりスコアが改善した

憧れている人はいるか

konifar-zatsu.hatenadiary.jp

1年後/3年後どうなっていたいかの質問の代わりにあこがれている人はいますかと聞く

LLM-jp-3 を gguf に変換する手順

note.com

生成AIを用いた音声データ活用：記事作成プロセスの自動化

note.com

複数人で同時に話す場面では誰が発言しているかを正確に識別することが難しい

Microsoft、物議醸した「Recall」（リコール）を再設計　10月にプレビューへ

www.itmedia.co.jp

初期設定ではリコールを無効化
リコールの完全削除も可能

Cursorを1年弱触っているエンジニアの最近の使い方

note.com

Cursorを使うとコードの中身を簡単にAIに渡せる

生成AIの推論が高度になればなるほど、使う人間の側にも高度な知識が求められる

tjo.hatenablog.com

生成AIの推論が高度すぎるとハルシネーションかどうかの判定も難しくなる

LLM-jp-3 を llama.cpp を使って iPhone・Android で動かす

note.com

Llama-3.2-1B-Instructを少しだけファインチューニングしてColabでためす。

bwgift.hatenadiary.jp

Llama 3.2 の使い方

note.com

transformers実装では入力された最後の画像のみに注目する
欧州連合に居住する個人、欧州連合に主たる事業所がある企業にはマルチモーダルモデルを使用するライセンス権が付与されない
日本語はサポートしてない
bitsandbytes を使用して8bitまたは4bitで読み込むこともできる

RAGの性能を評価しよう

speakerdeck.com

CreateInquiryViaBedrock

github.com

Bedrockを使って問い合わせ内容が問い合わせのガイドラインに沿っているかを確認するアプリ

Step FunctionsからはじめるBedrock @ JAWS-UG AI/ML

speakerdeck.com

Amazon Q data integration in AWS Glue 試してみた

speakerdeck.com

Amazon Q data integration in AWS Glueは自然言語を使用してデータ統合ジョブを構築する機能

Amazon Titan Image Generator v2 の全機能を徹底検証：機能解説と実践ガイド

qiita.com

入力言語は英語のみ対応
ネガティブプロンプトを利用し、画像に含めたくない要素を指定可能

AI時代のアジャイル開発（XP祭り2024版）

speakerdeck.com

AIがコーディングを担うようになると、開発自体にはそれほど時間がかからなくなる
その分何をつくるのかの検討、作ったものの評価の時間と回数が増える
開発サイクルが短くなり、一日スプリントが基本になっていく
より小さなチーム、より多くのチームへ

llm-jp-3-1.8b-instruct-Q4_K_MをollamaとColabでうごかしてみる。

bwgift.hatenadiary.jp

コード生成AI時代のテスト駆動開発

www.docswell.com

複雑なプログラムを一発で生成させるとコードの品質が安定しない
処理を分割したうえで、個々にテストファーストで進めたほうが内部品質は向上する

つよつよリーダーが抜けたらどうする？〜ナビタイムのAgile⽀援組織の変遷〜

speakerdeck.com

つよつよリーダーが抜けたら不安を吐き出した
現状の課題やそれぞれのやりたいことを見直すきっかけとした

curiosity

【ServerlessDays 2024】生成AIアプリ実装におけるトレンド3選

スクラムに必要な知的生産性を上げるソフトスキル

ArXivから論文を参照してLLMをColabでファインチューニングしてみる。

【株式会社ELYZA】｜GENIAC成果報告会 自社開発モデルプレゼンテーション

話題のGraphRAGにAWSで挑戦しよう！（LlamaIndexとNeptuneに入門）

Axcxept社、EZO×Qwen2.5シリーズでGPT-4-Turboを凌ぐ日本語LLM/自動CoT・RAGを採用

Amazon SageMaker Studio now supports automatic shutdown of idle applications

LLMの効率化を支えるアルゴリズム

Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more

LLM-jp-3 1.8B・3.7B・13B の公開

Google Colab で LLM-jp-3 1.8B を試す

Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely

大規模言語モデルの性能の自動評価に関する問題点のメモ書き：Tanuki-8x8Bの事例から

Gemini-1.5-Pro-002・Gemini-1.5-Flash-002・Gemini-1.5-Flash-8B-Exp-0924 の概要

Azure AI Confidential Inferencing Preview

待望の新機能！OpenAIのボイスモードの使用感を解説してみた

第10回フィッシング対策勉強会

Llama 3.2 の概要

Llama 3.2 を試す

Small Language Models: Survey, Measurements, and Insights

Enterprise trust in Azure OpenAI Service strengthened with Data Zones

仕事を前に進めるためのコツ - 判断と決断と共有

【Python】VSCodeで関数の引数名を表示する神機能

RAGに関する主要な論文を時系列順にまとめていく(2024年度版)

Beyond Bots: How AI Agents Are Driving the Next Wave of Enterprise Automation

Upgrading the Moderation API with our new multimodal moderation model

コンテンツモデレーション入門の入門

OpenAI の新しくなった Moderation API を試す

憧れている人はいるか

LLM-jp-3 を gguf に変換する手順

生成AIを用いた音声データ活用：記事作成プロセスの自動化

Microsoft、物議醸した「Recall」（リコール）を再設計 10月にプレビューへ

Cursorを1年弱触っているエンジニアの最近の使い方

生成AIの推論が高度になればなるほど、使う人間の側にも高度な知識が求められる

LLM-jp-3 を llama.cpp を使って iPhone・Android で動かす

Llama-3.2-1B-Instructを少しだけファインチューニングしてColabでためす。

Llama 3.2 の使い方

RAGの性能を評価しよう

CreateInquiryViaBedrock

Step FunctionsからはじめるBedrock @ JAWS-UG AI/ML

Amazon Q data integration in AWS Glue 試してみた

Amazon Titan Image Generator v2 の全機能を徹底検証：機能解説と実践ガイド

AI時代のアジャイル開発（XP祭り2024版）

llm-jp-3-1.8b-instruct-Q4_K_MをollamaとColabでうごかしてみる。

コード生成AI時代のテスト駆動開発

つよつよリーダーが 抜けたらどうする？ 〜ナビタイムのAgile⽀援組織の変遷〜

【株式会社ELYZA】｜GENIAC成果報告会自社開発モデルプレゼンテーション

Microsoft、物議醸した「Recall」（リコール）を再設計　10月にプレビューへ

つよつよリーダーが抜けたらどうする？〜ナビタイムのAgile⽀援組織の変遷〜