SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年6月24日の週に気になった記事などまとめ

気になったものまとめ

WandB LaunchのSageMaker連携によるLLMの自動評価
Weekly AI Agents News!
ぶっちゃけて話すための場作り
RAG ソリューションの設計と開発
Japanese Common Crawl LLM-jp Corpus v2
#AWSSummit 2024 オンデマンド配信一覧表を作ってみました
Claude 3.5 SonnetとGPT-4oのデータ分析性能の比較
Azure AI Document Intelligence入門【Resultパラメータ解説付き！】
[翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜
chatgpt-artificats
生成 AI の評価方法
埋め込みモデル学習と評価ための4つのクラスタリングデータセットの公開
DeepEval
IT エンジニアが対人関係でしくじらないために
名古屋弁LLM
HiddenLayer Model Scanner helps developers assess the security of open models in the model catalog
AWSの生成AIサービス Amazon Bedrock入門！（2024/6月版）
BedrockUpdatesPost-GW Summary
「GPT-4」を上回る日本語性能のLLM「Llama-3-ELYZA-JP」を開発しました
RAG評価ツールの "RAGAS" を使って、RAGパイプラインの性能を測定する
宇宙一早くAmazon Bedrock 生成AIアプリ開発入門の献本が届いたので感想をしみじみ語る
プロンプトの試行錯誤をラクにしたい！プロンプトのマネージメントツールの調査
最新のClaudeアプデ内容(claude3.5, artifacts, projects機能)について解説してみた
LangGraph v0.1 と LangGraph Cloud の概要
Gemini API の Code Execution
Gemma 2 の概要
【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します！
Finding GPT-4’s mistakes with GPT-4
Bedrockが前処理なしにドキュメントを読めるようになったのでできることを整理しました
マルチエージェントで性能が上がったText-to-SQLのいま
全社的な生成AI活用プラットフォームとしての Difyの導入事例紹介
入社10日でスタート！松尾研究所の数理最適化勉強会
「よーしパパ、Ollama で Llama-3-ELYZA-JP-8B 動かしちゃうぞー」
[06/22~06/28] 生成AI Weekly News #43｜Figma AI 登場！
5W1H ～LLM活用プロジェクトを推進するうえで考えるべきこと～
初心者向けの生成 AI
大規模言語モデル (LLM) の技術と最新動向
Announcing updates to the AWS Well-Architected Framework guidance
さらなるアウトプットに、Let's ライトニングトーク！ ― LTのやり方
Microsoft Research が開発した GraphRAG: 企業の非公開データ分析を革新する LLM 技術
【Gemini本発売記念】npaka によるマルチモーダルとローカルLLMの現在と未来
楽ありゃ苦もあるモノレポ化
フロントエンドの Monorepo をやめてリポジトリ分割したワケ
120リポジトリを1つのMonorepoに統合した理由
codebase-explainer
Claudeの新機能「Artifacts」で全自動ゲーム制作させてみた
Ollamaで始めるGoogle Gemma 2～高性能言語モデルの実践ガイド～《LangChain・LlamaIndex》
ローカルNeo4jとOllamaを使用したGraphRAGアプリケーション
Claude の Projects にライブラリのリファレンスを丸ごと入れてみる
HippoRAG Neurobiologically Inspired Long-Term Memory for Large Language Models
Open SoraをGoogle Colabで動かして高速動画生成
Mesop

WandB LaunchのSageMaker連携によるLLMの自動評価

Weekly AI Agents News!

speakerdeck.com

ぶっちゃけて話すための場作り

speakerdeck.com

RAG ソリューションの設計と開発

learn.microsoft.com

Japanese Common Crawl LLM-jp Corpus v2

https://gitlab.llm-jp.nii.ac.jp/datasets/llm-jp-corpus-v2-ja_cc_all

#AWSSummit 2024 オンデマンド配信一覧表を作ってみました

Claude 3.5 SonnetとGPT-4oのデータ分析性能の比較

Azure AI Document Intelligence入門【Resultパラメータ解説付き！】

tech-lab.sios.jp

[翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜

chatgpt-artificats

ChatGPT APIでClaudeのArtifact機能を再現したリポジトリ

生成 AI の評価方法

speakerdeck.com

埋め込みモデル学習と評価ための4つのクラスタリングデータセットの公開

DeepEval

Pytestのように記述できるLLMの評価ライブラリ

IT エンジニアが対人関係でしくじらないために

名古屋弁LLM

なんでも名古屋弁で答えてくれるLLMと学習環境、データセット

HiddenLayer Model Scanner helps developers assess the security of open models in the model catalog

techcommunity.microsoft.com

オープンモデルのセキュリティリスクと脅威を特定するHiddenLayerモデルスキャナの紹介記事

AWSの生成AIサービス Amazon Bedrock入門！（2024/6月版）

speakerdeck.com

BedrockUpdatesPost-GW Summary

speakerdeck.com

「GPT-4」を上回る日本語性能のLLM「Llama-3-ELYZA-JP」を開発しました

RAG評価ツールの "RAGAS" を使って、RAGパイプラインの性能を測定する

宇宙一早くAmazon Bedrock 生成AIアプリ開発入門の献本が届いたので感想をしみじみ語る

speakerdeck.com

プロンプトの試行錯誤をラクにしたい！プロンプトのマネージメントツールの調査

Langfuse
- Langchainとのインテグレーションがスムーズ
- GUIでプロンプトを試せるのは課金グレードのみ
Agenta
- スピリットビューでプロンプトを並べて同時にRunできる
Promptfoo
- テスト駆動でプロンプトを作成する
- CLIでテストのカバレッジを見ながら開発を進める
- 専用のyamlでテストやプロンプトを定義する

最新のClaudeアプデ内容(claude3.5, artifacts, projects機能)について解説してみた

www.youtube.com

LangGraph v0.1 と LangGraph Cloud の概要

Gemini API の Code Execution

Gemma 2 の概要

【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します！

Finding GPT-4’s mistakes with GPT-4

https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/

ChatGPTのコードエラーを検出するモデルCriticGPTを公開した

Bedrockが前処理なしにドキュメントを読めるようになったのでできることを整理しました

BedrockのConverse APIがドキュメントのインプットに対応した
画像もPDFも渡すことができる

マルチエージェントで性能が上がったText-to-SQLのいま

speakerdeck.com

全社的な生成AI活用プラットフォームとしての Difyの導入事例紹介

speakerdeck.com

入社10日でスタート！松尾研究所の数理最適化勉強会

「よーしパパ、Ollama で Llama-3-ELYZA-JP-8B 動かしちゃうぞー」

[06/22~06/28] 生成AI Weekly News #43｜Figma AI 登場！

5W1H ～LLM活用プロジェクトを推進するうえで考えるべきこと～

speakerdeck.com

リリースが先の場合は現状モデルに合わせてプロンプトチューニングする必要はない

初心者向けの生成 AI

learn.microsoft.com

大規模言語モデル (LLM) の技術と最新動向

speakerdeck.com

Announcing updates to the AWS Well-Architected Framework guidance

フレームワークガイダンスの更新と改善が実施された

さらなるアウトプットに、Let's ライトニングトーク！ ― LTのやり方

speakerdeck.com

Microsoft Research が開発した GraphRAG: 企業の非公開データ分析を革新する LLM 技術

LLMが知識グラフを生成し、生成した知識グラフはボトムアップクラスタリングを用いて意味的に関連するエンティティをグループ化する
質問に加えて、知識グラフとクラスタリング結果から関連データを取得し、その情報も活用してLLMは回答する

【Gemini本発売記念】npaka によるマルチモーダルとローカルLLMの現在と未来

speakerdeck.com

楽ありゃ苦もあるモノレポ化

speakerdeck.com

フロントエンドの Monorepo をやめてリポジトリ分割したワケ

speakerdeck.com

120リポジトリを1つのMonorepoに統合した理由

speakerdeck.com

codebase-explainer

AIを活用してプロジェクトのコードベースを分析し、ファイル構造とファイルの説明を生成するPython スクリプト

Claudeの新機能「Artifacts」で全自動ゲーム制作させてみた

www.youtube.com

Ollamaで始めるGoogle Gemma 2～高性能言語モデルの実践ガイド～《LangChain・LlamaIndex》

ローカルNeo4jとOllamaを使用したGraphRAGアプリケーション

Claude の Projects にライブラリのリファレンスを丸ごと入れてみる

HippoRAG Neurobiologically Inspired Long-Term Memory for Large Language Models

HippoRAGを実装したGitHub リポジトリ

Open SoraをGoogle Colabで動かして高速動画生成

nowokay.hatenablog.com

Mesop

google.github.io

Googleが公開している簡単にwebUIを記述できるライブラリ