SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年6月24日の週に気になった記事などまとめ

WandB LaunchのSageMaker連携によるLLMの自動評価

note.com

Weekly AI Agents News!

speakerdeck.com

ぶっちゃけて話すための場作り

speakerdeck.com

RAG ソリューションの設計と開発

learn.microsoft.com

Japanese Common Crawl LLM-jp Corpus v2

https://gitlab.llm-jp.nii.ac.jp/datasets/llm-jp-corpus-v2-ja_cc_all

#AWSSummit 2024 オンデマンド配信一覧表を作ってみました

www.cdata.com

Claude 3.5 SonnetとGPT-4oのデータ分析性能の比較

note.com

Azure AI Document Intelligence入門【Resultパラメータ解説付き!】

tech-lab.sios.jp

[翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜

zenn.dev

chatgpt-artificats

github.com

生成 AI の評価方法

speakerdeck.com

埋め込みモデル学習と評価ための4つのクラスタリングデータセットの公開

note.com

DeepEval

github.com

  • Pytestのように記述できるLLMの評価ライブラリ

IT エンジニアが対人関係でしくじらないために

qiita.com

名古屋弁LLM

github.com

HiddenLayer Model Scanner helps developers assess the security of open models in the model catalog

techcommunity.microsoft.com

  • オープンモデルのセキュリティリスクと脅威を特定するHiddenLayerモデルスキャナの紹介記事

AWSの生成AIサービス Amazon Bedrock入門!(2024/6月版)

speakerdeck.com

BedrockUpdatesPost-GW Summary

speakerdeck.com

「GPT-4」を上回る日本語性能のLLM「Llama-3-ELYZA-JP」を開発しました

note.com

RAG評価ツールの "RAGAS" を使って、RAGパイプラインの性能を測定する

qiita.com

宇宙一早くAmazon Bedrock 生成AIアプリ開発入門の献本が届いたので 感想をしみじみ語る

speakerdeck.com

プロンプトの試行錯誤をラクにしたい!プロンプトのマネージメントツールの調査

zenn.dev

  • Langfuse
    • Langchainとのインテグレーションがスムーズ
    • GUIでプロンプトを試せるのは課金グレードのみ
  • Agenta
    • スピリットビューでプロンプトを並べて同時にRunできる
  • Promptfoo
    • テスト駆動でプロンプトを作成する
    • CLIでテストのカバレッジを見ながら開発を進める
    • 専用のyamlでテストやプロンプトを定義する

最新のClaudeアプデ内容(claude3.5, artifacts, projects機能)について解説してみた

www.youtube.com

LangGraph v0.1 と LangGraph Cloud の概要

note.com

Gemini API の Code Execution

note.com

Gemma 2 の 概要

note.com

都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します!

note.com

Finding GPT-4’s mistakes with GPT-4

https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/

  • ChatGPTのコードエラーを検出するモデルCriticGPTを公開した

Bedrockが前処理なしにドキュメントを読めるようになったのでできることを整理しました

qiita.com

  • BedrockのConverse APIがドキュメントのインプットに対応した
  • 画像もPDFも渡すことができる

マルチエージェントで性能が上がったText-to-SQLのいま

speakerdeck.com

全社的な生成AI活用プラットフォームとしての Difyの導入事例紹介

speakerdeck.com

入社10日でスタート!松尾研究所の数理最適化勉強会

zenn.dev

「よーしパパ、Ollama で Llama-3-ELYZA-JP-8B 動かしちゃうぞー」

qiita.com

[06/22~06/28] 生成AI Weekly News #43|Figma AI 登場!

note.com

5W1H ~LLM活用プロジェクトを推進するうえで考えるべきこと~

speakerdeck.com

  • リリースが先の場合は現状モデルに合わせてプロンプトチューニングする必要はない

初心者向けの生成 AI

learn.microsoft.com

大規模言語モデル (LLM) の技術と最新動向

speakerdeck.com

Announcing updates to the AWS Well-Architected Framework guidance

aws.amazon.com

さらなるアウトプットに、Let's ライトニングトーク! ― LTのやり方

speakerdeck.com

Microsoft Research が開発した GraphRAG: 企業の非公開データ分析を革新する LLM 技術

hamaruki.com

  • LLMが知識グラフを生成し、生成した知識グラフはボトムアップクラスタリングを用いて意味的に関連するエンティティをグループ化する
  • 質問に加えて、知識グラフとクラスタリング結果から関連データを取得し、その情報も活用してLLMは回答する

【Gemini本発売記念】npaka による マルチモーダルとローカルLLMの現在と未来

speakerdeck.com

楽ありゃ苦もあるモノレポ化

speakerdeck.com

フロントエンドの Monorepo をやめてリポジトリ分割したワケ

speakerdeck.com

120リポジトリを1つのMonorepoに統合した理由

speakerdeck.com

codebase-explainer

github.com

  • AIを活用してプロジェクトのコードベースを分析し、ファイル構造とファイルの説明を生成するPythonスクリプト

Claudeの新機能「Artifacts」で全自動ゲーム制作させてみた

www.youtube.com

Ollamaで始めるGoogle Gemma 2~高性能言語モデルの実践ガイド~《LangChain・LlamaIndex》

hamaruki.com

ローカルNeo4jとOllamaを使用したGraphRAGアプリケーション

hamaruki.com

Claude の Projects にライブラリのリファレンスを丸ごと入れてみる

qiita.com

HippoRAG Neurobiologically Inspired Long-Term Memory for Large Language Models

github.com

Open SoraをGoogle Colabで動かして高速動画生成

nowokay.hatenablog.com

Mesop

google.github.io

  • Googleが公開している簡単にwebUIを記述できるライブラリ