SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年12月2日の週に気になった記事などまとめ

日本語LLMまとめ

llm-jp.github.io

tavily-search MCP server

github.com

  • TavilyのAPIを使用したMCPサーバー

AIと人が共創する時代に大事なこと

note.com

2024/11/18〜2024/11/24までのAWSアップデートを振り返ってみた #しむそく #しまがじ

alta-whitechip.name

弱さを晒け出すマネジメントと弱さを乗り越えるマネジメント

note.com

ローカルLLM Advent Calendar 2024

qiita.com

Claude MCPを使ったアプリ開発に挑戦してみた

zenn.dev

  • Claude MCPとClineの違いについて見解を述べた記事
  • Claude MCPの中のfilesystemとgitにフォーカスして検証

ClaudeのMCPを徹底解説! & gpt-4o+MCP+YouTube APIの動画推薦チャットAIも作る

qiita.com

  • 独自のMCPサーバーを作成したり、Claude以外のLLMでの実装を紹介する記事

「悩んでいる状態」から「考える状態」へ変化させるために 広木大地氏が説く、不確実性を下げるためのアクション

logmi.jp

  • 悩むは「状態」で考えるは「行動」
  • 「考える」は次にどうすればいいかわかっていて、そのための行動を起こしている状態
  • 観測できてコントロールできるものを、観測してコントロールすることしかできない
  • コントロールできないものを制御しようとすると悩みとなる

AI検索エンジン「Perplexity」とGASを活用した情報収集スプレッドシートの作成方法

www.softbank.jp

ストリーム処理を活用してLLMベース音声対話システムのレイテンシを短縮する

engineers.ntt.com

  • ストリーム処理を活用することで、カスケード方式の欠点であるレイテンシの短縮に取り組んだ結果を紹介した記事
  • 文単位でttsすると、レイテンシーが小さくなるかつ音声品質が維持される

バクラク事業部の「エンジニア共有会」とは?持続可能な運営と文化醸成の工夫 #LayerXテックアドカレ

tech.layerx.co.jp

Microsoft Securityの歩き方😊

qiita.com

生成AIで会社の要件定義プロセスを100倍高速化した話

qiita.com

  • 複数のツールやシステムを横断しているとChatGPTを利用しても効率化できないため、システムを開発した

Mermaid Graphical Editorを使うとVSCodeでサクサク図が書けるよ

zenn.dev

  • 使う利点
    • マークダウンに成果物を直接埋め込める
    • 生成AIと相性がいい

生成AIにTOEIC®リスニング問題を無限に生成してもらい、スコア900超え達成した話

qiita.com

経営者から見た"開発生産性向上"の違和感に向き合う

zenn.dev

工数6割削減! 生成AIとOCRを組み合わせ、店舗毎に形式が異なるレストランメニューを読み取らせてみた

tech-blog.tabelog.com

  • レストランメニューのデータ入稿業務の効率化でOCR技術の活用やUIの作りこみや生成AIの活用を組み合わせて、作業工数を6割削減した記事
  • 文字起こし作業にかかっていた時間を1/5の修正時間に短縮できた
  • 縦書き、自由レイアウト、手書きなどは苦手

Windows Claude Desktop用のDuckDuckGo検索サーバーを作ってみた

hamaruki.com

New APIs in Amazon Bedrock to enhance RAG applications, now available

aws.amazon.com

  • Bedrock Knowledge Basesにリランクモデルが追加された

Claude Desktop用のDuckDuckGo検索サーバーをnpmパッケージとして公開してみた

hamaruki.com

【DAY1 前半】最速更新!AWS re:Invent 2024 初日(12/2)のアップデート速報 #しむそく

qiita.com

なぜ我々はスクラムで「リファインメント」をするのか

zenn.dev

機能多くない?Claudeのスタイル・Profile Preferences・Projectsの使い分けを考える

note.com

マルチモーダル AI を用いた研究開発部署でのプロトタイプ開発

hack.nikkei.com

  • 政治資金収支報告書からの情報抽出を複数のマルチモーダル AI を試し「Claude 3 Opus」で最良の結果が得られた

技術記事はそもそもバズらない……そうはいっても読まれたいに関する自身の考え

luccafort.hatenablog.com

aws.amazon.com

  • Private Link経由でNLBやGLBを経由しなくてもVPC内のリソースにアクセスでき量になった
  • RAMを利用し実現する

Amazon Bedrock Model Evaluation now includes LLM-as-a-judge (Preview)

aws.amazon.com

  • AWS BedrockにLLM as a judgeで評価するサービスが公開された

Amazon Bedrock Knowledge Bases now supports RAG evaluation (Preview)

aws.amazon.com

  • AWS Bedrock Knowledge BasesにRAGアプリケーションを評価する機能が追加された

Amazon Bedrock Knowledge Bases now supports streaming responses

aws.amazon.com

  • AWS Bedrock Knowledge Basesでストリーミングレスポンスするサービスをサポートした

Amazon Bedrock Knowledge Bases now provides auto-generated query filters for improved retrieval

aws.amazon.com

  • AWS Bedrock Knowledge BasesはRetrievalの改善のために自動クエリフィルターが提供されるようになった

今まさに「マネジメントを担う人」のコミュニティが必要。あらたま氏に聞く EMConf JP 開催の背景

levtech.jp

cohere.com

  • Rerank 3.5という新しいリランクモデルが公開された

Storage Browser for Amazon S3 is now generally available

aws.amazon.com

  • Amazon S3のストレージブラウザがGAされた

Awesome MCP Servers

github.com

【DAY1 後半】最速更新!AWS re:Invent 2024 初日(12/2)のアップデート速報 #しむそく

qiita.com

Amazon EventBridge and AWS Step Functions announce integration with private APIs

aws.amazon.com

  • Event BridgeとStep FunctionはPrivateLinkとVPC Latticeを活用したプライベートAPIの統合をサポートするようになった

【LangChain】LCEL ステップバイステップ ハンズオン 〜なろう短編小説の自動生成&評価・改善を行う「AIエージェント」を添えて〜

zenn.dev

多様性を重視した集団ベースのモデルマージ

sakana.ai

  • LLMエージェントの集団を進化させる「CycleQD」を提案
  • このフレームワークでは、それぞれが固有のニッチを持つエージェント群を形成し、複雑なエージェントタスクを効率的に解決する

「生成AIとSaaSの対比」 生成AIに関するレポート

note.com

Amazon Bedrock を使用した生成 AI のコストと使用状況の追跡、配分、管理

aws.amazon.com

241130紅白ぺぱ合戦LT「編集の技術」

speakerdeck.com

30分でわかるデータ指向アプリケーションデザイン

speakerdeck.com

MCP Manager

github.com

  • MCPを管理するためのビジュアルクライアントツール

LLMの思考の性能をモンテカルロ木探索で引き上げる

zenn.dev

  • 問題をより抽象的な問題として捉えて、その抽象的な問題を解くための手法を実際の問題と照らし合わせて評価し、その手順に則って回答を導き出す手法

Introducing latency-optimized inference for foundation models in Amazon Bedrock

aws.amazon.com

  • Bedrockでレイテンシーを最適化した推論がパブリックプレビューで利用可能となった

AWS re:Invent 2024】コンテナセキュリティの近未来?を見た

kaminashi-developer.hatenablog.jp

BedrockでAmazon Novaを試してみる

zenn.dev

  • Nova Reelで生成できる動画は6秒

Amazon Nova の概要

note.com

「やるメリットよりも、やらないと死ぬ」――経営層に生成AI活用を説く、メルカリAI新担当のハヤカワ五味の奮闘

www.itmedia.co.jp

  • 導入しないことで失うものに焦点を当てて、説得した

The PM's handbook for building AI features

handbook.getbasalt.ai

  • プロダクトマネージャーがチームをAIをデジタル製品に効果的に統合するための実践的な洞察を提供するガイド

Introducing Amazon Nova, our new generation of foundation models

www.aboutamazon.com

  • Amazon Novaを紹介する記事

MegaParse - Your Parser for every type of documents

github.com

  • 様々な種類のドキュメントを簡単に処理できる協力で多用途なパーサー

Mattersim

github.com

  • 元素、温度、圧力の範囲を対象とした深層学習原子モデル

Google ドキュメント アドオン + LLM でAI校正・レビュー機能を作ってみた

tech-blog.abeja.asia

The Amazon Nova family of models: Technical report and model card

www.amazon.science

  • Amazon Novaのテクニカルレポート

Introducing Amazon Aurora DSQL

aws.amazon.com

  • サーバーレス分散SQLデータベースであるAmazon Aurora DSQLが公開された

Amazon SageMaker Lakehouse integrated access controls now available in Amazon Athena federated queries

aws.amazon.com

  • Amazon SageMaker Lakehouseに新たなデータカタログと権限管理機能が発表された

Announcing GitLab Duo with Amazon Q (Preview)

aws.amazon.com

  • GitLab Duow利用すると、開発者はクィックアクションを使用してAmazon Qエージェントに委任できる

Introducing multi-agent collaboration capability for Amazon Bedrock (preview)

aws.amazon.com

  • Amazon Bedrockにマルチエージェントコラボレーション機能が発表された

2024年末にデザインパターンについて考える

qiita.com

Comprehensive guide to JavaScript performance analysis using Chrome DevTools

blog.jiayihu.net

  • Chrome Devtoolsのパフォーマンスタブを操作して、JavaScriptのパフォーマンスを効果的に分析改善するガイド

Prevent factual errors from LLM hallucinations with mathematically sound Automated Reasoning checks (preview)

aws.amazon.com

  • Amazon Bedrock GuardrailsにAuto Reasoningという応答を数学的・論理的に検証する機能が追加された

vLLMで独自実装モデルを高速推論させる

zenn.dev

Algomatic、生成AI特化のオウンドメディア「AlgoMagazine」をリリース

prtimes.jp

毎日ブログを書くようにしたら体調が良くなった

daiksy.hatenablog.jp

松尾研究所のデータサイエンティストが今年の業務に役立ったと思う本10選

zenn.dev

Amazon Nova lite での動画処理

hamaruki.com

  • 1リクエストにつき動画
  • 音声非対応
  • タイムスタンプ非対応

Energy Efficiency Management System - Multi-Agent Workshop

github.com

  • AWSが公開しているBedrockエージェントのマルチエージェントコラボレーションのワークショップ

【DAY4】最速更新!AWS re:Invent 2024 Swami & Ruba Keynoteのアップデート速報 #しむそく

qiita.com

Amazon Bedrock Data Automation now available in preview

aws.amazon.com

  • 文書や画像やビデオや音声を構造化するサービスBedrock Data Automationがリリースされた

Amazon Bedrock Knowledge Bases now supports GraphRAG (preview)

aws.amazon.com

  • Amazon Bedrock Knowledge Basesが知識グラフの自動生成に対応した

Amazon Bedrock Intelligent Prompt Routing is now available in preview

aws.amazon.com

  • 各リクエストを最も低いコストで目的の応答を返す可能性が最も高いと予想されるモデル動的にルーティングする機能が公開された

Amazon Bedrock announces preview of prompt caching

aws.amazon.com

  • Bedrockがプロンプトキャッシュ機能をプレビューリリースした

High fidelity model

cloud.google.com

  • Google Cloudで提供されたコンテキストに厳密に基づくことを求められるユースケース向けに設計されたモデルが公開された

クルマをハッキングせよ! トヨタがそんな大会を開くワケとは・・・

toyotatimes.jp

Weekly AI Agent News!から見えたAIエージェントの現在地

masamasa59.hatenablog.com

  • マクロレベルでエージェントアーキテクチャに差分はない
    • エージェントの基礎は、知覚、プロフィール、プランニング、リフレクション、ツール利用、メモリ
  • エージェントの細部を作りこむことは怠らない
    • メモリを作り込むか、ツールを作り込むか、知覚内容を簡潔にするか、プランニングを階層化するか、特定の用途で学習するかなど、基礎部分の高度化で差分を出す
    • メモリに保存する内容の抽出プロンプトだったり、ツールを選択する基準であったり、プランニングの方向性を縛るプロンプトエンジニアリング
  • 2024年のAIエージェントは応用の開拓の年だった
    • Siemens は製造現場の製造計画やプロセス評価のための3Dモデリングを自動化するエージェントを提案している
    • テーブルデータからレポートを作成するエージェントを提案している
  • エージェントを独自開発して本当に精度は向上しているのか
    • 現状だと同じLLMをベースにするとエージェントアーキテクチャに細部までこだわっても性能の改善は横並びか数%の違いで、メモリを使っても継続的に精度が向上しない可能性があり、ベースのLLMの性能アップの影響が大きい
    • ビジネスではエージェント内部でLLMの能力の限界にギリぶつからない範囲で価値を出す

AIエージェントビジネスの現状と今後の考察

masamasa59.hatenablog.com

  • 生成AIエージェントと業務ソフトウェアの結びつきが強くなる
  • GUIからコンピュータを制御するのはまだ難しい
  • 汎用的なエージェント設計は難しく、業務特化のエージェントに勝機あり

日本語MoEモデルの開発と「実りある失敗」

zenn.dev

Azure Functions - Durable Functionsでモンテカルロシミュレーションを実行する

zenn.dev

プロダクトの爆速開発を支える、 「作らない・削る・尖らせる」技術

speakerdeck.com

  • やらないことを決めるのが大事
  • ユースケースの解像度を上げてセグメンテーションすることで作らないものを決める

API Documentの改善施策

zenn.dev

Microsoft Graph APIからExcelを操作しよう

yard.tips

世界一安いGPUを求めて2024冬

qiita.com

生成AIの経済学 生成AI市場における競争構造

生成AIの経済学 生成AI市場における競争構造 | DOORS DX

Ruri: 日本語に特化した汎用テキスト埋め込みモデル

zenn.dev

12 Days of OpenAI: Day1のまとめ

note.com

Copilot Vision now in preview – a new way to browse

www.microsoft.com

  • Webページの内容を視覚的に認識し、ユーザーと対話しながら問題解決や情報の簡略化を支援するCopilot Visionが発表された

ChatGPT Pro ・ o1 の概要

note.com

OpenAI o1 System Card

openai.com

Matsuo_lab_LLM_Day11金融パートvF講義後編集

www.docswell.com

  • 知識のみを問う問題はRAG目線では解きやすいが、高度な論理的な思考や複数にまたがる知識を要する問題はRAGには負担が大きい

【松尾研LLM講義まとめ】ドメイン特化LLM・金融特化LLMの最新動向と活用可能性

zenn.dev

機械翻訳された日本語Preferenceデータの有効性の検証にトライしてみる

zenn.dev

生成AIはデータサイエンティストの仕事を奪うか?

engineers.ntt.com

  • データサイエンスそのものの重要性が低下するという意味ではなく、むしろ「仕事の民主化」が進むことを意味する

OpenAI o1のコード理解能力を探る

note.com

GPT-4oとo1とo1 proの翻訳の違いと物語生成性能を試す

note.com

【GPT vs Claude vs Gemini vs Llama vs Mistral】 LLM戦国時代に各モデルの使い所を考えてみる

zenn.dev

Amazon Aurora DSQL の紹介

aws.amazon.com

  • Aurora DSQL は、事実上無限のスケーラビリティ、最高の可用性、そしてインフラストラクチャ管理ゼロを提供する

[AWS Black Belt Online Seminar] AWS re:Invent 2024 速報 資料及び動画公開のご案内

aws.amazon.com

【re:Invent】2024/12/2〜2024/12/8のAWSアップデートを振り返ってみた #しむそく #しまがじ

alta-whitechip.name

【2024年最新】スクラムを効率化するNotion活用術:ストーリーポイント管理とダッシュボード設計

tech.layerx.co.jp

経営に囚われ_現場が見えなくなってしまったPMの奮闘記.pdf

speakerdeck.com

  • 以下の理由で直接不安を聞けなかった
    • 話を聞く時間・姿勢がなかったため
    • 事業方針の変更に対する期待のギャップに気づいてなかった

開発者向けツールを魔改造してセキュリティ診断ツールを作っている話

speakerdeck.com

Llama-3.3-70B-Instruct-ggufをollamaとColabでためしてみる

bwgift.hatenadiary.jp

Ollama で structured outputs (構造化出力)を試す

note.com

ミスが許されない領域にAIを溶け込ませる プロダクトマネジメントの裏側

speakerdeck.com

  • 人とAIによって高い精度と生産性を両立させる

LLMの推論部分を理解してみよう!

qiita.com

Amazon Aurora now available as a quick create vector store in Amazon Bedrock Knowledge Bases

aws.amazon.com

  • Amazon Aurora Serverlessが Bedrock Knowledge Basesのベクターストアとしてクィック作成できるようになった

ドメイン駆動設計を始めよう」 の個人的まとめ

zenn.dev

LLMのハルシネーションについてちょっと詳しくなってみる

qiita.com

Zod を使って OpenAI の構造化された出力を扱う

azukiazusa.dev

  • Node.js 向けの OpenAI SDK では Zod を使ってスキーマを定義し、構造化された出力を扱うことができる

Llama 3.3 70B Instruct について解説してから動かしてみる

note.com

  • 対応言語に日本語は含まれない
  • ナレッジカットオフは 2023 年 12 月

Cognitoが大型アップデート!Managed Loginとパスワードレスログインを実際に使ってみた

speakerdeck.com

  • 生体認証、パスキーなどによるパスワードレスログインに対応した

デイリースクラムをスプリントゴール目線で取り組んだらスクラム全体が改善した話

zenn.dev

知らない景色を見に行こう チャンスを掴んだら道が開けたマネジメントの旅

speakerdeck.com

経済産業省 AI事業者ガイドライン 第1.01版 解説

qiita.com

「LangChainとLangGraphによるRAG・AIエージェント[実践]入門」でつまずいたことメモ:6章

qiita.com

リモートワーク時代を生き抜くAI・機械学習チームの働き方

www.m3tech.blog

  • 仕事の内容、状況がチームメンバーに見えるようにスレッドを立てて、そこに作業や思考の過程などをそのまま垂れ流す
    • チームメンバーはその内容について自由にコメントする

データ分析で用いるSQLクエリの設計方法

techblog.kazaneya.com

遊び心もありつつ、悩みも共有、関西のカグラ―が集う「関西Kaggler会 交流会 in Osaka 2024 #3」を開催

data.wingarc.com

メンバーの成長速度にバフをかける1on1ミーティング

speakerdeck.com

  • 議事録を必ず残して共有、前回分を見返しながら会話する
  • コンディションの急激な変化がないかチェック
  • 「事実」と「解釈」を分解して話してもらうように誘導し、「打ち手」を一緒に考える

OpenAI o1登場!最新のOpenAIアップデートについて解説してみた

www.youtube.com

secのお仕事、ときどき沼る

blog.kyash.co