2024年12月16日の週に気になった記事などまとめ - SEが最近起こったことを書くブログ

企業パワポテンプレを M365 Copilot in PowerPoint に最適化させる
仮説のマップ・ループ・リープ
読書習慣をサポートするWebサービス「Tsundoku」をリリースしました！！
請求書から漫画まで！OCR+LLMで進化する文書データ構造化技術
LLMが複雑な指示に従うか、かつ回答が役に立つかを評価する ELYZA-tasks-100 から数件を Gemini 2.0 Flash に解かせる
LLMを味方につけた文章執筆術 - 執筆から校正までの実践的アプローチ
【Ignite 2024 最新】Azure AI Agent Service によるエージェントの高速開発メモ①
【AI Shift Advent Calendar 2024】AIエージェントの設計とその勘所
Gemini 2.0 の Search as a tool を試す
AWS の生成 AI 最前線 : 顧客起点のイノベーション
深津貫之さんが語る “生成 AI 時代の UX” とは？
チューリングの自動運転システム開発環境と、それを支える開発ツールたち
AWS re:Invent 2024で気になった発表10選
EM1年生の振り返り
MS謹製のanything to Markdownライブラリ: markitdownを試す&PRを出してみた件
日本のお客様による生成 AI 事例集
ChatGPT、検索機能がアップデート。早速試してみたが…衝撃の結果に
即席RAGを使用してLLMのコンテキストの限界を超える
1on1で話したことの何をオープンにして何をクローズにするか
OpenAI o1 and new tools for developers
OpenAI o1 API ・ Realtime APIの改善・ Preference Fine-Tuning ・ Go/Java SDK
Evaluation Agent Efficient and Promptable Evaluation Framework for Visual Generative Models
AI Safety の必要性と具体的な攻撃、その対策について
Moving to GraphRAG 1.0 – Streamlining ergonomics for developers and users
楽天、日本語に最適化した新たなAIモデルを発表
Announcing the o1 model in Azure OpenAI Service: Multimodal reasoning with “astounding” analysis
LLMアプリケーションの Fine-tunningと蒸留を活用した改善
OpenAI o1 and new tools for developers
ナレッジマネジメントへの挑戦
Introducing New Fine-tuning Techniques and Capabilities in Azure OpenAI Service
OpenAI Sora(動画生成AI)の使い方
falcon3:10b-instruct-q8_0をColabとollamaでためしてみる
Preference Fine-Tuning の概要
OpenAI o1 APIの使い方
OpenAI o1を再現しよう（Reasoningモデルの作り方）
Logic Apps と Logic App とロジックアプリ
26 mistakes you may be making with your sensitivity labels
Genesis の概要
アンケート時系列データを用いた個人別等化アルゴリズムの提案
Azure OpenAI Service で設定ミスって1,000万円請求されたくない！
LLMのライセンス・利用規約まとめ: 出力をモデルの学習に使ってもいいのはどれ？
なぜKyashのモバイルチームは周りからいいチームだよねと言われるのか
arXivから2024年のLLMトレンド追ってみた
リモートワークにおけるパッシブ疲労
Claudeが提案するエージェント構築：簡単で効果的な設計のベストプラクティス
LangChain State of AI 2024 Report
PydanticAI × Logfire ではじめる LLM エージェントのモニタリング
TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks
エレガントパズルを読んで〜頑張りすぎるをやっつける
Scaling of Search and Learning: A Roadmap to Reproduce o1 from Reinforcement Learning Perspective
時系列データの交差検証(クロスバリデーション)は交差検証とはいえないし、良い方法でもないらしい
re:Invent2024 KeynoteのAmazon Q考察 - 開発者の生産性を向上させる新機能群
インサイドセールスはAIに淘汰されません
AI Shift、営業の成果を最大化する企業専用の営業AIエージェントを提供開始
ビジネス実務で「正しいデータ分析」を行うということ
「やらなきゃ」駆動から「やりたい」駆動へ切り替える方法をついに見つけたかもしれない
OpenAI o1を再現しよう（Reasoningモデルの作り方）
「12 Days of OpenAI」の毎日の発表に点数を付けてみた
vLLMのコードを読んでみよう
OpenAI’s latest o1 model now available in GitHub Copilot and GitHub Models
12 Days of OpenAI: Day12のまとめ
サービスでLLMを採用したばっかりに振り回され続けたこの一年のあれやこれや
チームの「混乱期」を乗りこなすために〜「ウェルビーイング」の共有で深める相互理解〜
LangCheckを使ったLLMアプリケーションの自動レッドチーミング
開発生産性から振り返るエンジニアリングマネジメントの失敗2選
メモ：Ollamaのstructured outputをもう少し使ってみる。
AIOpsLab: Building AI agents for autonomous clouds
2024年生成AIの進歩まとめ
OpenAI発表最終日！最新モデルOpenAI o3について解説してみた
Amazon Bedrockを用いてプレゼン動画から書き起こし記事を自動生成した話
チーム力を最大化し、難易度の高い課題に挑み続ける。組織拡大をリードしてきた山富が、VPoEとして目指す次の組織づくり
todo.txtを布教したい

Evaluation Agent Efficient and Promptable Evaluation Framework for Visual Generative Models

vchitect.github.io

少数のサンプルで評価できる視覚モデルの評価エージェントフレームワーク

AI Safety の必要性と具体的な攻撃、その対策について

speakerdeck.com

Moving to GraphRAG 1.0 – Streamlining ergonomics for developers and users

www.microsoft.com

GraphRAG 1.0が公開された

楽天、日本語に最適化した新たなAIモデルを発表

corp.rakuten.co.jp

Announcing the o1 model in Azure OpenAI Service: Multimodal reasoning with “astounding” analysis

azure.microsoft.com

Azure OpenAI Serviceでもo1モデル近々利用可能になることが公開された

LLMアプリケーションの Fine-tunningと蒸留を活用した改善

speakerdeck.com

OpenAI o1 and new tools for developers

openai.com

2024年12月17日からo1モデルをAPIで利用可能となった

ナレッジマネジメントへの挑戦

engineering.mercari.com

Introducing New Fine-tuning Techniques and Capabilities in Azure OpenAI Service

techcommunity.microsoft.com

Azure OpenAI Serviceのo1-miniの強化学習チューニング、DPO、蒸留ファインチューニングの機能が紹介された記事

OpenAI Sora(動画生成AI)の使い方

note.com

falcon3:10b-instruct-q8_0をColabとollamaでためしてみる

bwgift.hatenadiary.jp

Preference Fine-Tuning の概要

note.com

OpenAI o1 APIの使い方

note.com

OpenAI o1を再現しよう（Reasoningモデルの作り方）

note.com

Logic Apps と Logic App とロジックアプリ

qiita.com

26 mistakes you may be making with your sensitivity labels

www.welkasworld.com

秘密度ラベルを設定する際の26の失敗を紹介した記事

Genesis の概要

note.com

アンケート時系列データを用いた個人別等化アルゴリズムの提案

www.jstage.jst.go.jp

Azure OpenAI Service で設定ミスって1,000万円請求されたくない！

tech-blog.abeja.asia

LLMのライセンス・利用規約まとめ: 出力をモデルの学習に使ってもいいのはどれ？

zenn.dev

なぜKyashのモバイルチームは周りからいいチームだよねと言われるのか

blog.kyash.co

arXivから2024年のLLMトレンド追ってみた

zenn.dev

リモートワークにおけるパッシブ疲労

speakerdeck.com

Claudeが提案するエージェント構築：簡単で効果的な設計のベストプラクティス

note.com

LangChain State of AI 2024 Report

blog.langchain.dev

PydanticAI × Logfire ではじめる LLM エージェントのモニタリング

speakerdeck.com

TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks

arxiv.org

AIエー＾ジェントが職場のタスクをどのぐらい自律的に実行できるかを評価するベンチマークを提案した論文

エレガントパズルを読んで〜頑張りすぎるをやっつける

hiliteeternal.hatenablog.com

Scaling of Search and Learning: A Roadmap to Reproduce o1 from Reinforcement Learning Perspective

arxiv.org

o1の性能を支える強化学習の役割を分析し、より効果的なモデル再現のためのロードマップを提示した論文

時系列データの交差検証(クロスバリデーション)は交差検証とはいえないし、良い方法でもないらしい

zenn.dev

re:Invent2024 KeynoteのAmazon Q考察 - 開発者の生産性を向上させる新機能群

tech.nri-net.com

インサイドセールスはAIに淘汰されません

note.com

AI Shift、営業の成果を最大化する企業専用の営業AIエージェントを提供開始

www.cyberagent.co.jp

ビジネス実務で「正しいデータ分析」を行うということ

tjo.hatenablog.com

「やらなきゃ」駆動から「やりたい」駆動へ切り替える方法をついに見つけたかもしれない

note.com

OpenAI o1を再現しよう（Reasoningモデルの作り方）

note.com

「12 Days of OpenAI」の毎日の発表に点数を付けてみた

note.com

vLLMのコードを読んでみよう

nttdocomo-developers.jp

OpenAI’s latest o1 model now available in GitHub Copilot and GitHub Models

github.blog

Github CopilotとGithub Modelsでo1モデルが利用可能になった

12 Days of OpenAI: Day12のまとめ

note.com

サービスでLLMを採用したばっかりに振り回され続けたこの一年のあれやこれや

speakerdeck.com

チームの「混乱期」を乗りこなすために〜「ウェルビーイング」の共有で深める相互理解〜

engineers.ntt.com

LangCheckを使ったLLMアプリケーションの自動レッドチーミング

citadel-ai.com

開発生産性から振り返るエンジニアリングマネジメントの失敗2選

speakerdeck.com

メモ：Ollamaのstructured outputをもう少し使ってみる。

bwgift.hatenadiary.jp

AIOpsLab: Building AI agents for autonomous clouds

www.microsoft.com

AI Opsエージェントを構築、テスト、比較、改善するための標準化された原則的な研究フレームワークを紹介した記事

2024年生成AIの進歩まとめ

zenn.dev

OpenAI発表最終日！最新モデルOpenAI o3について解説してみた

www.youtube.com

Amazon Bedrockを用いてプレゼン動画から書き起こし記事を自動生成した話

qiita.com

チーム力を最大化し、難易度の高い課題に挑み続ける。組織拡大をリードしてきた山富が、VPoEとして目指す次の組織づくり

note.openlogi.com

todo.txtを布教したい

qiita.com

企業パワポテンプレを M365 Copilot in PowerPoint に最適化させる

仮説のマップ・ループ・リープ

読書習慣をサポートするWebサービス「Tsundoku」をリリースしました！！

請求書から漫画まで！OCR+LLMで進化する文書データ構造化技術

LLMが複雑な指示に従うか、かつ回答が役に立つかを評価する ELYZA-tasks-100 から数件を Gemini 2.0 Flash に解かせる

LLMを味方につけた文章執筆術 - 執筆から校正までの実践的アプローチ

【Ignite 2024 最新】Azure AI Agent Service によるエージェントの高速開発メモ①

【AI Shift Advent Calendar 2024】AIエージェントの設計とその勘所

Gemini 2.0 の Search as a tool を試す

AWS の生成 AI 最前線 : 顧客起点のイノベーション

深津貫之さんが語る “生成 AI 時代の UX” とは？

チューリングの自動運転システム開発環境と、それを支える開発ツールたち

AWS re:Invent 2024で気になった発表10選

EM1年生の振り返り

MS謹製のanything to Markdownライブラリ: markitdownを試す&PRを出してみた件

日本のお客様による生成 AI 事例集

ChatGPT、検索機能がアップデート。早速試してみたが…衝撃の結果に

即席RAGを使用してLLMのコンテキストの限界を超える

1on1で話したことの何をオープンにして何をクローズにするか

OpenAI o1 and new tools for developers

OpenAI o1 API ・ Realtime APIの改善 ・ Preference Fine-Tuning ・ Go/Java SDK

Evaluation Agent Efficient and Promptable Evaluation Framework for Visual Generative Models

AI Safety の必要性と具体的な攻撃、その対策について

Moving to GraphRAG 1.0 – Streamlining ergonomics for developers and users

楽天、日本語に最適化した新たなAIモデルを発表

Announcing the o1 model in Azure OpenAI Service: Multimodal reasoning with “astounding” analysis

LLMアプリケーションの Fine-tunningと蒸留を活用した改善

OpenAI o1 and new tools for developers

ナレッジマネジメントへの挑戦

Introducing New Fine-tuning Techniques and Capabilities in Azure OpenAI Service

OpenAI Sora(動画生成AI)の使い方

falcon3:10b-instruct-q8_0をColabとollamaでためしてみる

Preference Fine-Tuning の概要

OpenAI o1 APIの使い方

OpenAI o1を再現しよう（Reasoningモデルの作り方）

Logic Apps と Logic App とロジック アプリ

26 mistakes you may be making with your sensitivity labels

Genesis の概要

アンケート時系列データを用いた個人別等化アルゴリズムの提案

Azure OpenAI Service で設定ミスって1,000万円請求されたくない！

LLMのライセンス・利用規約まとめ: 出力をモデルの学習に使ってもいいのはどれ？

なぜKyashのモバイルチームは周りからいいチームだよねと言われるのか

arXivから2024年のLLMトレンド追ってみた

リモートワークにおけるパッシブ疲労

Claudeが提案するエージェント構築：簡単で効果的な設計のベストプラクティス

LangChain State of AI 2024 Report

PydanticAI × Logfire ではじめる LLM エージェントのモニタリング

TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks

エレガントパズル を読んで 〜 頑張りすぎるをやっつける

Scaling of Search and Learning: A Roadmap to Reproduce o1 from Reinforcement Learning Perspective

時系列データの交差検証(クロスバリデーション)は交差検証とはいえないし、良い方法でもないらしい

re:Invent2024 KeynoteのAmazon Q考察 - 開発者の生産性を向上させる新機能群

インサイドセールスはAIに淘汰されません

AI Shift、営業の成果を最大化する企業専用の営業AIエージェントを提供開始

ビジネス実務で「正しいデータ分析」を行うということ

「やらなきゃ」駆動から「やりたい」駆動へ切り替える方法をついに見つけたかもしれない

OpenAI o1を再現しよう（Reasoningモデルの作り方）

「12 Days of OpenAI」の毎日の発表に点数を付けてみた

vLLMのコードを読んでみよう

OpenAI’s latest o1 model now available in GitHub Copilot and GitHub Models

12 Days of OpenAI: Day12のまとめ

サービスでLLMを採用したばっかりに振り回され続けたこの一年のあれやこれや

チームの「混乱期」を乗りこなすために 〜「ウェルビーイング」の共有で深める相互理解〜

LangCheckを使ったLLMアプリケーションの自動レッドチーミング

開発生産性から振り返るエンジニアリングマネジメントの失敗2選

メモ：Ollamaのstructured outputをもう少し使ってみる。

AIOpsLab: Building AI agents for autonomous clouds

2024年生成AIの進歩まとめ

OpenAI発表最終日！最新モデルOpenAI o3について解説してみた

Amazon Bedrockを用いてプレゼン動画から書き起こし記事を自動生成した話

チーム力を最大化し、難易度の高い課題に挑み続ける。組織拡大をリードしてきた山富が、VPoEとして目指す次の組織づくり

todo.txtを布教したい

OpenAI o1 API ・ Realtime APIの改善・ Preference Fine-Tuning ・ Go/Java SDK

Logic Apps と Logic App とロジックアプリ

エレガントパズルを読んで〜頑張りすぎるをやっつける

チームの「混乱期」を乗りこなすために〜「ウェルビーイング」の共有で深める相互理解〜