SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年12月16日の週に気になった記事などまとめ

企業パワポテンプレを M365 Copilot in PowerPoint に最適化させる

zenn.dev

仮説のマップ・ループ・リープ

speakerdeck.com

読書習慣をサポートするWebサービス「Tsundoku」をリリースしました!!

zenn.dev

請求書から漫画まで!OCR+LLMで進化する文書データ構造化技術

zenn.dev

LLMが複雑な指示に従うか、かつ回答が役に立つかを評価する ELYZA-tasks-100 から数件を Gemini 2.0 Flash に解かせる

nikkie-ftnext.hatenablog.com

LLMを味方につけた文章執筆術 - 執筆から校正までの実践的アプローチ

zenn.dev

Ignite 2024 最新】Azure AI Agent Service によるエージェントの高速開発メモ①

qiita.com

【AI Shift Advent Calendar 2024】AIエージェントの設計とその勘所

www.ai-shift.co.jp

Gemini 2.0 の Search as a tool を試す

note.com

AWS の生成 AI 最前線 : 顧客起点のイノベーション

speakerdeck.com

深津貫之さんが語る “生成 AI 時代の UX” とは?

note.com

チューリングの自動運転システム開発環境と、それを支える開発ツールたち

zenn.dev

AWS re:Invent 2024で気になった発表10選

zenn.dev

EM1年生の振り返り

blog.kyash.co

MS謹製のanything to Markdownライブラリ: markitdownを試す&PRを出してみた件

qiita.com

日本のお客様による生成 AI 事例集

aws.amazon.com

ChatGPT、検索機能がアップデート。早速試してみたが…衝撃の結果に

note.com

即席RAGを使用してLLMのコンテキストの限界を超える

zenn.dev

1on1で話したことの何をオープンにして何をクローズにするか

note.com

OpenAI o1 and new tools for developers

openai.com

OpenAI o1 API ・ Realtime APIの改善 ・ Preference Fine-Tuning ・ Go/Java SDK

note.com

Evaluation Agent Efficient and Promptable Evaluation Framework for Visual Generative Models

vchitect.github.io

AI Safety の必要性と具体的な攻撃、その対策について

speakerdeck.com

Moving to GraphRAG 1.0 – Streamlining ergonomics for developers and users

www.microsoft.com

  • GraphRAG 1.0が公開された

楽天、日本語に最適化した新たなAIモデルを発表

corp.rakuten.co.jp

Announcing the o1 model in Azure OpenAI Service: Multimodal reasoning with “astounding” analysis

azure.microsoft.com

  • Azure OpenAI Serviceでもo1モデル近々利用可能になることが公開された

LLMアプリケーションの Fine-tunningと蒸留を活用した改善

speakerdeck.com

OpenAI o1 and new tools for developers

openai.com

  • 2024年12月17日からo1モデルをAPIで利用可能となった

ナレッジマネジメントへの挑戦

engineering.mercari.com

Introducing New Fine-tuning Techniques and Capabilities in Azure OpenAI Service

techcommunity.microsoft.com

  • Azure OpenAI Serviceのo1-miniの強化学習チューニング、DPO、蒸留ファインチューニングの機能が紹介された記事

OpenAI Sora(動画生成AI)の使い方

note.com

falcon3:10b-instruct-q8_0をColabとollamaでためしてみる

bwgift.hatenadiary.jp

Preference Fine-Tuning の概要

note.com

OpenAI o1 APIの使い方

note.com

OpenAI o1を再現しよう(Reasoningモデルの作り方)

note.com

Logic Apps と Logic App とロジック アプリ

qiita.com

26 mistakes you may be making with your sensitivity labels

www.welkasworld.com

  • 秘密度ラベルを設定する際の26の失敗を紹介した記事

Genesis の概要

note.com

アンケート時系列データを用いた個人別等化アルゴリズムの提案

www.jstage.jst.go.jp

Azure OpenAI Service で設定ミスって1,000万円請求されたくない!

tech-blog.abeja.asia

LLMのライセンス・利用規約まとめ: 出力をモデルの学習に使ってもいいのはどれ?

zenn.dev

なぜKyashのモバイルチームは周りからいいチームだよねと言われるのか

blog.kyash.co

arXivから2024年のLLMトレンド追ってみた

zenn.dev

リモートワークにおけるパッシブ疲労

speakerdeck.com

Claudeが提案するエージェント構築:簡単で効果的な設計のベストプラクティス

note.com

LangChain State of AI 2024 Report

blog.langchain.dev

PydanticAI × Logfire ではじめる LLM エージェントのモニタリング

speakerdeck.com

TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks

arxiv.org

  • AIエー^ジェントが職場のタスクをどのぐらい自律的に実行できるかを評価するベンチマークを提案した論文

エレガントパズル を読んで 〜 頑張りすぎるをやっつける

hiliteeternal.hatenablog.com

Scaling of Search and Learning: A Roadmap to Reproduce o1 from Reinforcement Learning Perspective

arxiv.org

  • o1の性能を支える強化学習の役割を分析し、より効果的なモデル再現のためのロードマップを提示した論文

時系列データの交差検証(クロスバリデーション)は交差検証とはいえないし、良い方法でもないらしい

zenn.dev

re:Invent2024 KeynoteAmazon Q考察 - 開発者の生産性を向上させる新機能群

tech.nri-net.com

インサイドセールスはAIに淘汰されません

note.com

AI Shift、営業の成果を最大化する企業専用の営業AIエージェントを提供開始

www.cyberagent.co.jp

ビジネス実務で「正しいデータ分析」を行うということ

tjo.hatenablog.com

「やらなきゃ」駆動から「やりたい」駆動へ切り替える方法をついに見つけたかもしれない

note.com

OpenAI o1を再現しよう(Reasoningモデルの作り方)

note.com

「12 Days of OpenAI」の毎日の発表に点数を付けてみた

note.com

vLLMのコードを読んでみよう

nttdocomo-developers.jp

OpenAI’s latest o1 model now available in GitHub Copilot and GitHub Models

github.blog

  • Github CopilotとGithub Modelsでo1モデルが利用可能になった

12 Days of OpenAI: Day12のまとめ

note.com

サービスでLLMを採用したばっかりに振り回され続けたこの一年のあれやこれや

speakerdeck.com

チームの「混乱期」を乗りこなすために 〜「ウェルビーイング」の共有で深める相互理解〜

engineers.ntt.com

LangCheckを使ったLLMアプリケーションの自動レッドチーミング

citadel-ai.com

開発生産性から振り返るエンジニアリングマネジメントの失敗2選

speakerdeck.com

メモ:Ollamaのstructured outputをもう少し使ってみる。

bwgift.hatenadiary.jp

AIOpsLab: Building AI agents for autonomous clouds

www.microsoft.com

  • AI Opsエージェントを構築、テスト、比較、改善するための標準化された原則的な研究フレームワークを紹介した記事

2024年生成AIの進歩まとめ

zenn.dev

OpenAI発表最終日!最新モデルOpenAI o3について解説してみた

www.youtube.com

Amazon Bedrockを用いてプレゼン動画から書き起こし記事を自動生成した話

qiita.com

チーム力を最大化し、難易度の高い課題に挑み続ける。組織拡大をリードしてきた山富が、VPoEとして目指す次の組織づくり

note.openlogi.com

todo.txtを布教したい

qiita.com