SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

気になったものまとめ

2025年1月20日の週に気になった記事などまとめ

Foundations of Large Language Models RAG Best Practices 「LangChainとLangGraphによるRAG・AIエージェント[実践]入門」でつまずいたことメモ:10章 VAEって結局何者なの? 「紙に印刷すると間違いに気づく理由」に根拠はない 【メモ】RAGシステム構築の…

2024年1月13日の週に気になった記事等まとめ

Building Knowledge Graphs with LLM Graph Transformer 【レンダリング大全】CSR, SSR, SPA, MPA, PPRの意味、そもそもレンダリングとは【2025年始】 VS CodeとAIチャットの往復いらず! 話題の拡張機能Clineで爆速開発してみよう Ollama + phi-4 + Cool Cl…

2025年1月6日の週に気になった記事などまとめ

Amazon Bedrock Knowledge Bases でもサポート開始 (preview) した噂の GraphRAG とは一体なんなのか ?! MicrosoftのAI Agent「Magentic-One」を理解する DeepseekV3は何がすごいのか?何故ヤバいと言われているのかを解説 なぜスプリントレトロスペクティブ…

2024年12月30日の週に気になった記事などまとめ

2024年 ビッグテックのAI Agent 動向まとめ LLMのコード能力を向上させる取り組み browser-useの基礎理解 社内コミュニケーションを支える用語集「Words」 WSLでLinux音声アプリを動かそう!WSLgとPulseAudioの基礎 2024年、激動のチューリングの開発を振り…

2024年12月23日の週に気になった記事などまとめ

ModernBERT のブログを読んでみた感想 Bing's Transition to LLM/SLM Models: Optimizing Search with TensorRT-LLM M-1グランプリの裏で「一番面白いLLM」を決めるLLM-1グランプリを開催してみる Google ColabでSeed-VCによる声色変換を試す Open RealtimeA…

2024年12月16日の週に気になった記事などまとめ

企業パワポテンプレを M365 Copilot in PowerPoint に最適化させる 仮説のマップ・ループ・リープ 読書習慣をサポートするWebサービス「Tsundoku」をリリースしました!! 請求書から漫画まで!OCR+LLMで進化する文書データ構造化技術 LLMが複雑な指示に従う…

2024年12月9日の週に気になった記事などまとめ

日本語reasoningモデルを作る LLMを悩ませる"Excel文書"をうまく扱う方法 AivisSpeech を試す&CLI から試せるスクリプトを作成した 【論文】LLM-as-a-Judgeならぬ、Agent-as-a-Judge 〜エージェントでエージェントの評価を行う〜 Engineering Manager CNN <…

2024年12月2日の週に気になった記事などまとめ

日本語LLMまとめ tavily-search MCP server AIと人が共創する時代に大事なこと 2024/11/18〜2024/11/24までのAWSアップデートを振り返ってみた #しむそく #しまがじ 弱さを晒け出すマネジメントと弱さを乗り越えるマネジメント ローカルLLM Advent Calendar …

2024年11月25日の週に気になった記事などまとめ

The Dawn of GUI Agent The Data Engineering Handbook Insight-V: Exploring Long-Chain Visual Reasoning with Multimodal Large Language Models 『AITuberを作ってみたらプロンプトエンジニアリングがよくわかった件』を読みました AgentWrite LangGraph…

2024年11月18日の週に気になった記事などまとめ

自動でプロンプトが作れる!Claudeの新機能がとても良い感じだったので解説してみた k-meansのクラスター数の決定に情報量規準(BIC)を使用するのはどうか?(結論いいのではないか?) IPA(情報処理推進機構)が公開している資料が有益すぎる GitHub Copilo…

2024年11月11日の週に気になった記事などまとめ

SFTTrainerでdataset_text_fieldの引数を使う場合、学習データの構造次第では意図した学習が行われない可能性がある トラブルがあったコンペに学ぶデータ分析 LangGraph Agents with Amazon Bedrock 「関西Kaggler会 交流会 in Osaka 2024#3」に参加してきま…

2024年11月4日の週に気になった記事などまとめ

How to implement a ReAct flow using LangGraph (Studio) microsoft/BitNetをWindowsで動かす エンジニアのキャリアパスはどう描く? まつもとりーさんと考える後悔しないキャリア選択 Claude 3.5 Haiku 積読を消化する技術 Azure OpenAI Service を使う際…

2024年10月28日の週に気になった記事などまとめ

NotebookLlama: An Open Source version of NotebookLM DocAI ColabでArXiv論文データを加工してNotebookLMで使ってみる。 A Survey on Data Synthesis and Augmentation for Large Language Models プロンプトエンジニアリングによる、Amazon Bedrock での…

2024年10月22日の週に気になった記事などまとめ

kaggle小技まとめてみた(随時更新予定) Jailbreaking LLM-Controlled Robots チームに無能がいなくなる『メンバー全員で公式ドキュメントを読みあわせる』に感銘をうけた話。 生成AIスタートアップ社内での生成AI活用事例 ~バックオフィス編~ Introducing Di…

2024年10月14日の週に気になった記事などまとめ

WSL2でEntropixを試してみる サクッと始めるRAG開発【LangChain / Python】 0.5BパラメータのLLMを一から作ろうとして心が折れかけた話 Chrome の組み込み AI の Summarization API を試してみる OpenRouter で Grok 2 API を試す ローカルLLMでbolt.newを動…

2024年10月7日の週に気になった記事などまとめ

Can we make any smaller opensource LLM models smarter than human? Pythonでクロスプラットフォームなアプリが作れる「Flet」を試す 高性能な日本語SPLADE(スパース検索)モデルを公開しました スクラムにおける開発タスクの予実の乖離をどうするか Open…

2024年9月30日の週に気になった記事などまとめ

LLMの日本語ロールプレイ能力を計測するベンチマーク「Japanese-RP-Bench」の概要と評価結果などのまとめ LLM-jp-3 を LLM Farm を使って iPhone で動かす Logic-of-Thought: Injecting Logic into Contexts for Full Reasoning in Large Language Models Ev…

2024年9月23日の週に気になった記事などまとめ

curiosity 【ServerlessDays 2024】生成AIアプリ実装におけるトレンド3選 スクラムに必要な知的生産性を上げるソフトスキル ArXivから論文を参照してLLMをColabでファインチューニングしてみる。 【株式会社ELYZA】|GENIAC成果報告会 自社開発モデルプレゼ…

2024年9月16日の週に気になった記事などまとめ

LermoAI Paper Copilot: A Self-Evolving and Efficient LLM System for Personalized Academic Assistance What is the Role of Small Models in the LLM Era: A Survey Advanced RAG Techniques: Elevating Your Retrieval-Augmented Generation Systems L…

2024年9月9日の週に気になった記事などまとめ

LangGraphを使ったReflection Agent: SNS投稿コンテンツ提案Agent llm-jp-asr Weekly AI Agents News! Large Language Model-Based Agents for Software Engineering: A Survey 私見:Pythonプロジェクトの3類型(ver 2024.09) AI-Driven Research Assista…

2024年9月2日の週に気になった記事などまとめ

ITエンジニアのためのプロンプトエンジニアリング Serverless AI Chat with RAG using LangChain.js AutoGen Studio: A No-Code Developer Tool for Building and Debugging Multi-Agent Systems 【最大90%の時間削減】生成AI最前線、 トヨタコネクティッド…

2024年8月26日の週に気になった記事などまとめ

GraphRAG Analysis, Part 1: How Indexing Elevates Vector Database Performance in RAG When Using Neo4j Graph Retrieval-Augmented Generation: A Survey Controllable Text Generation for Large Language Models: A Survey 生成AIによるレポーティング…

2024年8月19日の週に気になった記事などまとめ

EfficientRAG: Efficient Retriever for Multi-Hop Question Answering RAGChecker: A Fine-grained Framework for Diagnosing Retrieval-Augmented Generation 新しいStable Diffusion WebUI ForgeでFLUX.1を試す(Windows) Training Language Models on t…

2024年8月12日の週に気になった記事などまとめ

「ChatGPTを使い尽くす! 深津式プロンプト読本」 補足めも From LLMs to LLM-based Agents for Software Engineering: A Survey of Current, Challenges and Future Weekly AI Agents News! RAG Foundry: A Framework for Enhancing LLMs for Retrieval Aug…

2024年8月5日の週に気になった記事などまとめ

【サーベイ】大規模言語モデル時代の「データ中心の自動運転モデル」 元Stable Diffusion開発チームによる高性能画像生成AI「FLUX.1」、Perplexity精度のオープンソース検索AI「MindSearch」など生成AI技術5つを解説(生成AIウィークリー) Building A Gener…

2024年7月29日の週に気になった記事などまとめ

プロジェクトマネジメントで娘の夏休みの宿題炎上を防止しました 具体的に困ろう for Qiita Engineer Festa 2024 後夜祭 ~アウトプットの祭典!~ AWS Cloud9が突然、新規利用不可に? 代替策「SageMaker Studio コードエディタ」の利用手順 Serverless AI …

2024年7月22日の週に気になった記事などまとめ

A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks Vortex under Ripplet: An Empirical Study of RAG-enabled Applications LLM Evaluation doesn't need to be complicated 深津式プロンプトを超える、ロング コ…

2024年7月15日の週に気になった記事などまとめ

The science behind semantic search: How AI from Bing is powering Azure Cognitive Search Data Flywheels for LLM Applications ローカルLLMでGraphRAGを実装して「クリスマスキャロル」を分析してみた SpreadsheetLLM: Encoding Spreadsheets for Large…

2024年7月8日の週に気になった記事などまとめ

Searching for Best Practices in Retrieval-Augmented Generation APIGen: Automated Pipeline for Generating Verifiable and Diverse Function-Calling Datasets 継之助による自動プロンプトチューニング 無料でも使える便利な生成AIサービス 独自の日本…

2024年7月1日の週に気になった記事などまとめ

大規模な日本語の事前学習言語モデルSarashina1・2の公開 バクラクのAI-OCRが扱う問題の複雑さ LLM評価 Weekly AI Agents News! Swallowプロジェクト 大規模言語モデル 評価スクリプト Ver. 202407 第3世代の自動運転@CVPR2024 Nejumi LLMリーダーボード3開…