SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024-01-01から1年間の記事一覧

2024年6月24日の週に気になった記事などまとめ

WandB LaunchのSageMaker連携によるLLMの自動評価 Weekly AI Agents News! ぶっちゃけて話すための場作り RAG ソリューションの設計と開発 Japanese Common Crawl LLM-jp Corpus v2 #AWSSummit 2024 オンデマンド配信一覧表を作ってみました Claude 3.5 Sonn…

2024年6月17日の週に気になった記事などまとめ

画像センシングシンポジウム Weekly AI Agents News! 自動プロンプト最適化をやってみた saldraさんと作る「AITuber(あいちゅーばー)ワークショップ」開催!〜40人集まってAITuberを作ってみた〜 ソフトバンクユーザーなら、生成AI検索「Perplexity Pro」が1…

llama-cpp-agentを使ってPhi-3-miniでWebデータを収集するエージェントをColabで動かしてみた

LLM

llama-cpp-agentを使ってPhi-3-miniでWebデータを収集するエージェントを作ってみたので、実装メモ ポイント MessagesFormatterTypeを利用するLLMに合わせて設定する Phi-3の場合は、MessagesFormatterType.PHI_3 Web検索用のツールとして、WebSearchToolが…

2024年6月10日に気になった記事などまとめ

無料で使える最高のAIノート『NotebookLM』使い方と活用事例 GPT-4oをOCRとして使う Weekly AI Agents News! 【LangChainゆる勉強会#7】会話履歴を上手に使う―Memory/MessageHistory【ランチタイム開催】 Awesome AI Agents Guide LayerX、エンタープライズ…

2024年6月3日の週に気になった記事などまとめ

Google Colabで時系列基盤モデルを試す①:Google timesfm Google Colabで時系列基盤モデルを試す②:AutonLab MOMENT Google Colabで時系列基盤モデルを試す③:IBM granite 「RAG 2.0」松尾研 LLM コミュニティ "Paper & Hacks Vol.06" 論文解説をGPT-4oを使…

2024年5月27日の週に気になった記事などまとめ

生成AIの進化と今後の展望 Lessons from the Trenches on Reproducible Evaluation of Language Models GPT-4oを使って動画チュートリアルをブログ記事に変換する Analyze data using Log Analytics Simple mode 複雑な表をLLMに理解させる Azure VNet フロ…

2024年5月20日の週に気になった記事などまとめ

100万トークン入力できるAI、Gemini 1.5 Proを使って超長文の文書について質問してみる Chat VectorでLLaVAを日本語対応させる Langchain統合のためのクックブック: Langfuse編 CHI2024_summary_japanese.pdf Security consideration of Azure OpenAI with R…

GoogleColabでGeminiを使ってCSVを元データにした簡易RAGを試してみた

LLM

Google ColabでLangChainのドキュメントに従い、CSVファイルを元にしたRAGを実装してみたので、メモ。 ※実際は、SQLiteにCSVデータを入れて、SQLでデータを読み出している !pip install -qU langchain langchain-community langchain-experimental pandas !w…

2024年5月13日の週に気になった記事などまとめ

moment-timeseries-foundation-model/moment karaage0703/code-cooker TSKaigi 2024 スライドまとめ【非公式】 【LLM】1B帯の日本語事前学習モデルのベンチマークを測定する これまでの検索と生成AI時代の検索 Googleが“一歩先の未来を予知”できる時系列予測…

2024年5月6日の週に気になった記事などまとめ

GPUなサービスをそこそこな費用で運営する 基本に立ち戻る:LLMのプロンプト LLMをWebフレームワークにしたら、未来が見えた #2024 次世代Web認証「パスキー」 LLM にプロンプトチューニングをしていただく手法まとめ LLMプロダクト開発における独自評価基準…

Google Colab上でollamaでGPUを活用してc4ai-command-r-plusを動かしてみた

LLM

Google Colab上でollamaでGPUを活用してc4ai-command-r-plus-ggufを動かしてみたので、メモ。 ※A100とL4で動作することを確認 ※もっと簡単にOllamaで動かせるようになっていたので、2024年10月20日手順を更新 まずは、ollamaをインストール !curl https://ol…

2024年4月29日の週に気になった記事などまとめ

Arxiv RAGによる論文サーベイの自動生成 mergekit-evolve のパラメータまとめ Best Practices and Lessons Learned on Synthetic Data for Language Models 複数の企業でデータエンジニアとして求められたスキル Continual Pre-Training for Cross-Lingual L…

Gemini APIでLangGraphのチュートリアルをGoogle Colabでやってみた

LLM

LangGraphのチュートリアルをGemini APIで実行してみたので、メモ 事前準備 「Google AI Studio」でAPIキーを取得 Google ColabのシークレットにGOOGLE_API_KEYに登録 参考 note.com 実行したコード ! pip install langgraph langchain==0.1.9 langchain-goo…

2024年4月22日の週に気になった記事などまとめ

Kaggle LLM Prompt Recoveryコンペまとめ 合成データを利用したLLMの開発 LLM校正CIを自社のブログに導入してみた 【Bedrock×Lambda】高精度なハイブリッド検索RAGをサーバレスで実装(Slack連携も可) Keras 3.0とJAXを使ったgemmaのファインチューニング …

2024年4月15日の週に気になった記事などまとめ

ゼロから始める自作LLM 小さなLLMを多数組み合わせることで、単一の巨大モデルに匹敵する可能性 コンテナ使うならAzureで決まり!個人的推しサービスのAzure Container Appsを語る_ ML system design: 300 case studies to learn from GUIと日本語環境が使え…

2024年4月8日の週に気になった記事などまとめ

Building a RAG Pattern chat bot with Azure OpenAI and LangChain.js | Azure Developers JavaScript Day Azure 技術資料インデックス AWS 初学者向けの勉強方法 6 ステップ!2024 年版! 【論文要約】Jamba: A Hybrid Transformer-Mamba Language Model【…

2024年4月1日の週に気になった記事などまとめ

10bクラスの大規模言語モデルが、ファインチューニングを経てタスクを解けるようになるメカニズムを探るメモ XZ Utilsの脆弱性 CVE-2024-3094 についてまとめてみた Google Colab で BAAI/bge-reranker-v2-m3 を試す ローカルLLM : 最近作成したデータセット…

2024年3月25日の週に気になった記事などまとめ

退屈な論文調査はAIにやらせよう ― arXivとChemRxivからの論文自動抽出&要約LLM: PaperBot君の紹介 NLP2024に参加してきました! Google Colab で EvoLLM-JP を試す Google Colab で RakutenAI-7B を試す MetaGPTを動かしてみた Generative AI for Beginners…

2024年3月18日の週に気になった記事などまとめ

Evaluating Large Language Model (LLM) systems: Metrics, challenges, and best practices Grok-1 Advanced RAG Series: Retrieval An End-to-End Framework for Production-Ready LLM Systems by Building Your LLM Twin RAFT: Adapting Language Model t…

2024年3月11日の週に気になった記事などまとめ

0.1-1B程度の日本語・大規模言語モデルを作る練習日記 Swallow on mistral Swallow-MX: Mixtral日本語継続事前学習MoEモデル Azure AI Searchを使ったマルチモーダルRAGの実現 LLMOpsを推進!Azure Log Analyticsを活用したLLMの継続的な監視と改善 Retrieva…

2024年3月4日の週に気になった記事などまとめ

Awesome-Graph-LLM 先日リリースされたGitHub Copilot Enterprise の最速レビュー!〜進化したGitHub Copilotを使ってみた〜 あなたのRAGは、回答型?それとも検索型? webbigdata/C3TR-Adapter Introducing the next generation of Claude [TU-B-1] LLMと音…

Azure AppServiceで送信トラフィックをVNET統合したときに送信インターネットトラフィックを無効にする方法

Azure AppServiceでVNET統合を利用すると、プライベートエンドポイント経由で仮想ネットワーク内のリソースにアクセスする方法を知っていたが、送信インターネットトラフィックを無効にする方法が分かっていなかったので、メモ 設定方法 Azure PotalでAppSer…

2024年2月26日の週に気になった記事などまとめ

Open TTS Tracker kunishou/J-ResearchCorpus WSL2でgpt2-large-japanese-charを試してみる Python Risk Identification Tool for generative AI (PyRIT) Same Task, More Tokens: the Impact of Input Length on the Reasoning Performance of Large Langua…

2024年2月19日の週に気になった記事などまとめ

仕事で差をつけるChatGPT活用術。初心者でも使えるテクニックを達人に聞く 論文検索GPTs6選+純正ブラウジング(Bing)の比較 マルチモーダルLLM時代のベンチマークから見たGPT-4VとGeminiの比較 Power Query でクエリを関数化する方法 KARAKURI LM を ELYZA-…

2024年2月12日の週に気になった記事などまとめ

Google Colab で LLM-jp 13B v1.1 を試す 大規模言語モデルの構築の事前学習に使えそうなデータセット(主に日本語系)の整理メモ Top Evaluation Metrics for RAG Failures Agent AI: Surveying the Horizons of Multimodal Interaction Self-Discover: Large…

2024年2月5日の週に気になった記事などまとめ

HuggingChat: ローカルLLM用モデルを試せて、アシスタントも作れるサイト GPT4-Vで構成図からIaCコードを生成させる Metaなどの研究者らが、LLMが自分自身に報酬を与える「自己報酬言語モデル」を開発 アナリティクスエンジニアのキャリアとデータモデ…

2024年1月29日の週に気になった記事などまとめ

MM-LLMs: Recent Advances in MultiModal Large Language Models google/siglip-base-patch16-256-multilingual を使って、ローカルの画像を日本語で検索してみる LangCheckでLLMの回答を自動評価する OpenAIの新embeddings,text-embedding-3-smallをRAGタス…

2024年1月22日の週に気になった記事などまとめ

GoogleのマルチモーダルAI「Gemini Pro Vision」は、動画についてどこまで正しく答えられるか? NTT、少ないデータから特定個人の声や口調を再現する技術を開発。大規模言語モデル「tsuzumi」に搭載 A Cheat Sheet and Some Recipes For Building Advanced R…

2024年1月15日の週に気になった記事などまとめ

Self-Extendでfine-tuningせずに長文コンテキストを扱おう AIと著作権に関する考え方について(素案)令和6年1月15日時点版 Survey of Vector Database Management Systems LLMにおける情報抽出(文章から必要な事柄を読み取る)タスクについての調査 コスト…

2024年1月8日の週に気になった記事などまとめ

Advanced RAG Techniques: an Illustrated Overview Retrieval-Augmented Generation (RAG):Paradigms, Technologies, and Trends プロンプトの原則26ヶ条をまとめた報告 LangChain v0.1.0 社長(AI)に頼んで今度こそ商用利用可能な日本語マルチターン会話デ…