SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024-01-01から1年間の記事一覧

2024年4月15日の週に気になった記事などまとめ

ゼロから始める自作LLM 小さなLLMを多数組み合わせることで、単一の巨大モデルに匹敵する可能性 コンテナ使うならAzureで決まり!個人的推しサービスのAzure Container Appsを語る_ ML system design: 300 case studies to learn from GUIと日本語環境が使え…

2024年4月8日の週に気になった記事などまとめ

Building a RAG Pattern chat bot with Azure OpenAI and LangChain.js | Azure Developers JavaScript Day Azure 技術資料インデックス AWS 初学者向けの勉強方法 6 ステップ!2024 年版! 【論文要約】Jamba: A Hybrid Transformer-Mamba Language Model【…

2024年4月1日の週に気になった記事などまとめ

10bクラスの大規模言語モデルが、ファインチューニングを経てタスクを解けるようになるメカニズムを探るメモ XZ Utilsの脆弱性 CVE-2024-3094 についてまとめてみた Google Colab で BAAI/bge-reranker-v2-m3 を試す ローカルLLM : 最近作成したデータセット…

2024年3月25日の週に気になった記事などまとめ

退屈な論文調査はAIにやらせよう ― arXivとChemRxivからの論文自動抽出&要約LLM: PaperBot君の紹介 NLP2024に参加してきました! Google Colab で EvoLLM-JP を試す Google Colab で RakutenAI-7B を試す MetaGPTを動かしてみた Generative AI for Beginners…

2024年3月18日の週に気になった記事などまとめ

Evaluating Large Language Model (LLM) systems: Metrics, challenges, and best practices Grok-1 Advanced RAG Series: Retrieval An End-to-End Framework for Production-Ready LLM Systems by Building Your LLM Twin RAFT: Adapting Language Model t…

2024年3月11日の週に気になった記事などまとめ

0.1-1B程度の日本語・大規模言語モデルを作る練習日記 Swallow on mistral Swallow-MX: Mixtral日本語継続事前学習MoEモデル Azure AI Searchを使ったマルチモーダルRAGの実現 LLMOpsを推進!Azure Log Analyticsを活用したLLMの継続的な監視と改善 Retrieva…

2024年3月4日の週に気になった記事などまとめ

Awesome-Graph-LLM 先日リリースされたGitHub Copilot Enterprise の最速レビュー!〜進化したGitHub Copilotを使ってみた〜 あなたのRAGは、回答型?それとも検索型? webbigdata/C3TR-Adapter Introducing the next generation of Claude [TU-B-1] LLMと音…

Azure AppServiceで送信トラフィックをVNET統合したときに送信インターネットトラフィックを無効にする方法

Azure AppServiceでVNET統合を利用すると、プライベートエンドポイント経由で仮想ネットワーク内のリソースにアクセスする方法を知っていたが、送信インターネットトラフィックを無効にする方法が分かっていなかったので、メモ 設定方法 Azure PotalでAppSer…

2024年2月26日の週に気になった記事などまとめ

Open TTS Tracker kunishou/J-ResearchCorpus WSL2でgpt2-large-japanese-charを試してみる Python Risk Identification Tool for generative AI (PyRIT) Same Task, More Tokens: the Impact of Input Length on the Reasoning Performance of Large Langua…

2024年2月19日の週に気になった記事などまとめ

仕事で差をつけるChatGPT活用術。初心者でも使えるテクニックを達人に聞く 論文検索GPTs6選+純正ブラウジング(Bing)の比較 マルチモーダルLLM時代のベンチマークから見たGPT-4VとGeminiの比較 Power Query でクエリを関数化する方法 KARAKURI LM を ELYZA-…

2024年2月12日の週に気になった記事などまとめ

Google Colab で LLM-jp 13B v1.1 を試す 大規模言語モデルの構築の事前学習に使えそうなデータセット(主に日本語系)の整理メモ Top Evaluation Metrics for RAG Failures Agent AI: Surveying the Horizons of Multimodal Interaction Self-Discover: Large…

2024年2月5日の週に気になった記事などまとめ

HuggingChat: ローカルLLM用モデルを試せて、アシスタントも作れるサイト GPT4-Vで構成図からIaCコードを生成させる Metaなどの研究者らが、LLMが自分自身に報酬を与える「自己報酬言語モデル」を開発 アナリティクスエンジニアのキャリアとデータモデ…

2024年1月29日の週に気になった記事などまとめ

MM-LLMs: Recent Advances in MultiModal Large Language Models google/siglip-base-patch16-256-multilingual を使って、ローカルの画像を日本語で検索してみる LangCheckでLLMの回答を自動評価する OpenAIの新embeddings,text-embedding-3-smallをRAGタス…

2024年1月22日の週に気になった記事などまとめ

GoogleのマルチモーダルAI「Gemini Pro Vision」は、動画についてどこまで正しく答えられるか? NTT、少ないデータから特定個人の声や口調を再現する技術を開発。大規模言語モデル「tsuzumi」に搭載 A Cheat Sheet and Some Recipes For Building Advanced R…

2024年1月15日の週に気になった記事などまとめ

Self-Extendでfine-tuningせずに長文コンテキストを扱おう AIと著作権に関する考え方について(素案)令和6年1月15日時点版 Survey of Vector Database Management Systems LLMにおける情報抽出(文章から必要な事柄を読み取る)タスクについての調査 コスト…

2024年1月8日の週に気になった記事などまとめ

Advanced RAG Techniques: an Illustrated Overview Retrieval-Augmented Generation (RAG):Paradigms, Technologies, and Trends プロンプトの原則26ヶ条をまとめた報告 LangChain v0.1.0 社長(AI)に頼んで今度こそ商用利用可能な日本語マルチターン会話デ…

2024年1月1日の週に気になった記事などまとめ

元旦なので社長(AI)にElyza13Bを使ってクリーンで自由な会話データセットを作ってもらってみた Large Language Models for Generative Information Extraction: A Survey OpenAI Assistants APIを使って社内用GPTsを作った際に苦労した5つの点 Google Colab …

Llama.cppをGPUを使用して実行してみた

LLM

llama-cpp-pythonをGPUも活用して実行してみたので、 動かし方をメモ ポイント GPUを使うために環境変数に以下をセットする CMAKE_ARGS="-DLLAMA_CUBLAS=on" FORCE_CMAKE=1 n_gpu_layersにGPUにオフロードされるモデルのレイヤー数を設定。7Bは32、13Bは40が…

日本語ローカルLLMまとめ※作成中

日本語ローカルLLMの情報をこの記事にまとめ中です。 ※2023年10月31日現在の情報を記入したつもりですが、正確性は保証できません。 まとめ lightblue/karasu-7B-chat-plus-unleashed lightblue/qarasu-14B-chat-plus-unleashed rinna/nekomata-14b-instruct…

プロンプト26の原則の日本語訳メモ

LLM

以下の論文の26の原則の日本語訳のメモ arxiv.org ※日本語訳を作成する際にChatGPTを活用してます。 番号 プロンプト原則 1 LLMに対して礼儀正しくする必要はない。「お願いします」、「差し支えなければ」、「ありがとう」、「私は...したいです」などのフ…

2023年ふりかえり

取得した資格 Azure AWS まとめ 読んだ本 検索システム 自然言語処理基礎 生成AI読み物 LangChainの使い方 Azure OpenAI Service LLM活用事例 生成AIの法的リスク その他機械学習 その他 まとめ 自己啓発のためにやったこと 来年意識すること 取得した資格 A…