SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年4月29日の週に気になった記事などまとめ

Arxiv RAGによる論文サーベイの自動生成

blog.shikoan.com

  • Arxivの検索APIとLLMを統合し、作成した論文サーベイの自動生成ツールを紹介する記事
  • Embeddingに対して巡回セールスマン問題を解いてソートかける

mergekit-evolve のパラメータまとめ

note.com

  • 「mergekit-evolve」は、進化的アルゴリズム (CMA-ES) を使用して、モデル メトリックに対してマージのパラメータを最適化するスクリプト

Best Practices and Lessons Learned on Synthetic Data for Language Models

arxiv.org

複数の企業でデータエンジニアとして求められたスキル

www.yasuhisay.info

  • セキュリティや法令に関する知識を持って置き、必要に応じて専門家に相談できる知識を持っておく

Continual Pre-Training for Cross-Lingual LLM Adaptation: Enhancing Japanese Language Capabilities

arxiv.org

  • Swallowの継続事前学習の論文

大規模言語モデル「LLM-jp-13B v2.0」を構築~NII主宰LLM勉強会(LLM-jp)が「LLM-jp-13B」の 後続モデルとその構築に使用した全リソースを公開~

www.nii.ac.jp

ローカルLLMを手軽に楽しむ

zenn.dev

  • OllamaとOpen WebUIを使ってローカルLLMを簡単に動かす方法を紹介した記事

謎の高性能AIモデル「gpt2-chatbot」がChatbot Arenaに登場、GPT-4.5かGPT-5なのではないかと話題に

gigazine.net

iOSAndroid の ローカルLLM実行環境まとめ

note.com

Cohere の Command R/R+ において 128k input tokens は短いのか長いのか

qiita.com

  • Claudeよりもトークン数を節約できる

mistralモデルをベースとした 日本語の大規模言語モデル

www.docswell.com

  • 事前学習用のコーパスクリーニングツールをC++で作成した

rinnaのllama-3-youko-8bを試す。

note.com

Raspberry Pi(ラズパイ)のローカル環境でLLMを動かす

zenn.dev

  • ラズパイ5でollamaを使ってLLMを動かした記事

KAN: Kolmogorov-Arnold Networks

arxiv.org

  • MLPの代替手段としてKANを提案した論文

Spiral.AI、Transformerの限界を克服した次世代LLMアーキテクチャ「RetNet」の学習済みモデルを公開

prtimes.jp

  • 30億パラメータ級のモデルを公開した
  • 公開されたのはベースモデル

Announcing the General Availability of GPT-4 Turbo with Vision on Azure OpenAI Service

techcommunity.microsoft.com

  • Azure OpenAI Serviceで「gpt-4-turbo-2024-04-09」を利用可能となった
  • Vision Enhancements機能はまだ利用できない
  • 画像入力でのJSONモードやFunction Callingは数週間後から利用可能となる

Langfuse

langfuse.com

  • OSS版のLangSmithのようなソフトウェア
  • Dockerを活用したセルフホストもできる

RAGの評価:評価の必要性と問題点

tech.beatrust.com

  • GPT4はタスク内での相対的な評価が苦手

RAGの評価:Ragasの有用性の評価

tech.beatrust.com

  • Regasは英語のデータのほうが評価能力が高い
  • e2eではLangChainのCorrectnessよりも、Regasのほうが相関係数が高かった
  • text-embedding-ada-002ではどんなに似てなくても0.6までしかコサイン類似度が下がらない

[04/27~05/02] 生成AI Weekly News

note.com

GAIA-1: 自動運転のための世界モデルを理解する

zenn.dev

  • GAIA-1は動画やテキスト、アクションに関する情報を元に未来のリアルな動画を生成できる
    • 動画の途中からその続きを生成できる

過学習(過剰適合)のはなし

tjo.hatenablog.com

  • 過学習とは統計的学習モデルをデータに対して当てはめる際に真のシグナルどころかノイズにまで当てはまってしまい、かえってモデルの予測精度が低下すること

専門性の高いデータの読み解きをLLMでスケールさせよう

developers.cyberagent.co.jp

  • 以下の3パートにプロンプト上でタスクを分解し実現する
    • 表形式のデータを言語化する
      • JSONデータを言語に起こす
    • 言語化されたデータを専門性に基づいて読み解き、データが示す意味を言語化した文章の集合とする
      • 専門知識の埋め込みは、プロンプトやone-shotなど様々な方法がある
    • 読み解かれたデータの解釈

NeurIPS-23 参加報告 + DPO 解説

speakerdeck.com

Agents for Amazon Bedrock で Webサイトにチャットボット機能を足してみる

zenn.dev

  • Agents for Amazon Bedrockを使って簡単にwebサイトを構築した記事
  • Agentに知識を追加するためにKnowledge Baseを利用した

Amazon Kendra と Amazon Bedrock で構成した RAG システムに対する Advanced RAG 手法の精度寄与検証

aws.amazon.com

  • Claude3 Haikuを利用してクエリ拡張した
  • 取得した検索結果がユーザーからの質問に関連しているかをClaude3 Haikuで確認した
  • クエリ拡張は回答の質向上に貢献した

Tavily APIの精度を上げるコツ

zenn.dev

-search_depthでフォローアップクエスチョンが表示される

CloudGoat

github.com

  • CTF形式のシナリオで学習に利用できる脆弱なAWS導入ツール

Dify の ワークフロー の概要

note.com

  • ChatflowとWorkflowで同じノードでも違いがある

ローカルLLMはこーやって使うの💢

gist.github.com

  • ローカルLLMだから可能な言語モデルの機能を紹介するGoogle Colabのノートブック