2024年4月29日の週に気になった記事などまとめ - SEが最近起こったことを書くブログ

以下の3パートにプロンプト上でタスクを分解し実現する
- 表形式のデータを言語化する
  - JSONデータを言語に起こす
- 言語化されたデータを専門性に基づいて読み解き、データが示す意味を言語化した文章の集合とする
  - 専門知識の埋め込みは、プロンプトやone-shotなど様々な方法がある
- 読み解かれたデータの解釈

NeurIPS-23 参加報告 + DPO 解説

speakerdeck.com

Agents for Amazon Bedrock で Webサイトにチャットボット機能を足してみる

zenn.dev

Agents for Amazon Bedrockを使って簡単にwebサイトを構築した記事
Agentに知識を追加するためにKnowledge Baseを利用した

Amazon Kendra と Amazon Bedrock で構成した RAG システムに対する Advanced RAG 手法の精度寄与検証

aws.amazon.com

Claude3 Haikuを利用してクエリ拡張した
取得した検索結果がユーザーからの質問に関連しているかをClaude3 Haikuで確認した
クエリ拡張は回答の質向上に貢献した

Tavily APIの精度を上げるコツ

zenn.dev

-search_depthでフォローアップクエスチョンが表示される

CloudGoat

github.com

CTF形式のシナリオで学習に利用できる脆弱なAWS導入ツール

Dify のワークフローの概要

note.com

ChatflowとWorkflowで同じノードでも違いがある

ローカルLLMはこーやって使うの💢

gist.github.com

ローカルLLMだから可能な言語モデルの機能を紹介するGoogle Colabのノートブック

Arxiv RAGによる論文サーベイの自動生成

mergekit-evolve のパラメータまとめ

Best Practices and Lessons Learned on Synthetic Data for Language Models

複数の企業でデータエンジニアとして求められたスキル

Continual Pre-Training for Cross-Lingual LLM Adaptation: Enhancing Japanese Language Capabilities

大規模言語モデル「LLM-jp-13B v2.0」を構築～NII主宰LLM勉強会（LLM-jp）が「LLM-jp-13B」の 後続モデルとその構築に使用した全リソースを公開～

ローカルLLMを手軽に楽しむ

謎の高性能AIモデル「gpt2-chatbot」がChatbot Arenaに登場、GPT-4.5かGPT-5なのではないかと話題に

iOS・Android の ローカルLLM実行環境まとめ

Cohere の Command R/R+ において 128k input tokens は短いのか長いのか

mistralモデルをベースとした 日本語の大規模言語モデル

rinnaのllama-3-youko-8bを試す。

Raspberry Pi（ラズパイ）のローカル環境でLLMを動かす

KAN: Kolmogorov-Arnold Networks

Spiral.AI、Transformerの限界を克服した次世代LLMアーキテクチャ「RetNet」の学習済みモデルを公開

Announcing the General Availability of GPT-4 Turbo with Vision on Azure OpenAI Service

Langfuse

RAGの評価：評価の必要性と問題点

RAGの評価：Ragasの有用性の評価

[04/27~05/02] 生成AI Weekly News

GAIA-1: 自動運転のための世界モデルを理解する

過学習（過剰適合）のはなし

専門性の高いデータの読み解きをLLMでスケールさせよう

NeurIPS-23 参加報告 + DPO 解説

Agents for Amazon Bedrock で Webサイトにチャットボット機能を足してみる

Amazon Kendra と Amazon Bedrock で構成した RAG システムに対する Advanced RAG 手法の精度寄与検証

Tavily APIの精度を上げるコツ

CloudGoat

Dify の ワークフロー の概要

ローカルLLMはこーやって使うの💢

大規模言語モデル「LLM-jp-13B v2.0」を構築～NII主宰LLM勉強会（LLM-jp）が「LLM-jp-13B」の後続モデルとその構築に使用した全リソースを公開～

iOS・Android のローカルLLM実行環境まとめ

mistralモデルをベースとした日本語の大規模言語モデル

Dify のワークフローの概要