2024年3月11日の週に気になった記事などまとめ - SEが最近起こったことを書くブログ

LLaVA-BenchはVisual Instruction Tuningで提案された画像理解と会話能力をGPT4を利用して定量的に図るために提案されたベンチマーク
このベンチマークを使用することで会話、詳細な説明、複雑な推論の3つの能力をモデルが持っているか測定することができる
データセットには画像と質問とGPT4の回答が含まれる
GPT4の回答と性能を測定したいモデルの出力をGPT4に入力することでスコアを算出できる

Enabling and Analyzing How to Efficiently Extract Information from Hybrid Long Documents with LLMs

arxiv.org

表とテキストを両方含むドキュメントからLLMで情報抽出する方法が提案された

Prompt Tuning から Fine Tuning への移行時期推定

speakerdeck.com

APIは2件 Few-Shotまで、コスト効率や安定性に不満ならば30～200件用意して公開モデルのファインチューニングがおすすめされている

MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

arxiv.org

AppleがマルチモーダルLLMの構築について論文を出した

「生成AI」(3) 松尾豊・東京大学大学院教授　2024.3.15

www.youtube.com

データ分析基盤まとめ(随時更新)

zenn.dev

0.1-1B程度の日本語・大規模言語モデルを作る練習日記

Swallow on mistral

Swallow-MX: Mixtral日本語継続事前学習MoEモデル

Azure AI Searchを使ったマルチモーダルRAGの実現

LLMOpsを推進！Azure Log Analyticsを活用したLLMの継続的な監視と改善

Retrieval-Augmented Generation for AI-Generated Content: A Survey

NLP2024 チュートリアル３ 作って学ぶ日本語大規模言語モデル - 環境構築手順と実験ソースコード

izumi-lab/llm-japanese-dataset

Google Colab で Swallow MS 7B を試す

大規模言語モデルのフルスクラッチ作成の予習〜データセット取得、クリーニングまで〜

ML 駆動の検索エンジンで企業の情報管理を革新 !Amazon Kendra をグラレコで解説

Microsoft Fabric 開発ガイド

SharePoint の共有リンクの仕組み

Table TransformerとGPT-4Vを用いたPDF内の表の解析

Stealing Part of a Production Language Model

Chain-of-table: Evolving tables in the reasoning chain for table understanding

JLR2024 プログラム 日本語言語資源の構築と利用性の向上

LLM学習用QAデータセットの自動構築手法の提案

RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation

700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、デモを公開しました

Llama.cpp で Swallow MX 8x7B を試す

OWASP Top 10 for LLM を活用した生成 AI アプリケーションの多層防御セキュリティ設計

今日から始めるChatGPT+Zapierで雑パーソナライズ情報収集

LangGraphのグラフ可視化機能で複雑なタスクの流れを一目で把握

世界初？Claude3を使った動画解析 - claude3-video-analyzer

RealPersonaChat

Claude 3 Haiku の概要

Artificial Intelligence Controller Interface (AICI)

LLM

Access to the most powerful Anthropic AI models begins today on Amazon Bedrock

GPT4を使用したVision&Languageモデルの評価手法LLaVA-Benchを試す

Enabling and Analyzing How to Efficiently Extract Information from Hybrid Long Documents with LLMs

Prompt Tuning から Fine Tuning への移行時期推定

MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

「生成AI」(3) 松尾豊・東京大学大学院教授 2024.3.15

データ分析基盤まとめ(随時更新)

NLP2024 チュートリアル３作って学ぶ日本語大規模言語モデル - 環境構築手順と実験ソースコード

JLR2024 プログラム日本語言語資源の構築と利用性の向上

「生成AI」(3) 松尾豊・東京大学大学院教授　2024.3.15