SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年1月29日の週に気になった記事などまとめ

MM-LLMs: Recent Advances in MultiModal Large Language Models

arxiv.org

  • 最近のマルチモーダル大規模減モデルをまとめたサーベイ論文

google/siglip-base-patch16-256-multilingual を使って、ローカルの画像を日本語で検索してみる

note.com

LangCheckでLLMの回答を自動評価する

www.bioerrorlog.work

  • LLMのアウトプットを各評価関数に渡すと、メトリクスに従ってスコアが算出される

OpenAIの新embeddings,text-embedding-3-smallをRAGタスクで評価する

secon.dev 

  • Wikipedia Q&A の RAG タスクで評価した記事
  • text-embedding-3-smallの512次元より、multilingual-e5 シリーズの評価の方が高い

プロンプトの小さな違いがLLMにもたらすバタフライ効果を調査した結果

ai-data-base.com

  • 出力形式や小さなプロンプトの変更がどれほどLLMの応答に影響するのかを、大量のケーススタディで実験した結果が報告した論文を紹介した記事

生成AI新年会2024で「AIエージェントとLangChain」について話しました

note.com

GPT-4Vで設計図からプログラムを生成する

qiita.com

生成AIツール導入、その後事業価値を生み出すまでの話

speakerdeck.com

GPTsをMVPに使うアジャイルな社内LLMツール開発

speakerdeck.com

インストラクションデータ構築方法とデータ収集源

zenn.dev

弁護士目線で見た2024年の生成AIトレンド予測

speakerdeck.com

STABLECLIP,SIGLIPで自然言語な画像検索

docs.google.com

LangGraphで始めるマルチエージェントシステム

speakerdeck.com

Copilot for Microsoft 365 ぶっちゃけどうなの?_生成AI新年会@GMO Yours・フクラス

speakerdeck.com

オープンな日本語埋め込みモデルの選択肢

speakerdeck.com

  • SimCSE、GLuCoSE、JaColBERT、Multilingual-E5を比較したスライド

ローカルでLLMの推論を実行するのにOllamaがかわいい

zenn.dev

エンプラDXにおける2024年の生成AIトレンド予測 @生成AI新年会2024

speakerdeck.com

SameSite属性とCSRFとHSTS - Cookieの基礎知識からブラウザごとのエッジケースまでおさらいする

blog.flatt.tech

ラクリ、700億パラメーターLLM「KARAKURI LM」を一般公開

karakuri.ai

GitLabで学んだ最高の働き方Developers Summit 2022.02.18 2024.01.23 更新

learn.gitlab.com

既存機能の大規模リニューアルに着手し、途中でやめる意思決定をした

note.com

論文「RAG VS Fine-tuning」を読む

zenn.dev

APIOSS 、蓄積したデータで精度を改善するならどちらの基盤モデルを選択すべきか : 質問回答編

aws.amazon.com

大規模言語モデルへの化学的思考の教示と物性予測

www.docswell.com

2024年1月くらいのAWS最新情報ブログとかをキャッチアップする – AWSトレンドチェック勉強会用資料

dev.classmethod.jp

個人的に気になった内容 - [待望] CloudShell で Docker が利用可能になりました 5/56 - クラスメソッド データアナリティクス通信(機械学習編) – 2024年1月号 8/56 - クラスメソッド データアナリティクス通信(AWSデータ分析編) – 2024年1月号 #AWSreInvent 9/56 - 2024年にサポート終了が予告されているAWSサービスをまとめてみた 30/56

100社のコスト診断から見えてきた、コスト削減の王道とケモノ道

speakerdeck.com

節約は技術!削減は芸術!何より必要なものは覚悟!

speakerdeck.com

OpenAIとMicrosoft Graph Search APIでM365の組織内データを検索するRAGアプリを作る

zenn.dev

  • Microsoft SearchはM365テナント内のデータをユーザーに適した形で検索、提供してくれる機能
  • Microsoft SearchはGraph API経由で呼び出すことができる
    • Microsoft Graph コネクタを使うことで、M365外のデータを検索対象にすることもできる

AzureでRAGをガンガン試行錯誤してみて得たナレッジを紹介します!

speakerdeck.com

  • データの内容に冗長なものやノイズになるものが含まれている場合は要約してから取り込む

Llama.cpp で Karakuri LM を試す

note.com

kuromoji.js による 日本語形態素解析 を試す

note.com

日本ディープラーニング協会主催 NeurIPS 2023 技術報告会講演資料

speakerdeck.com

  • トレンド1:LLMをより人が好む回答へ
  • トレンド2:データの重要性について
  • トレンド3:モデルの社会的適合性を多面的評価
  • トレンド4:マルチモーダルモデルも同様
  • トレンド5:汎用的AIに向けて推論力を高めよう
  • トレンド6:他分野への応用
  • トレンド7:未解決現象の理論的解明

karakuri-lm-70b-chatをOpenAI互換のローカルサーバとして動かしてみた

qiita.com

  • karakuri-lm-70b-chatの4bit量子版ggufをローカルPCで動かしてみた記事
  • text-generation-webuiを利用して動かした

PyTorchチュートリアル(日本語翻訳版)

yutaroogawa.github.io

A decoder-only foundation model for time-series forecasting

blog.research.google

SegMoE: Segmind Mixture of Diffusion Experts の概要

note.com

Azure OpenAI Service REST API reference

learn.microsoft.com

  • 2023-09-01-preview以前のPreviewが2024-04-02に利用できなくなる予定

2024年のPythonプログラミング

tech.uzabase.com

WSL2でllama-cpp-pythonを試してみる

note.com