SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年3月25日の週に気になった記事などまとめ

退屈な論文調査はAIにやらせよう ― arXivとChemRxivからの論文自動抽出&要約LLM: PaperBot君の紹介

note.com

  • 著者・雑誌名・公開年・論文名・論文名(日本語)・キーワード・PDFへのリンク・SciRateを出力する

NLP2024に参加してきました!

moneyforward-dev.jp

  • GPT-4は数値情報・固有名詞が含まれていると内容の妥当性にかかわらず高評価を与える傾向がある

Google Colab で EvoLLM-JP を試す

note.com

Google Colab で RakutenAI-7B を試す

note.com

MetaGPTを動かしてみた

zenn.dev

Generative AI for Beginners (Version 2) - A Course

microsoft.github.io

  • Microsoftが公開している生成AIアプリ開発用教材

#24 JAWS-UG主催 週刊AWSキャッチアップ(2024/03/18週)

speakerdeck.com

LangChainを使って自然言語RDBからデータを取得する

note.com

動画生成AI「Sora」のオープンソース版「Open-Sora 1.0」公開、AI同士を掛け合わせて高品質なAIを自律的に生み出す手法など重要論文5本を解説(生成AIウィークリー)

www.techno-edge.net

HuggingFaceとDeepSpeedで実践継続事前学習

zenn.dev

Azureコストは水道代/The_47th_Tokyo_Jazug

speakerdeck.com

Evolutionary Optimization of Model Merging Recipes

speakerdeck.com

  • 進化的モデルマージの紹介スライド

事例から見るプロダクトでの生成 AI 活用のポイント

speakerdeck.com

  • 売上拡大のほうがコスト削減の3倍効率が良い
  • 使用頻度が高く効果が高いユースケースに注目する

RAGの新しい手法「CRAG」を3分で理解する

zenn.dev

  • CRAGw使うとハルシネーションを減らすことができる
  • RAGで取得したドキュメントをLLMに渡す前にドキュメントの内容が正しいものかを自動でチェックする機能を持つ
  • 検索評価モデルで検索品質の判定する

Rakuten/RakutenAI-7B-chat を試してみる ~ Gradioつかって

note.com

  • Hugging Facebに書いてあるサンプルコードを無視したChatTemplaeteでうまくいった

Gemini for Google Workspace の使い方

note.com

AIOS: LLM Agent Operating System

arxiv.org

コミュニティと共に生きる - キャリアの螺旋 / live with community

speakerdeck.com

  • 自ら接触機会を増やし、チャンスの機会を増やす

OpenAI Sora に使われる技術

zenn.dev

ローカルLLMでAlpacaデータのようなインストラクションデータを自動生成してみた

qiita.com

  • gemma-7b-itを用いてデータ生成した記事
  • 生成したデータで学習したモデルとStanford AlpacaとAlpaca-LoRAを比較したところ、プログラムを作成するタスクはうまく学習できなかった

10b程度のモデルをファインチューニングする日記 (逐次更新)

note.com

  • jasterデータセットでファインチューニングしたモデルがベンチマーク上の性能が良かった
  • データ量は1万件ぐらいあったほうがよい
  • 学習率は1e-5あたりに最適値がありそう

複数の LLM モデルを扱う上で直面した辛みまとめ

speakerdeck.com

Open Interpreter Dockerで手軽に Claude 3 Haiku を使おう

hamaruki.com

大規模言語モデルはエリート就活生を超えるか

zenn.dev

  • 学習データに含まれていないと思われる論理問題をClaude3とGPT-4に出して、回答を比較した問題

7-methods-to-secure-llm-apps-from-prompt-injections-and-jailbreaks

mlops.community

  • プロンプトインジェクションや脱獄からLLMを守る7つの方法

AWSのLambdaってなんやねん

zenn.dev

ろんJ 実況~論文をなんJ風に解説&実況~

hamaruki.com

  • アップロードした論文の内容を、あの有名な2ちゃんねるの「なんでも実況J」(通称:なんJ)のスレッド風に解説・実況してくれるサービスを紹介した記事
  • ツールのGitHubリポジトリ

クレディセゾンでDXを進めてきた5年間を振り返る

note.com

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3

speakerdeck.com

Optimizing database performance: Changing partition keys of a container in Azure Cosmos DB for NoSQL API (preview)

devblogs.microsoft.com

データ品質をコード化! LINEヤフーのMLOpsを最適化する "ACP Data Quality" の紹介

speakerdeck.com

みなさん、データのメタデータ管理ってどうやってますか? #datatech-jp レポート

note.com

LoRAよりいいらしいLISA

note.com

LMFlowによる日本語LISAトレーニング#1

www.free-ai.ltd

  • LISAはメモリ消費がLoRAと同等に低く、なおかつパフォーマンスはフルパラメータのファインチューニングに匹敵もしくは上回る効果を持つ

[03/23~03/29] LLM Weekly News

note.com

技術ブログを書く理由と、書き方を考える

www.wantedly.com

  • ブログ執筆で業務の一石二鳥や三鳥を狙う

中学生でもわかる深層学習

speakerdeck.com

「AIが仕事を奪う」は人を過小評価している。芥川賞作家・九段理江と東大AI研究者が語る、人類の未来

www.cinra.net

大規模言語モデルの出力を技術的観点から考える

speakerdeck.com

LLMの現在

speakerdeck.com

  • 深層学習時代から学習に使う計算量が2年ごとに100倍になっている
  • AI関連資金調達の半分近くが生成AIに
  • 高品質なデータセットは100倍以上の価値
  • Chinchilla則
    • 計算資源が限られている場合は、パラメータ数の20倍のデータを用意するのが最適
  • 温度を下げると人間が書く文章と乖離する

大規模言語モデル開発のための日本語 Instruction データセット作成の取り組み

speakerdeck.com

放射線分野の問題をLLMに解かせてみた

speakerdeck.com

”わからない”との向き合い方

tech.nri-net.com

事業貢献のために情シスがやった業務改善の取り組み

note.com

HIKAKINやかまいたちも絶賛、おしゃべりAI「Cotomo」 自然な会話はどう実現? 創業者に聞く

www.itmedia.co.jp

LLMに医療知識をつけるには

speakerdeck.com

商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開 【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当、GPT3.5やClaude v2を一部凌駕, 23/3/30時点】

note.com

いま必要なのは「ゆるやかな組織変革」?「もったいない」から始める、前向きなカルチャー変革のアプローチ

note.com

AI × 図書館ハッカソン@長岡 ScanSnapを活用し蔵書データから「知能」を創る、“世界初”のAIハッカソン

www.pfu.ricoh.com

Voice Engine の概要

note.com

LangChainとは?各モジュールの機能と活用事例まとめ

book.st-hakky.com

Markdown ファイルをレベル別にチャンキングしてトークン数を確認するスクリプト

zenn.dev

BitNetにおけるSTE(Straight-Through Estimator)の実装

note.com

DBRXのご紹介: 新たなSOTAオープンLLM

qiita.com

マルチモーダルLLMがもたらすビジネス革新と技術解説

speakerdeck.com

  • トレンド
    • コネクタの簡素化