2024年3月25日の週に気になった記事などまとめ - SEが最近起こったことを書くブログ

退屈な論文調査はAIにやらせよう ― arXivとChemRxivからの論文自動抽出&要約LLM: PaperBot君の紹介
NLP2024に参加してきました！
Google Colab で EvoLLM-JP を試す
Google Colab で RakutenAI-7B を試す
MetaGPTを動かしてみた
Generative AI for Beginners (Version 2) - A Course
#24 JAWS-UG主催週刊AWSキャッチアップ（2024/03/18週）
LangChainを使って自然言語でRDBからデータを取得する
動画生成AI「Sora」のオープンソース版「Open-Sora 1.0」公開、AI同士を掛け合わせて高品質なAIを自律的に生み出す手法など重要論文5本を解説（生成AIウィークリー）
HuggingFaceとDeepSpeedで実践継続事前学習
Azureコストは水道代/The_47th_Tokyo_Jazug
Evolutionary Optimization of Model Merging Recipes
事例から見るプロダクトでの生成 AI 活用のポイント
RAGの新しい手法「CRAG」を3分で理解する
Rakuten/RakutenAI-7B-chat を試してみる　~ Gradioつかって
Gemini for Google Workspace の使い方
AIOS: LLM Agent Operating System
コミュニティと共に生きる - キャリアの螺旋 / live with community
OpenAI Sora に使われる技術
ローカルLLMでAlpacaデータのようなインストラクションデータを自動生成してみた
10b程度のモデルをファインチューニングする日記 (逐次更新)
複数の LLM モデルを扱う上で直面した辛みまとめ
Open Interpreter Dockerで手軽に Claude 3 Haiku を使おう
大規模言語モデルはエリート就活生を超えるか
7-methods-to-secure-llm-apps-from-prompt-injections-and-jailbreaks
AWSのLambdaってなんやねん
ろんJ 実況～論文をなんJ風に解説＆実況～
クレディセゾンでDXを進めてきた5年間を振り返る
Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3
Optimizing database performance: Changing partition keys of a container in Azure Cosmos DB for NoSQL API (preview)
データ品質をコード化！ LINEヤフーのMLOpsを最適化する "ACP Data Quality" の紹介
みなさん、データのメタデータ管理ってどうやってますか？ #datatech-jp レポート
LoRAよりいいらしいLISA
LMFlowによる日本語LISAトレーニング#1
[03/23~03/29] LLM Weekly News
技術ブログを書く理由と、書き方を考える
中学生でもわかる深層学習
「AIが仕事を奪う」は人を過小評価している。芥川賞作家・九段理江と東大AI研究者が語る、人類の未来
大規模言語モデルの出力を技術的観点から考える
LLMの現在
大規模言語モデル開発のための日本語 Instruction データセット作成の取り組み
放射線分野の問題をLLMに解かせてみた
”わからない”との向き合い方
事業貢献のために情シスがやった業務改善の取り組み
HIKAKINやかまいたちも絶賛、おしゃべりAI「Cotomo」　自然な会話はどう実現？　創業者に聞く
LLMに医療知識をつけるには
商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当､GPT3.5やClaude v2を一部凌駕, 23/3/30時点】
いま必要なのは「ゆるやかな組織変革」？「もったいない」から始める、前向きなカルチャー変革のアプローチ
AI × 図書館ハッカソン@長岡 ScanSnapを活用し蔵書データから「知能」を創る、“世界初”のAIハッカソン
Voice Engine の概要
LangChainとは？各モジュールの機能と活用事例まとめ
Markdown ファイルをレベル別にチャンキングしてトークン数を確認するスクリプト
BitNetにおけるSTE(Straight-Through Estimator)の実装
DBRXのご紹介: 新たなSOTAオープンLLM
マルチモーダルLLMがもたらすビジネス革新と技術解説

退屈な論文調査はAIにやらせよう ― arXivとChemRxivからの論文自動抽出&要約LLM: PaperBot君の紹介

note.com

著者・雑誌名・公開年・論文名・論文名(日本語)・キーワード・PDFへのリンク・SciRateを出力する

NLP2024に参加してきました！

moneyforward-dev.jp

GPT-4は数値情報・固有名詞が含まれていると内容の妥当性にかかわらず高評価を与える傾向がある

Microsoftが公開している生成AIアプリ開発用教材

#24 JAWS-UG主催週刊AWSキャッチアップ（2024/03/18週）

speakerdeck.com

LangChainを使って自然言語でRDBからデータを取得する

note.com

動画生成AI「Sora」のオープンソース版「Open-Sora 1.0」公開、AI同士を掛け合わせて高品質なAIを自律的に生み出す手法など重要論文5本を解説（生成AIウィークリー）

www.techno-edge.net

HuggingFaceとDeepSpeedで実践継続事前学習

zenn.dev

Azureコストは水道代/The_47th_Tokyo_Jazug

speakerdeck.com

Evolutionary Optimization of Model Merging Recipes

speakerdeck.com

進化的モデルマージの紹介スライド

事例から見るプロダクトでの生成 AI 活用のポイント

speakerdeck.com

売上拡大のほうがコスト削減の3倍効率が良い
使用頻度が高く効果が高いユースケースに注目する

RAGの新しい手法「CRAG」を3分で理解する

zenn.dev

CRAGｗ使うとハルシネーションを減らすことができる
ＲＡＧで取得したドキュメントをLLMに渡す前にドキュメントの内容が正しいものかを自動でチェックする機能を持つ
検索評価モデルで検索品質の判定する

Rakuten/RakutenAI-7B-chat を試してみる　~ Gradioつかって

note.com

Hugging Faceｂに書いてあるサンプルコードを無視したChatTemplaeteでうまくいった

Gemini for Google Workspace の使い方

note.com

AIOS: LLM Agent Operating System

arxiv.org

日本語での解説記事
- hamaruki.com

コミュニティと共に生きる - キャリアの螺旋 / live with community

speakerdeck.com

自ら接触機会を増やし、チャンスの機会を増やす

OpenAI Sora に使われる技術

zenn.dev

ローカルLLMでAlpacaデータのようなインストラクションデータを自動生成してみた

qiita.com

gemma-7b-itを用いてデータ生成した記事
生成したデータで学習したモデルとStanford AlpacaとAlpaca-LoRAを比較したところ、プログラムを作成するタスクはうまく学習できなかった

10b程度のモデルをファインチューニングする日記 (逐次更新)

note.com

jasterデータセットでファインチューニングしたモデルがベンチマーク上の性能が良かった
データ量は1万件ぐらいあったほうがよい
学習率は1e-5あたりに最適値がありそう

複数の LLM モデルを扱う上で直面した辛みまとめ

speakerdeck.com

モデルを変えるときリグレッションは確実に起こる

Open Interpreter Dockerで手軽に Claude 3 Haiku を使おう

hamaruki.com

大規模言語モデルはエリート就活生を超えるか

zenn.dev

学習データに含まれていないと思われる論理問題をClaude3とGPT-4に出して、回答を比較した問題

7-methods-to-secure-llm-apps-from-prompt-injections-and-jailbreaks

mlops.community

プロンプトインジェクションや脱獄からLLMを守る7つの方法

AWSのLambdaってなんやねん

zenn.dev

ろんJ 実況～論文をなんJ風に解説＆実況～

hamaruki.com

アップロードした論文の内容を、あの有名な２ちゃんねるの「なんでも実況J」（通称：なんJ）のスレッド風に解説・実況してくれるサービスを紹介した記事
ツールのGitHubリポジトリ
- github.com

クレディセゾンでDXを進めてきた5年間を振り返る

note.com

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3

speakerdeck.com

Optimizing database performance: Changing partition keys of a container in Azure Cosmos DB for NoSQL API (preview)

devblogs.microsoft.com

データ品質をコード化！ LINEヤフーのMLOpsを最適化する "ACP Data Quality" の紹介

speakerdeck.com

みなさん、データのメタデータ管理ってどうやってますか？ #datatech-jp レポート

note.com

LoRAよりいいらしいLISA

note.com

LMFlowによる日本語LISAトレーニング#1

www.free-ai.ltd

LISAはメモリ消費がLoRAと同等に低く、なおかつパフォーマンスはフルパラメータのファインチューニングに匹敵もしくは上回る効果を持つ

[03/23~03/29] LLM Weekly News

note.com

技術ブログを書く理由と、書き方を考える

www.wantedly.com

ブログ執筆で業務の一石二鳥や三鳥を狙う

中学生でもわかる深層学習

speakerdeck.com

「AIが仕事を奪う」は人を過小評価している。芥川賞作家・九段理江と東大AI研究者が語る、人類の未来

www.cinra.net

大規模言語モデルの出力を技術的観点から考える

speakerdeck.com

LLMの現在

speakerdeck.com

深層学習時代から学習に使う計算量が2年ごとに100倍になっている
AI関連資金調達の半分近くが生成AIに
高品質なデータセットは100倍以上の価値
Chinchilla則
- 計算資源が限られている場合は、パラメータ数の20倍のデータを用意するのが最適
温度を下げると人間が書く文章と乖離する

大規模言語モデル開発のための日本語 Instruction データセット作成の取り組み

speakerdeck.com

放射線分野の問題をLLMに解かせてみた

speakerdeck.com

”わからない”との向き合い方

tech.nri-net.com

事業貢献のために情シスがやった業務改善の取り組み

note.com

HIKAKINやかまいたちも絶賛、おしゃべりAI「Cotomo」　自然な会話はどう実現？　創業者に聞く

www.itmedia.co.jp

LLMに医療知識をつけるには

speakerdeck.com

商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当､GPT3.5やClaude v2を一部凌駕, 23/3/30時点】

note.com

いま必要なのは「ゆるやかな組織変革」？「もったいない」から始める、前向きなカルチャー変革のアプローチ

note.com

AI × 図書館ハッカソン@長岡 ScanSnapを活用し蔵書データから「知能」を創る、“世界初”のAIハッカソン

www.pfu.ricoh.com

Voice Engine の概要

note.com

LangChainとは？各モジュールの機能と活用事例まとめ

book.st-hakky.com

Markdown ファイルをレベル別にチャンキングしてトークン数を確認するスクリプト

zenn.dev

BitNetにおけるSTE(Straight-Through Estimator)の実装

note.com

DBRXのご紹介: 新たなSOTAオープンLLM

qiita.com

マルチモーダルLLMがもたらすビジネス革新と技術解説

speakerdeck.com

トレンド
- コネクタの簡素化

退屈な論文調査はAIにやらせよう ― arXivとChemRxivからの論文自動抽出&要約LLM: PaperBot君の紹介

NLP2024に参加してきました！

Google Colab で EvoLLM-JP を試す

Google Colab で RakutenAI-7B を試す

MetaGPTを動かしてみた

Generative AI for Beginners (Version 2) - A Course

#24 JAWS-UG主催 週刊AWSキャッチアップ（2024/03/18週）

LangChainを使って自然言語でRDBからデータを取得する

動画生成AI「Sora」のオープンソース版「Open-Sora 1.0」公開、AI同士を掛け合わせて高品質なAIを自律的に生み出す手法など重要論文5本を解説（生成AIウィークリー）

HuggingFaceとDeepSpeedで実践継続事前学習

Azureコストは水道代/The_47th_Tokyo_Jazug

Evolutionary Optimization of Model Merging Recipes

事例から見るプロダクトでの生成 AI 活用のポイント

RAGの新しい手法「CRAG」を3分で理解する

Rakuten/RakutenAI-7B-chat を試してみる ~ Gradioつかって

Gemini for Google Workspace の使い方

AIOS: LLM Agent Operating System

コミュニティと共に生きる - キャリアの螺旋 / live with community

OpenAI Sora に使われる技術

ローカルLLMでAlpacaデータのようなインストラクションデータを自動生成してみた

10b程度のモデルをファインチューニングする日記 (逐次更新)

複数の LLM モデルを扱う上で直面した辛みまとめ

Open Interpreter Dockerで手軽に Claude 3 Haiku を使おう

大規模言語モデルはエリート就活生を超えるか

7-methods-to-secure-llm-apps-from-prompt-injections-and-jailbreaks

AWSのLambdaってなんやねん

ろんJ 実況～論文をなんJ風に解説＆実況～

クレディセゾンでDXを進めてきた5年間を振り返る

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3

Optimizing database performance: Changing partition keys of a container in Azure Cosmos DB for NoSQL API (preview)

データ品質をコード化！ LINEヤフーのMLOpsを最適化する "ACP Data Quality" の紹介

みなさん、データのメタデータ管理ってどうやってますか？ #datatech-jp レポート

LoRAよりいいらしいLISA

LMFlowによる日本語LISAトレーニング#1

[03/23~03/29] LLM Weekly News

技術ブログを書く理由と、書き方を考える

中学生でもわかる深層学習

「AIが仕事を奪う」は人を過小評価している。芥川賞作家・九段理江と東大AI研究者が語る、人類の未来

大規模言語モデルの出力を技術的観点から考える

LLMの現在

大規模言語モデル開発のための日本語 Instruction データセット作成の取り組み

放射線分野の問題をLLMに解かせてみた

”わからない”との向き合い方

事業貢献のために情シスがやった業務改善の取り組み

HIKAKINやかまいたちも絶賛、おしゃべりAI「Cotomo」 自然な会話はどう実現？ 創業者に聞く

LLMに医療知識をつけるには

商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開 【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当､GPT3.5やClaude v2を一部凌駕, 23/3/30時点】

いま必要なのは「ゆるやかな組織変革」？「もったいない」から始める、前向きなカルチャー変革のアプローチ

AI × 図書館ハッカソン@長岡 ScanSnapを活用し蔵書データから「知能」を創る、“世界初”のAIハッカソン

Voice Engine の概要

LangChainとは？各モジュールの機能と活用事例まとめ

Markdown ファイルをレベル別にチャンキングしてトークン数を確認するスクリプト

BitNetにおけるSTE(Straight-Through Estimator)の実装

DBRXのご紹介: 新たなSOTAオープンLLM

マルチモーダルLLMがもたらすビジネス革新と技術解説

#24 JAWS-UG主催週刊AWSキャッチアップ（2024/03/18週）

Rakuten/RakutenAI-7B-chat を試してみる　~ Gradioつかって

HIKAKINやかまいたちも絶賛、おしゃべりAI「Cotomo」　自然な会話はどう実現？　創業者に聞く

商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当､GPT3.5やClaude v2を一部凌駕, 23/3/30時点】