- 退屈な論文調査はAIにやらせよう ― arXivとChemRxivからの論文自動抽出&要約LLM: PaperBot君の紹介
- NLP2024に参加してきました!
- Google Colab で EvoLLM-JP を試す
- Google Colab で RakutenAI-7B を試す
- MetaGPTを動かしてみた
- Generative AI for Beginners (Version 2) - A Course
- #24 JAWS-UG主催 週刊AWSキャッチアップ(2024/03/18週)
- LangChainを使って自然言語でRDBからデータを取得する
- 動画生成AI「Sora」のオープンソース版「Open-Sora 1.0」公開、AI同士を掛け合わせて高品質なAIを自律的に生み出す手法など重要論文5本を解説(生成AIウィークリー)
- HuggingFaceとDeepSpeedで実践継続事前学習
- Azureコストは水道代/The_47th_Tokyo_Jazug
- Evolutionary Optimization of Model Merging Recipes
- 事例から見るプロダクトでの生成 AI 活用のポイント
- RAGの新しい手法「CRAG」を3分で理解する
- Rakuten/RakutenAI-7B-chat を試してみる ~ Gradioつかって
- Gemini for Google Workspace の使い方
- AIOS: LLM Agent Operating System
- コミュニティと共に生きる - キャリアの螺旋 / live with community
- OpenAI Sora に使われる技術
- ローカルLLMでAlpacaデータのようなインストラクションデータを自動生成してみた
- 10b程度のモデルをファインチューニングする日記 (逐次更新)
- 複数の LLM モデルを扱う上で直面した辛みまとめ
- Open Interpreter Dockerで手軽に Claude 3 Haiku を使おう
- 大規模言語モデルはエリート就活生を超えるか
- 7-methods-to-secure-llm-apps-from-prompt-injections-and-jailbreaks
- AWSのLambdaってなんやねん
- ろんJ 実況~論文をなんJ風に解説&実況~
- クレディセゾンでDXを進めてきた5年間を振り返る
- Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3
- Optimizing database performance: Changing partition keys of a container in Azure Cosmos DB for NoSQL API (preview)
- データ品質をコード化! LINEヤフーのMLOpsを最適化する "ACP Data Quality" の紹介
- みなさん、データのメタデータ管理ってどうやってますか? #datatech-jp レポート
- LoRAよりいいらしいLISA
- LMFlowによる日本語LISAトレーニング#1
- [03/23~03/29] LLM Weekly News
- 技術ブログを書く理由と、書き方を考える
- 中学生でもわかる深層学習
- 「AIが仕事を奪う」は人を過小評価している。芥川賞作家・九段理江と東大AI研究者が語る、人類の未来
- 大規模言語モデルの出力を技術的観点から考える
- LLMの現在
- 大規模言語モデル開発のための日本語 Instruction データセット作成の取り組み
- 放射線分野の問題をLLMに解かせてみた
- ”わからない”との向き合い方
- 事業貢献のために情シスがやった業務改善の取り組み
- HIKAKINやかまいたちも絶賛、おしゃべりAI「Cotomo」 自然な会話はどう実現? 創業者に聞く
- LLMに医療知識をつけるには
- 商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開 【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当、GPT3.5やClaude v2を一部凌駕, 23/3/30時点】
- いま必要なのは「ゆるやかな組織変革」?「もったいない」から始める、前向きなカルチャー変革のアプローチ
- AI × 図書館ハッカソン@長岡 ScanSnapを活用し蔵書データから「知能」を創る、“世界初”のAIハッカソン
- Voice Engine の概要
- LangChainとは?各モジュールの機能と活用事例まとめ
- Markdown ファイルをレベル別にチャンキングしてトークン数を確認するスクリプト
- BitNetにおけるSTE(Straight-Through Estimator)の実装
- DBRXのご紹介: 新たなSOTAオープンLLM
- マルチモーダルLLMがもたらすビジネス革新と技術解説
退屈な論文調査はAIにやらせよう ― arXivとChemRxivからの論文自動抽出&要約LLM: PaperBot君の紹介
- 著者・雑誌名・公開年・論文名・論文名(日本語)・キーワード・PDFへのリンク・SciRateを出力する
NLP2024に参加してきました!
- GPT-4は数値情報・固有名詞が含まれていると内容の妥当性にかかわらず高評価を与える傾向がある
Google Colab で EvoLLM-JP を試す
Google Colab で RakutenAI-7B を試す
MetaGPTを動かしてみた
Generative AI for Beginners (Version 2) - A Course
- Microsoftが公開している生成AIアプリ開発用教材
#24 JAWS-UG主催 週刊AWSキャッチアップ(2024/03/18週)
LangChainを使って自然言語でRDBからデータを取得する
動画生成AI「Sora」のオープンソース版「Open-Sora 1.0」公開、AI同士を掛け合わせて高品質なAIを自律的に生み出す手法など重要論文5本を解説(生成AIウィークリー)
HuggingFaceとDeepSpeedで実践継続事前学習
Azureコストは水道代/The_47th_Tokyo_Jazug
Evolutionary Optimization of Model Merging Recipes
- 進化的モデルマージの紹介スライド
事例から見るプロダクトでの生成 AI 活用のポイント
- 売上拡大のほうがコスト削減の3倍効率が良い
- 使用頻度が高く効果が高いユースケースに注目する
RAGの新しい手法「CRAG」を3分で理解する
- CRAGw使うとハルシネーションを減らすことができる
- RAGで取得したドキュメントをLLMに渡す前にドキュメントの内容が正しいものかを自動でチェックする機能を持つ
- 検索評価モデルで検索品質の判定する
Rakuten/RakutenAI-7B-chat を試してみる ~ Gradioつかって
- Hugging Facebに書いてあるサンプルコードを無視したChatTemplaeteでうまくいった
Gemini for Google Workspace の使い方
AIOS: LLM Agent Operating System
- 日本語での解説記事
コミュニティと共に生きる - キャリアの螺旋 / live with community
- 自ら接触機会を増やし、チャンスの機会を増やす
OpenAI Sora に使われる技術
ローカルLLMでAlpacaデータのようなインストラクションデータを自動生成してみた
- gemma-7b-itを用いてデータ生成した記事
- 生成したデータで学習したモデルとStanford AlpacaとAlpaca-LoRAを比較したところ、プログラムを作成するタスクはうまく学習できなかった
10b程度のモデルをファインチューニングする日記 (逐次更新)
複数の LLM モデルを扱う上で直面した辛みまとめ
- モデルを変えるときリグレッションは確実に起こる
Open Interpreter Dockerで手軽に Claude 3 Haiku を使おう
大規模言語モデルはエリート就活生を超えるか
- 学習データに含まれていないと思われる論理問題をClaude3とGPT-4に出して、回答を比較した問題
7-methods-to-secure-llm-apps-from-prompt-injections-and-jailbreaks
- プロンプトインジェクションや脱獄からLLMを守る7つの方法
AWSのLambdaってなんやねん
ろんJ 実況~論文をなんJ風に解説&実況~
クレディセゾンでDXを進めてきた5年間を振り返る
Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3
Optimizing database performance: Changing partition keys of a container in Azure Cosmos DB for NoSQL API (preview)
データ品質をコード化! LINEヤフーのMLOpsを最適化する "ACP Data Quality" の紹介
みなさん、データのメタデータ管理ってどうやってますか? #datatech-jp レポート
LoRAよりいいらしいLISA
LMFlowによる日本語LISAトレーニング#1
- LISAはメモリ消費がLoRAと同等に低く、なおかつパフォーマンスはフルパラメータのファインチューニングに匹敵もしくは上回る効果を持つ
[03/23~03/29] LLM Weekly News
技術ブログを書く理由と、書き方を考える
- ブログ執筆で業務の一石二鳥や三鳥を狙う
中学生でもわかる深層学習
「AIが仕事を奪う」は人を過小評価している。芥川賞作家・九段理江と東大AI研究者が語る、人類の未来
大規模言語モデルの出力を技術的観点から考える
LLMの現在
- 深層学習時代から学習に使う計算量が2年ごとに100倍になっている
- AI関連資金調達の半分近くが生成AIに
- 高品質なデータセットは100倍以上の価値
- Chinchilla則
- 計算資源が限られている場合は、パラメータ数の20倍のデータを用意するのが最適
- 温度を下げると人間が書く文章と乖離する
大規模言語モデル開発のための日本語 Instruction データセット作成の取り組み
放射線分野の問題をLLMに解かせてみた
”わからない”との向き合い方
事業貢献のために情シスがやった業務改善の取り組み
HIKAKINやかまいたちも絶賛、おしゃべりAI「Cotomo」 自然な会話はどう実現? 創業者に聞く
LLMに医療知識をつけるには
商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開 【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当、GPT3.5やClaude v2を一部凌駕, 23/3/30時点】
いま必要なのは「ゆるやかな組織変革」?「もったいない」から始める、前向きなカルチャー変革のアプローチ
AI × 図書館ハッカソン@長岡 ScanSnapを活用し蔵書データから「知能」を創る、“世界初”のAIハッカソン
Voice Engine の概要
LangChainとは?各モジュールの機能と活用事例まとめ
Markdown ファイルをレベル別にチャンキングしてトークン数を確認するスクリプト
BitNetにおけるSTE(Straight-Through Estimator)の実装
DBRXのご紹介: 新たなSOTAオープンLLM
マルチモーダルLLMがもたらすビジネス革新と技術解説
- トレンド
- コネクタの簡素化