- LermoAI
- Paper Copilot: A Self-Evolving and Efficient LLM System for Personalized Academic Assistance
- What is the Role of Small Models in the LLM Era: A Survey
- Advanced RAG Techniques: Elevating Your Retrieval-Augmented Generation Systems
- LLM用のデータセットを作ってみる
- PdMはどのように全てのスピードを上げられるか ~ 非連続進化のための具体的な取り組み ~
- Prompt evaluations
- RAGで文書検索の精度を上げるには、複数の埋め込みモデルを使う
- 約1720億パラメータ(GPT-3級)の大規模言語モデルのフルスクラッチ学習を行い、プレビュー版「LLM-jp-3 172B beta1」を公開
- プロンプトエンジニアリングをしよう - 一休.comでの検索システム改善事例
- 生成AIの二大潮流と自動運転 / チューリング株式会社
- ついに出た!OpenAIの最新モデル「o1」って何がすごいの?
- LangChain v0.3 の変更点
- AIエージェントキャッチアップ #1 - AutoGen / AutoGen Studio
- 「技術だけで、良いものは作れない」ヒットメーカー糸井重里が半世紀働いて気付いた、熱狂を生むプロダクトに不可欠なもの
- o1のAPIで実験してみたが 制限きつすぎて辛かった話
- LLMによる日本語タイポ修正ベンチマーク
- o1モデルのプロンプトエンジニアリングって?
- RAGの処理で、リランクとベクトル検索でできることの違いを検証/解説してみる
- 大規模言語モデル Tanuki-8x8Bの紹介と開発経緯など
- 【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました!
- 暇そうに見えるマネージャーとはどういう状態か
- 【E2E連載企画 最終回】:自動運転データセットのためのセンサキャリブレーション技術
- 【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました!
- 大規模言語モデルの研究動向の調査:時系列データ分析とData-centric AIの視点から
- GitHub Models を使って 20 種類以上の LLM の日本語性能を測定してみた
- kotoba-tech/kotoba-whisper-v2.0
- OpenAI o1は どんなアカデミック用途に向いているか?
- Kurage
- GRIN: GRadient-INformed MoE
- A replaceable curiosity-driven candidate agent exploration approach for task-oriented dialog policy learning
- Pythonで改めて考える「クラス(class)」の使いどころ
- 白金鉱業 Meetup Vol.15 :『Pythonで学ぶ効果検証入門』の歪なところ、その理由
- サーバレスアプリケーションのデプロイにおけるSAMとAWS CDKとServerless Frameworkの比較
- AIセーフティに関する評価観点ガイドの公開
- ec-genai-demo: E コマースにおける生成AI 4大ユースケースデモ
- Amazon Bedrock で企業会計基準チャットボットを作ってみた !~ 金融機関における生成 AI を使った業務効率化 ~
- 名古屋地区NLPセミナー
- Difyを活用した「内省支援」エージェント開発の所感
- 日本メイドのLLMを構築する
- Introducing Contextual Retrieval
- React Native の アプリ作成から Google Play Console での内部テストまでの流れ
- LLMマルチエージェントのフローエンジニアリングを支えるLLM Ops
- サーバーレスなユーザー認証認可の考慮事項と実践的プラクティス紹介
- 生成 AI による新しい UI/UX 〜サーバーレスで実現する Generative UI の世界
- いまあるチームにフィットさせる Serverless そして Platform Engineeringへの挑戦
- サーバーレスAPIのパフォーマンステストとアプリの未来
- 実践!サーバーレス RAG 構築:Firestore ベクトル検索と VertexAI LLM 活用
- Routine maintenance for Azure App Service, restarts, and downtime
- ServerlessDays Tokyo 2024
- AWS Lambda を支える技術
- 白金鉱業Meetup_経験値ゼロから始める A/B テスト布教活動と意思決定に活かしやすいA/Bテスト設計の一案
- Qwen2-VL-7B-InstructのLoRA
- AWS Lambda Web Adapterを活用する新しいサーバーレスの実装パターン
- 正しく評価される自己評価の書き方
- 意見を言ってくれた人を孤立させない立ち振る舞い
- LLM時代にLabは何をすべきか聞いて回った1年間
- WSUS非推奨化発表に伴う感想と今後どうするのか
- How streaming LLM APIs work
LermoAI
- ユーザーに合わせた学習教材を作成するGtihubリポジトリ
Paper Copilot: A Self-Evolving and Efficient LLM System for Personalized Academic Assistance
- ユーザープロファイルに基づいてパーソナライズされた研究アシスタントのように機能するシステムを紹介する論文
- 毎日再思惟のArxiv論文をデータベースに追加する
- ユーザープロファイルは、入力された名前を用いてArxivの過去の発表論文を基に構築する
What is the Role of Small Models in the LLM Era: A Survey
- LLMとSMの関係を体系的に調査した論文
Advanced RAG Techniques: Elevating Your Retrieval-Augmented Generation Systems
- RAGシステムのための高度な技術を紹介する包括的なリポジトリ
LLM用のデータセットを作ってみる
PdMはどのように全てのスピードを上げられるか ~ 非連続進化のための具体的な取り組み ~
- 継続的改善を行う前提なのでスピードが必要
- PDCAを高速に回ることで非連続進化できる
- 作業よりも先に整理を行う
Prompt evaluations
- Anthoropicが提供するプロンプト評価に関する包括的なコースの内容
RAGで文書検索の精度を上げるには、複数の埋め込みモデルを使う
- ユーザーの質問のジャンルに応じて、複数の埋め込みモデルを使い分ける
- ジャンルごとの埋め込みモデルを複数作成しておく
- ドキュメントの埋め込みは一つのモデルで行う
- どの埋込モデルを使うのが最適かを判断する仕組みを用意する
約1720億パラメータ(GPT-3級)の大規模言語モデルのフルスクラッチ学習を行い、プレビュー版「LLM-jp-3 172B beta1」を公開
~学習データを含めすべてオープンにしたモデルとしては世界最大〜
プロンプトエンジニアリングをしよう - 一休.comでの検索システム改善事例
- ユーザーの入力を基に検索条件のJSONに変換する処理をLLMで実施
- GPT-4を使うと高いので、プロンプトチューニングしてGPT-3.5 Turboを使った
- 簡潔な言葉で何をしてほしいかを指示した
- 1つの指示+複数のルールではなく、ステップバイステップで記載した
生成AIの二大潮流と自動運転 / チューリング株式会社
ついに出た!OpenAIの最新モデル「o1」って何がすごいの?
LangChain v0.3 の変更点
AIエージェントキャッチアップ #1 - AutoGen / AutoGen Studio
「技術だけで、良いものは作れない」ヒットメーカー糸井重里が半世紀働いて気付いた、熱狂を生むプロダクトに不可欠なもの
o1のAPIで実験してみたが 制限きつすぎて辛かった話
LLMによる日本語タイポ修正ベンチマーク
o1モデルのプロンプトエンジニアリングって?
RAGの処理で、リランクとベクトル検索でできることの違いを検証/解説してみる
大規模言語モデル Tanuki-8x8Bの紹介と開発経緯など
【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました!
暇そうに見えるマネージャーとはどういう状態か
- メンバーから相談されやすい状態を作る
【E2E連載企画 最終回】:自動運転データセットのためのセンサキャリブレーション技術
【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました!
大規模言語モデルの研究動向の調査:時系列データ分析とData-centric AIの視点から
GitHub Models を使って 20 種類以上の LLM の日本語性能を測定してみた
kotoba-tech/kotoba-whisper-v2.0
OpenAI o1は どんなアカデミック用途に向いているか?
Kurage
GRIN: GRadient-INformed MoE
A replaceable curiosity-driven candidate agent exploration approach for task-oriented dialog policy learning
https://ieeexplore.ieee.org/document/10681405
Pythonで改めて考える「クラス(class)」の使いどころ
白金鉱業 Meetup Vol.15 :『Pythonで学ぶ効果検証入門』の歪なところ、その理由
サーバレスアプリケーションのデプロイにおけるSAMとAWS CDKとServerless Frameworkの比較
AIセーフティに関する評価観点ガイドの公開
ec-genai-demo: E コマースにおける生成AI 4大ユースケースデモ
Amazon Bedrock で企業会計基準チャットボットを作ってみた !~ 金融機関における生成 AI を使った業務効率化 ~
名古屋地区NLPセミナー
Difyを活用した「内省支援」エージェント開発の所感
日本メイドのLLMを構築する
Introducing Contextual Retrieval
React Native の アプリ作成から Google Play Console での内部テストまでの流れ
LLMマルチエージェントのフローエンジニアリングを支えるLLM Ops
サーバーレスなユーザー認証認可の考慮事項と実践的プラクティス紹介
生成 AI による新しい UI/UX 〜サーバーレスで実現する Generative UI の世界
いまあるチームにフィットさせる Serverless そして Platform Engineeringへの挑戦
サーバーレスAPIのパフォーマンステストとアプリの未来
実践!サーバーレス RAG 構築:Firestore ベクトル検索と VertexAI LLM 活用
Routine maintenance for Azure App Service, restarts, and downtime
- AppServiceがどのようにリスタートするかを解説した記事
ServerlessDays Tokyo 2024
AWS Lambda を支える技術
白金鉱業Meetup_経験値ゼロから始める A/B テスト布教活動と意思決定に活かしやすいA/Bテスト設計の一案
Qwen2-VL-7B-InstructのLoRA
AWS Lambda Web Adapterを活用する新しいサーバーレスの実装パターン
正しく評価される自己評価の書き方
- 書いたことしか評価されない
- 加点アピールは具体例・エビデンス・主張を書く
- 日頃から書き溜める
- 事実を用いて評価者が認識・観測できる形で書く