SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年9月16日の週に気になった記事などまとめ

LermoAI

github.com

  • ユーザーに合わせた学習教材を作成するGtihubリポジトリ

Paper Copilot: A Self-Evolving and Efficient LLM System for Personalized Academic Assistance

arxiv.org

  • ユーザープロファイルに基づいてパーソナライズされた研究アシスタントのように機能するシステムを紹介する論文
  • 毎日再思惟のArxiv論文をデータベースに追加する
  • ユーザープロファイルは、入力された名前を用いてArxivの過去の発表論文を基に構築する

What is the Role of Small Models in the LLM Era: A Survey

arxiv.org

  • LLMとSMの関係を体系的に調査した論文

Advanced RAG Techniques: Elevating Your Retrieval-Augmented Generation Systems

github.com

  • RAGシステムのための高度な技術を紹介する包括的なリポジトリ

LLM用のデータセットを作ってみる

bwgift.hatenadiary.jp

  • ローカルLLMでのデータセットの作成を紹介する記事
  • JSON形式の出力した

PdMはどのように全てのスピードを上げられるか ~ 非連続進化のための具体的な取り組み ~

speakerdeck.com

  • 継続的改善を行う前提なのでスピードが必要
  • PDCAを高速に回ることで非連続進化できる
  • 作業よりも先に整理を行う

Prompt evaluations

github.com

  • Anthoropicが提供するプロンプト評価に関する包括的なコースの内容

RAGで文書検索の精度を上げるには、複数の埋め込みモデルを使う

zenn.dev

  • ユーザーの質問のジャンルに応じて、複数の埋め込みモデルを使い分ける
  • ジャンルごとの埋め込みモデルを複数作成しておく
  • ドキュメントの埋め込みは一つのモデルで行う
  • どの埋込モデルを使うのが最適かを判断する仕組みを用意する

約1720億パラメータ(GPT-3級)の大規模言語モデルフルスクラッチ学習を行い、プレビュー版「LLM-jp-3 172B beta1」を公開

~学習データを含めすべてオープンにしたモデルとしては世界最大〜

www.nii.ac.jp

プロンプトエンジニアリングをしよう - 一休.comでの検索システム改善事例

user-first.ikyu.co.jp

  • ユーザーの入力を基に検索条件のJSONに変換する処理をLLMで実施
  • GPT-4を使うと高いので、プロンプトチューニングしてGPT-3.5 Turboを使った
  • 簡潔な言葉で何をしてほしいかを指示した
  • 1つの指示+複数のルールではなく、ステップバイステップで記載した

生成AIの二大潮流と自動運転 / チューリング株式会社

www.youtube.com

ついに出た!OpenAIの最新モデル「o1」って何がすごいの?

speakerdeck.com

LangChain v0.3 の変更点

note.com

AIエージェントキャッチアップ #1 - AutoGen / AutoGen Studio

www.youtube.com

「技術だけで、良いものは作れない」ヒットメーカー糸井重里が半世紀働いて気付いた、熱狂を生むプロダクトに不可欠なもの

type.jp

o1のAPIで実験してみたが 制限きつすぎて辛かった話

speakerdeck.com

LLMによる日本語タイポ修正ベンチマーク

note.com

o1モデルのプロンプトエンジニアリングって?

speakerdeck.com

RAGの処理で、リランクとベクトル検索でできることの違いを検証/解説してみる

acro-engineer.hatenablog.com

大規模言語モデル Tanuki-8x8Bの紹介と開発経緯など

www.docswell.com

【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました!

zenn.dev

暇そうに見えるマネージャーとはどういう状態か

konifar-zatsu.hatenadiary.jp

  • メンバーから相談されやすい状態を作る

【E2E連載企画 最終回】:自動運転データセットのためのセンサキャリブレーション技術

zenn.dev

【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました!

zenn.dev

大規模言語モデルの研究動向の調査:時系列データ分析とData-centric AIの視点から

research.sakura.ad.jp

GitHub Models を使って 20 種類以上の LLM の日本語性能を測定してみた

engineers.ntt.com

kotoba-tech/kotoba-whisper-v2.0

huggingface.co

OpenAI o1は どんなアカデミック用途に向いているか?

note.com

Kurage

huggingface.co

GRIN: GRadient-INformed MoE

github.com

A replaceable curiosity-driven candidate agent exploration approach for task-oriented dialog policy learning

https://ieeexplore.ieee.org/document/10681405

Pythonで改めて考える「クラス(class)」の使いどころ

speakerdeck.com

白金鉱業 Meetup Vol.15 :『Pythonで学ぶ効果検証入門』の歪なところ、その理由

speakerdeck.com

サーバレスアプリケーションのデプロイにおけるSAMとAWS CDKとServerless Frameworkの比較

serverless.co.jp

AIセーフティに関する評価観点ガイドの公開

aisi.go.jp

ec-genai-demo: E コマースにおける生成AI 4大ユースケースデモ

github.com

Amazon Bedrock で企業会計基準チャットボットを作ってみた !~ 金融機関における生成 AI を使った業務効率化 ~

aws.amazon.com

名古屋地区NLPセミナー

sites.google.com

Difyを活用した「内省支援」エージェント開発の所感

speakerdeck.com

日本メイドのLLMを構築する

www.nii.ac.jp

Introducing Contextual Retrieval

www.anthropic.com

React Native の アプリ作成から Google Play Console での内部テストまでの流れ

note.com

LLMマルチエージェントのフローエンジニアリングを支えるLLM Ops

speakerdeck.com

サーバーレスなユーザー認証認可の考慮事項と実践的プラクティス紹介

speakerdeck.com

生成 AI による新しい UI/UX 〜サーバーレスで実現する Generative UI の世界

speakerdeck.com

いまあるチームにフィットさせる Serverless そして Platform Engineeringへの挑戦

speakerdeck.com

サーバーレスAPIのパフォーマンステストとアプリの未来

speakerdeck.com

実践!サーバーレス RAG 構築:Firestore ベクトル検索と VertexAI LLM 活用

speakerdeck.com

Routine maintenance for Azure App Service, restarts, and downtime

learn.microsoft.com

  • AppServiceがどのようにリスタートするかを解説した記事

ServerlessDays Tokyo 2024

www.youtube.com

AWS Lambda を支える技術

speakerdeck.com

白金鉱業Meetup_経験値ゼロから始める A/B テスト布教活動と意思決定に活かしやすいA/Bテスト設計の一案

speakerdeck.com

Qwen2-VL-7B-InstructのLoRA

note.com

AWS Lambda Web Adapterを活用する新しいサーバーレスの実装パターン

speakerdeck.com

正しく評価される自己評価の書き方

naopr.hatenablog.com

  • 書いたことしか評価されない
  • 加点アピールは具体例・エビデンス・主張を書く
  • 日頃から書き溜める
  • 事実を用いて評価者が認識・観測できる形で書く

意見を言ってくれた人を孤立させない立ち振る舞い

konifar-zatsu.hatenadiary.jp

LLM時代にLabは何をすべきか聞いて回った1年間

speakerdeck.com

WSUS非推奨化発表に伴う感想と今後どうするのか

kkamegawa.hatenablog.jp

How streaming LLM APIs work

til.simonwillison.net