SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年10月14日の週に気になった記事などまとめ

WSL2でEntropixを試してみる

note.com

サクッと始めるRAG開発【LangChain / Python

zenn.dev

0.5BパラメータのLLMを一から作ろうとして心が折れかけた話

zenn.dev

Chrome の組み込み AI の Summarization API を試してみる

azukiazusa.dev

  • Summarization API を使用して、文章の要約を生成できる

OpenRouter で Grok 2 API を試す

note.com

  • OpenRouterは複数のAIモデルにアクセスできるプラットフォーム

ローカルLLMでbolt.newを動かしてみた

zenn.dev

  • ollamaを使ってbolt.newが動作するリポジトリが存在する
  • ollamaのデフォルトのコンテキストウィンドウサイズは2048
  • ローカルLLMだけでの運用は現状まだ難しそう

LightRAG: Simple and Fast Retrieval-Augmented Generation

github.com

  • 知識グラフを活用して、RAGを改善する手法の提案
  • GraphRAGよりも検索オーバーヘッドが小さい

「ネガティブなフィードバック」は実在する?

note.com

  • 相手の行動とそれによって起きたことの共通認識を持つ
    • それが良しか悪しかの判断基準を共有する
  • コミュニケーションを通じて伝え方を調整する
  • フィードバッグのフィードバッグをもらう

RAGのハルシネーション対策をする手法「Astute RAG」

zenn.dev

  • 外部知識・内部知識を組み合わせることでハルシネーションを抑える

任天堂元社長・岩田聡の仕事哲学に学ぶ。「ボトルネックを見極め、最善を尽くす」【データサイエンティスト・からあげ】

type.jp

  • 覚悟を決めて一番重要なことに徹底的に取り組む

ファクトチェックのできる Jina Reader の Grounding API を試す

note.com

「LightRAG: Simple and Fast Retrieval-Augmented Generation」を試す

zenn.dev

  • グラフ構造の増分更新ができる
  • コードがシンプルで読みやすい

GENIAC第1サイクルの開発成果として 大規模言語モデル PLaMo-100B-Pretrained を公開

www.preferred.jp

Automate Markdown and Image Translations Using Co-op Translator: Phi-3 Cookbook Case Study

techcommunity.microsoft.com

  • Markdownファイルやテキストを含む画像を複数の言語に自動翻訳する手順を説明した記事

fast-whisperでlarge-v3-turboを、のメモ

bwgift.hatenadiary.jp

Agent-as-a-Judge: Evaluate Agents with Agents

arxiv.org

チャットコミュニケーションで使わないようにしている表現

konifar-zatsu.hatenadiary.jp

  • 否定形で止めると、攻撃的な印象を与えてしまう

Multi-agent Systems

langchain-ai.github.io

  • LangGraphでのマルチエージェントを説明するページ

Ollama で Hugging Face Hub の GGUF をそのまま使ってみる

note.com

  • ollama run のところにHugging Face Hubのリポジトリをそのまま指定すればよい

DuckDB雑紹介(1.1対応版)

speakerdeck.com

  • インメモリ、組み込み、カラムナデータベース
  • PostgreSQLの構文と同じことが大体できる

Long-Context LLMs Meet RAG: Overcoming Challenges for Long Inputs in RAG

arxiv.org

  • 多くの長いコンテキストを入れてRAGをすると品質が低下することを軽減する方法を提案する論文

[LangChain] Tool Calling 入門

zenn.dev

Chat LangChain

github.com

  • LangChainのドキュメントに対してQAを行うチャットボットの実装のドキュメント

OpenAI の Chat Completions API のオーディオ入出力を試す

note.com

  • モデルからのオーディオ出力をマルチターン会話への入力として使用するには、オーディオ生成の応答データに表示される生成されたIDを使用する

bitnet.cpp を試す

note.com

  • 日本語の出力は難しかった

結局スクラムとは何なのか

zenn.dev

自然言語処理を役立てるのはなぜ難しいのか

speakerdeck.com

  • お金を払ってまで使っている自然言語処理ツールは少ない
  • 挑戦できるタイミングは一瞬

OpenAIから出たSwarmの何が良いのかを解説してみた

www.youtube.com

Sharing new research, models, and datasets from Meta FAIR

ai.meta.com

  • テキストと音声入力し、音声を出力するMeta Spirit LMが非営利目的の利用限定で公開された

Google Colab で Janus-1.3B を試す

note.com

  • マルチモーダル理解と画像生成の両対応なモデル

bitnet.cpp で Llama3-8B-1.58-100B-tokens を試す

note.com

最新のWasm事情

speakerdeck.com

懸念の伝え方・吸い上げ方

konifar-zatsu.hatenadiary.jp

  • 結論が出なそうな感じになったときの切り上げ方を決めておく

ColabでBitNetをためしてみる。

bwgift.hatenadiary.jp

Solving complex problems with OpenAI o1 models

openai.com

  • o1モデルがどのように複雑な問題を解決しているかを示したビデオ

相関データとサンプルサイズ設計

statditto.com

  • ランダム化単位と分析単位が異なるときは注意が必要

「AIの論理的思考とは何か」をOpenAI o1の若手開発者3名の話から考え、来たるエージェント時代にチャンスがありそうな領域を模索した一週間

www.youtube.com

  • OpenAI o1の開発者3人へのインタビューに関する日本語解説動画

babyagi-2oをcolabでolama(qwen2.5-code)と組み合わせてためしてみる。

bwgift.hatenadiary.jp

Claude Financial Data Analyst

github.com

40歳になるので30代でやってよかったことをまとめた

soudai.hatenablog.com

  • 毎日同じことをするから差分から気づく
  • 年下から刺激を受ける
  • 年上から歴史を学ぶ

OpenAI o1の開発者がo1の仕組みなどについて語るインタビュー(日本語訳と感想)

note.com

  • o1モデルシリーズは思考できるようにRLで訓練されている

GraphRAG Analysis, Part 2: Graph Creation and Retrieval vs Vector Database Retrieval

home.mlops.community

  • GraphRAGは正確性を向上させるがそれ以外のメトリクスには影響を及ぼさない
  • 精度向上と引き換えに知識グラフのセットアップと維持にかかる負担が大きい

Thinking LLMs: General Instruction Following with Thought Generation

arxiv.org

  • 追加データなしで既存のLLMに一般的な指示に従うための思考能力を装備するためのトレーニング方法を提案した論文

OTFSG Tokyo Meetup #4の資料

otfsg-tokyo.connpass.com