SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年6月10日に気になった記事などまとめ

無料で使える最高のAIノート『NotebookLM』使い方と活用事例

note.com

  • NotebookLMは「知識の埋め込みと検索」部分に特化したサービス
  • サービス改善目的で人間のレビュアーが資料や回答を確認することはある
  • ソースから必要なものだけを選んで参照させることができる

GPT-4oをOCRとして使う

www.nogawanogawa.com

Weekly AI Agents News!

speakerdeck.com

【LangChainゆる勉強会#7】会話履歴を上手に使う―Memory/MessageHistory【ランチタイム開催】

www.youtube.com

Awesome AI Agents Guide

github.com

  • AI/LLMエージェントの包括的なリストをまとめる取り組み

LayerX、エンタープライズ企業のドキュメントワークを効率化する生成AIプラットフォーム「Ai Workforce」をリリース。日本マイクロソフトと開発・営業で連携

prtimes.jp

この先生きのこるには

speakerdeck.com

週刊AWS – 2024/6/3週

aws.amazon.com

OpenAI and Apple announce partnership to integrate ChatGPT into Apple experiences

https://openai.com/index/openai-and-apple-announce-partnership/

CS25: Transformers United V4

web.stanford.edu

Migrating OCR Enhancement from GPT-4 Turbo Vision Preview to GPT-4 Turbo GA

techcommunity.microsoft.com

  • GPT-4 Turbo 2024-04-09でOCR拡張する方法を紹介する記事

Python に参照渡しは存在しない話

note.com

Firebase Genkitを利用してRAG実装を試す

note.com

生成AIと音声認識技術を使って会議を要約するアプリを作ってみた

qiita.com

Appleのオンデバイス・サーバー基盤モデルの概要

note.com

RAGで人間の脳を再現。「HippoRAG」を理解する

zenn.dev

  • HippoRAGは、ナレッジグラフと、それを継続的にメンテナンスする仕組みを組み合わせる
  • ベクトルデータベースやコサイン類似度による検索を用いない

RAG for Agentプロセスという考え方

note.com

  • エージェントのプロセス情報をRAGとして用意しておくことで、エージェントの処理が安定し、結果的にエージェントの回答も安定する

松尾教授が座長を務める、AI戦略会議の資料が公開されました。(第9回資料:「生成AIの産業における可能性」)

weblab.t.u-tokyo.ac.jp

【完全解説】なぜ人はアウトプットができないのか?

qiita.com

The Prompt Report: A Systematic Survey of Prompting Techniques

arxiv.org

  • プロンプトエンジニアリングの体系的な調査レポート

RecurrentGemma-9b: 革新的な自然言語処理モデルの登場

hamaruki.com

-SSII技術マップを通して見る過去・現在,そして未来-

speakerdeck.com

技術発信をするモチベーション迷子になった時に見る記事

tech-blog.abeja.asia

GenerativeAI-Cost

github.com

ShaberiベンチマークでLLMを評価する

soysoftware.sakura.ne.jp

独自の日本語LLM「CyberAgentLM2」に視覚を付与したVLM(大規模視覚言語モデル)を一般公開 ―商用利用可能な画像チャットモデルを提供―

www.cyberagent.co.jp

ObsidianとELYZAの言語モデルを使って手軽に実現するローカルLLM活用

qiita.com

チューリングVision & Languageモデル評価のための「Heron VLMリーダーボード」に技術提供- ML実験管理プラットフォームを提供するWeights & Biases Japanと連携 -

tur.ing

クリエイティブAI講座:最近のプロンプト工学〜Many-Shot In-Context LearningとLM babel

www.youtube.com

Chrome の 組み込み AI Gemini Nano を試してみる

azukiazusa.dev

自作の5択問題をLLMに解かせる

note.com

SSII2024 [SS1] 拡散モデルの今 〜 2024年の研究動向 〜

speakerdeck.com

SSII2024 [SS2] 最適輸送の基礎から最近の動向まで

speakerdeck.com

llama-cpp-agentで多機能ローカルLLM環境を作る

emoclework.jp

Java on Azure Day 2024 ~エンタープライズJavaアプリにAI機能を導入

www.youtube.com

Discover pitch decks from the latest AI Startups

decks.chiefaioffice.xyz

  • 最近のAIスタートアップのピッチスライドが集まったサイト

1,000億パラメータ規模の独自LLM「PLaMo-100B」の事前学習

tech.preferred.jp

Azure OpenAI Best Practices Insights from Customer Journeys

techcommunity.microsoft.com

  • Azure OpenAIのスケーリングのベストプラクティスを説明したガイド

HuggingFace Diffusers v0.29.0の新機能

note.com

SSII2024 [OS2] 画像、その先へ 〜モーション解析への誘い〜

speakerdeck.com

[06/08~06/14] 生成AI Weekly News #11|WWDC24 & Luma Dream Machine

note.com

Apple WWDC2024 生成AI速報ウェビナー要約

note.com

Generative Models

speakerdeck.com

30周年記念特別企画:SSII 技術マップ

confit.atlas.jp

GraphRAGの簡易検証 ~Azure Document Intelligence, Neo4jを用いて~

qiita.com

[株式会社サイバーエージェント様 講演] サイバーエージェントの生成AIへの取り組み - 独自の日本語LLM(大規模言語モデル)公開、生成AI徹底理解リスキリング

www.youtube.com

情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!!

ascii.jp

近似近傍探索のチューニングで気をつけること

zenn.dev

Flaxを使用したRecurrentGemma2Bグリフィンモデルのファインチューニングチュートリアル(Kaggle、GoogleColabノート付)

hamaruki.com

Google ColabにTailscaleを用いてSSH接続する方法

hamaruki.com

初心者でもすぐにできる!HalloでAI肖像画像アニメーションを作ろう

hamaruki.com