SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年6月17日の週に気になった記事などまとめ

画像センシングシンポジウム

speakerdeck.com

Weekly AI Agents News!

speakerdeck.com

自動プロンプト最適化をやってみた

tech.algomatic.jp

saldraさんと作る「AITuber(あいちゅーばー)ワークショップ」開催!〜40人集まってAITuberを作ってみた〜

note.com

ソフトバンクユーザーなら、生成AI検索「Perplexity Pro」が1年無料に ワイモバイル、LINEMOも対象

www.itmedia.co.jp

LLMが別のLLMを何度も改善 より良い回答を出す最適化手法をAIが発見する技術 Sakana AIなどが開発

www.itmedia.co.jp

Anthropicキーノート(Bedrock Claude Night 2)

speakerdeck.com

  • 画像を用いたプロンプトのテクニック
    • タスクの前に画像を含める
    • 複数のイメージを利用する場合はラベルつける
    • タスクを実行する雨に画像から詳細を抽出するとパフォーマンスが上がる

第9回 LLM 勉強会

llm-jp.nii.ac.jp

GoogleColabとAPIキーを使ってNemotron-4-340B-Instructモデルを利用する方法(Google Colabノート付)

hamaruki.com

VideoLLM-online: ストリーミング動画に対応した大規模言語モデル

hamaruki.com

  • LIVEフレームワークがストレーミング動画に対応するための包括的なアプローチ

Claude3 on Bedrock with Converse API + Tool use でチャットアプリを作成してみた

speakerdeck.com

  • HaikuやOpusは不必要にツールを利用しないように制御することが難しい

Amazon Bedrockで行うモデル評価入門

speakerdeck.com

  • Bedrockには人間によるモデル評価機能がある
    • 事前定義されたメトリクスに加えて、独自のメトリクス・観点を定義可能

mattn氏が実践しているエンジニアリング最適なメモ術。アウトプットを継続するための方法論

levtech.jp

  • 小さなTODOリストをつくることでアウトプットできる
  • 記憶から消えないようにメモを取る
  • ストックした情報を整理するなどして、深堀する

NotebookLMでドキュメントベースのAIアシスタントを手軽に試してみた

acro-engineer.hatenablog.com

  • アップロードされたドキュメントはNotebook LMの学習に利用されない
    • ただし、トラブルシュートやフィードバッグの際に人間のレビューワーがクエリなどの確認する

SB Intuitions、独自の日本語LLMを構築

www.sbintuitions.co.jp

VSCodeで生産性を上げる

zenn.dev

Gemini について全部解説! 使い方やモデル、プランまで

note.com

PSLM: Parallel Generation of Text and Speech with LLMs for Low-Latency Spoken Dialogue Systems

rinnakk.github.io

  • テキストと音声の並列生成を実現するモデルが提案された

Google I/O 2024 で知ってほしい 4 つのテーマ

note.com

Gemini API 活用 グローバルコンペ開催!

note.com

Gemini API の Context caching

note.com

  • Context Cachingは入力トークンをキャッシュして後続リクエストでキャッシュされたトークンを参照することで、コストとレイテンシーを低くさせることができる機能

Agentは楽しいぞ

speakerdeck.com

  • ClaudeでAgentを作る際は、Retrieverで取得した情報や、Memoryの情報をXMLで渡したほうがよい

Sakana AI・秋葉拓哉のキャリアを牛久祥孝が深掘り! なぜ「研究一筋は“違う”」と思ったのか?

type.jp

StreamlitをGoogle Colabで速攻で試そう!

zenn.dev

Ragas で LangChainのRAG評価 を試す

note.com

ML Enablement Workshop

github.com

Amazon Titan Text Embeddings の埋め込み表現で、レコメンド機能やタグ付けを実装

aws.amazon.com

生成AIキャラクター作成プラットフォームにおける LLM応答の柔軟性の拡張の工夫

speakerdeck.com

AI が奏でる新たな音楽体験 ~生成AIで音楽を作って楽しもう~

speakerdeck.com

Vol.04 LLMOps に取り組み始めた話

buildersbox.corp-sansan.com

  • LangfuseをLLMOpsツールとして採用した
  • デフォルトで利用するとtelemetryデータが送信される
  • Dataset機能で入力とそれによって期待する出力のセットを定義、管理できる

加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実

wirelesswire.jp

[06/15~06/21] 生成AI Weekly News #12|Claude 3.5 Sonnet

note.com

フルリモートで相手に気持ちよく仕事をしてもらうためのコツあれこれ

zenn.dev

AWS構成図からCloudFormationとパラメータシートを自動生成するシステムを作ってみた」という内容で登壇しました

dev.classmethod.jp

国産LLM初、AIエージェントとして使える「KARAKURI LM 8x7B Instruct v0.1」を一般公開

karakuri.ai

Claude 3.5 Sonnet の評価に関する備忘録

tech.algomatic.jp

  • 視覚の性能も改善されている

Claude 3.5 Sonnet の概要

note.com

  • Claude3 Opusの2倍の速度で動く
  • 2024年後半にClaude 3.5 HaikuとClaude 3.5 Opusをリリース予定

GoogleColabで複数のリトリーバーの結果を組み合わせる方法(Fate/stay night編)

hamaruki.com

  • EnsembleRetrieverで複数のRetrieverを組み合わせることができる

Azure OpenAI APIを活用したRAG FAQシステムの高速化と安定化を実現するPTUの実践検証

qiita.com

  • GPT-4oのPTUのほうがAPI Managementで負荷分散したGPT-3.5-Turbo-1106よりもレイテンシーの安定性が良かった

週刊生成AI with AWS – 2024/6/10週

aws.amazon.com

ソフトウェアエンジニアになってから: 昇進と異動(と最高評価)

note.com

llama.cppで「Umievo-itr012-Gleipnir-7B」をサーバー起動してELYZA-tasks-100の推論結果をWandBに送信する方法

hamaruki.com

Chrome の Gemini Nano を試す

note.com

Anthropicから早くもGPT-4o超え?「Claude 3.5 Sonnet」が発表

www.youtube.com