SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年9月23日の週に気になった記事などまとめ

curiosity

github.com

  • Perplexityのようなユーザ体験を持つチャットボットを構築する試みのリポジトリ
  • Tavilyを利用して検索して実現する

【ServerlessDays 2024】生成AIアプリ実装におけるトレンド3選

qiita.com

スクラムに必要な知的生産性を上げるソフトスキル

speakerdeck.com

  • 判断者がモブに入り込むことが重要

ArXivから論文を参照してLLMをColabでファインチューニングしてみる。

bwgift.hatenadiary.jp

  • ローカルLLMを使い論文のabstractの解析を行い、そのデータセットでLoRAによるファインチューニングを試した記事

【株式会社ELYZA】|GENIAC成果報告会 自社開発モデルプレゼンテーション

speakerdeck.com

話題のGraphRAGにAWSで挑戦しよう!(LlamaIndexとNeptuneに入門)

qiita.com

  • Neptune Analyticsは大規模ワークロード向け

Axcxept社、EZO×Qwen2.5シリーズでGPT-4-Turboを凌ぐ日本語LLM/自動CoT・RAGを採用

prtimes.jp

  • 内部的に複数のステップを踏んで思考を深化させるAuto-CoTやリアルタイムでWeb検索する機能もある

Amazon SageMaker Studio now supports automatic shutdown of idle applications

aws.amazon.com

  • SageMaker Studioにアイドル時間が続くとシャットダウンする機能が追加された

LLMの効率化を支えるアルゴリズム

speakerdeck.com

Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more

developers.googleblog.com

  • Gemini-1.5-Pro-002とGemini-1.5-Flash-002がリリースされた

LLM-jp-3 1.8B・3.7B・13B の公開

llmc.nii.ac.jp

Google Colab で LLM-jp-3 1.8B を試す

note.com

Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely

arxiv.org

  • RAGの種類とタスクに基づいて、4つの種類のクエリに分類することを提案した論文

大規模言語モデルの性能の自動評価に関する問題点のメモ書き:Tanuki-8x8Bの事例から

zenn.dev

  • CoTを用いた推論と単純な回答のみを返すことを求める場合で評価が異なってしまう

Gemini-1.5-Pro-002・Gemini-1.5-Flash-002・Gemini-1.5-Flash-8B-Exp-0924 の概要

note.com

  • Gemini 1.5 Proの価格が50%以上下がっている
  • Gemini 1.5 Flashレイテンシーが削減されている

Azure AI Confidential Inferencing Preview

techcommunity.microsoft.com

  • Whisperの機密推論機能が公開された

待望の新機能!OpenAIのボイスモードの使用感を解説してみた

www.youtube.com

第10回フィッシング対策勉強会

www.antiphishing.jp

Llama 3.2 の概要

note.com

Llama 3.2 を試す

note.com

  • 1Bと3Bの軽量LLMはマルチリンガルの文章生成やツールの呼び出し能力に優れている

Small Language Models: Survey, Measurements, and Insights

arxiv.org

Enterprise trust in Azure OpenAI Service strengthened with Data Zones

azure.microsoft.com

  • Azure OpenAI Serviceにデータゾーンデプロイメントが追加される

仕事を前に進めるためのコツ - 判断と決断と共有

speakerdeck.com

  • 問題を理解するうえで重要なこと
    • 未知のものは何か
    • 与えられているものはなにか
    • 条件はなにか
  • タスクを分解するときには5W1Hを最初に整理する
  • タスクの終了の定義と完成の定義が重要
  • 情報を集めることができない中で答えを出すのが決断
  • 決断が必要な場面のために基準を持つ

PythonVSCodeで関数の引数名を表示する神機能

qiita.com

  • VS Codeで設定をいれることで引数名が表示される

RAGに関する主要な論文を時系列順にまとめていく(2024年度版)

note.com

Beyond Bots: How AI Agents Are Driving the Next Wave of Enterprise Automation

menlovc.com

  • ドメインへの特化性とLLMの自立性でエージェント市場をマップした記事

Upgrading the Moderation API with our new multimodal moderation model

openai.com

コンテンツモデレーション入門の入門

speakerdeck.com

  • 日本語の安全性に特化したモデルはほとんどない
  • 安全性に関する評価データセットもモデルと同様の状況

OpenAI の新しくなった Moderation API を試す

note.com

  • 英語以外の言語でよりスコアが改善した

憧れている人はいるか

konifar-zatsu.hatenadiary.jp

  • 1年後/3年後どうなっていたいかの質問の代わりにあこがれている人はいますかと聞く

LLM-jp-3 を gguf に変換する手順

note.com

生成AIを用いた音声データ活用:記事作成プロセスの自動化

note.com

  • 複数人で同時に話す場面では誰が発言しているかを正確に識別することが難しい

Microsoft、物議醸した「Recall」(リコール)を再設計 10月にプレビューへ

www.itmedia.co.jp

  • 初期設定ではリコールを無効化
  • リコールの完全削除も可能

Cursorを1年弱触っているエンジニアの最近の使い方

note.com

  • Cursorを使うとコードの中身を簡単にAIに渡せる

生成AIの推論が高度になればなるほど、使う人間の側にも高度な知識が求められる

tjo.hatenablog.com

  • 生成AIの推論が高度すぎるとハルシネーションかどうかの判定も難しくなる

LLM-jp-3 を llama.cpp を使って iPhoneAndroid で動かす

note.com

Llama-3.2-1B-Instructを少しだけファインチューニングしてColabでためす。

bwgift.hatenadiary.jp

Llama 3.2 の使い方

note.com

  • transformers実装では入力された最後の画像のみに注目する
  • 欧州連合に居住する個人、欧州連合に主たる事業所がある企業にはマルチモーダルモデルを使用するライセンス権が付与されない
  • 日本語はサポートしてない
  • bitsandbytes を使用して8bitまたは4bitで読み込むこともできる

RAGの性能を評価しよう

speakerdeck.com

CreateInquiryViaBedrock

github.com

  • Bedrockを使って問い合わせ内容が問い合わせのガイドラインに沿っているかを確認するアプリ

Step FunctionsからはじめるBedrock @ JAWS-UG AI/ML

speakerdeck.com

Amazon Q data integration in AWS Glue 試してみた

speakerdeck.com

  • Amazon Q data integration in AWS Glueは自然言語を使用してデータ統合ジョブを構築する機能

Amazon Titan Image Generator v2 の全機能を徹底検証:機能解説と実践ガイド

qiita.com

  • 入力言語は英語のみ対応
  • ネガティブプロンプトを利用し、画像に含めたくない要素を指定可能

AI時代のアジャイル開発(XP祭り2024版)

speakerdeck.com

  • AIがコーディングを担うようになると、開発自体にはそれほど時間がかからなくなる
  • その分何をつくるのかの検討、作ったものの評価の時間と回数が増える
  • 開発サイクルが短くなり、一日スプリントが基本になっていく
  • より小さなチーム、より多くのチームへ

llm-jp-3-1.8b-instruct-Q4_K_MをollamaとColabでうごかしてみる。

bwgift.hatenadiary.jp

コード生成AI時代のテスト駆動開発

www.docswell.com

  • 複雑なプログラムを一発で生成させるとコードの品質が安定しない
  • 処理を分割したうえで、個々にテストファーストで進めたほうが内部品質は向上する

つよつよリーダーが 抜けたらどうする? 〜ナビタイムのAgile⽀援組織の変遷〜

speakerdeck.com

  • つよつよリーダーが抜けたら不安を吐き出した
  • 現状の課題やそれぞれのやりたいことを見直すきっかけとした