SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023年5月15日の週に気になった記事などまとめ

CTOの視点から見たAzure OpenAI ServiceとOpenAIのChatGPT APIの深堀り比較

qiita.com

  • Chat GPTのAPIを本家OpenAI社が提供しているAPIを利用する方法とMicrosoft社が提供しているAzure OpenAI ServiceのAPIを利用する方法で比較した記事
  • 以下の観点で比較
    • 基本性能
    • セキュリティ/プライバシー
    • 料金
    • リリース速度/利用開始方法
    • 組み込み方法/サポート体制

privateGPT

github.com

  • LangChain, GPT4All, LlamaCpp, Chroma and SentenceTransformersを利用して構築されたインターネット接続なしでドキュメントを元に質問応答するソリューション

ChatGPTなど生成AIのガイドラインとサービス規約を超要約、何がOKで何がNGか確認する

internet.watch.impress.co.jp

  • 生成AIのガイドラインや規約を元に重要な部分をピックアップした記事
    • Q&A形式でポイントがピックアップされている
  • 利用者は、出力結果をどのように利用するかについては特に考慮する必要がある

高精度な生成系 AI アプリケーションを Amazon Kendra、LangChain、大規模言語モデルを使って作る

aws.amazon.com

  • 企業のナレッジベースを元に生成AIから解凍を得るアプリケーションを作成するソリューションのアーキテクチャの紹介
  • Kendraインデックスから非構造化データを取り込み、プロンプトに含めるアーキテクチャの紹介

サクッと始めるプロンプトエンジニアリング【LangChain / ChatGPT】

zenn.dev

  • プロンプトデザイン入門【質問テクニック10選】
  • LnagChainの概要と使い方

microsoft/guidance

github.com

AI法廷の模擬裁判@五月祭/プロンプト公開

note.com

  • 『AI法廷の模擬裁判』のプロンプトおよび入力した脚本

ChatGPTなど生成型AIへの機密情報漏洩を未然に防ぐ「Cloudflare One for AI」発表

mugenlabo-magazine.kddi.com

  • Cloudflare One for AIは、AIツールの使用状況の可視化・計測、データ損失の防止、統合管理といった機能を通じて、企業に包括的なAIセキュリティを提供する

日本語特化型の大規模言語モデル、OpenCALMとrinna/japanese-gpt-neox-3.6bの検証

qiita.com

  • OpenCALMはチューニングを前提としたベースモデルなので、このままだと対話モデルとしてはうまく働かない
  • rinnaは、Instruction Tuningによって対話モデルとしての性能が大きく向上している

Introducing the ChatGPT app for iOS

openai.com

  • iOS用のChatGPTアプリがリリースされた
  • 無料で利用できる
  • Whisperが統合されており、音声入力できる

0518LLMmeetup_LLMシステムの非機能要件対応_現場レポート.pdf

speakerdeck.com

  • LLMシステムの非機能要件の対応方法
  • Azure OpenAI Serviceは、Cognitive Serviceと同様にログやメトリックを収集することができる
  • モデルごとの1分あたりの要求数やトークン数にクォータ制限がある
    • GPT-4モデルの制限は厳しい

【論文紹介】Google. 2023. PaLM 2 Technical Report

speakerdeck.com

  • PaLM 2 (Bard) の技術報告の紹介スライド
  • 初代PaLMよりも性能が高く、推論時のコストが低い

大規模言語モデルの開発者が知っておくと役立つさまざまな数字

gigazine.net

  • プロンプト、価格、トレーニングとファインチューニング、GPUメモリについて知っておくべき数字が記載されている
  • 元の記事

CyberAgent社の日本語LLM OpenCALMの対話モデル用途のfinetune検証

tech.acesinc.co.jp

  • open-calm-7b をLoRA finetuneを試した記事
  • 学習データには kunishou/databricks-dolly-15k-jaを利用

LLM Meetup Tokyo #2 開催レポ&LTまとめ

note.com

  • LLM Meetup Tokyoの第二回の開催レポLT資料とLT資料まとめ

Google Cloud サービスカット学習コンテンツ集

blog.g-gen.co.jp

  • Google Cloudに特化したシステムインテグレーターのG-genが公開したGoogle Cloudの学習用コンテンツをまとめたページ
  • 各学習コンテンツはカテゴリに分かれており、コンテンツの難易度も記載されている