SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023年5月8日の週に気になった記事などまとめ

チャットボット・アリーナで大規模言語モデルの性能を比較してみた

note.com

  • LLMのベンチマークサイト
  • 匿名のバトルモードでは、GPT3.5 turboやGPT-4、Claudeも比較対象に現れることがある

セミナー:ChatGPTと生成AIに関する法的倫理的課題

www.aiandlawsociety.org

  • 5/29にChatGPTを含む生成AIの法的・倫理的課題を検討するセミナーが開催される

LangChainのPandas Dataframe Agentをつかって自然言語でテーブルデータの分析をしてみる

tech.nri-net.com

  • Pandas Dataframe Agentを用いてCSVファイルをPandasで読み込んで分析
  • 日本語で色分けしたい項目や軸などを指定すれば関係するグラフを作ってくれる

Introducing the Microsoft 365 Copilot Early Access Program and new capabilities in Copilot 

www.microsoft.com

  • 600の顧客にCopilotの初期アクセスプログラムを拡大する
  • Microsoft 365 E3、E5のすべての顧客にSemantic Index for Copilotを提供する
    • 自然文で入力して必要な情報を受け取る
      • 質問文をベクトル化してベクトル検索する
    • Copilotを使ってても使ってなくても提供される

Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界

techblog.exawizards.com

  • 「Zero-shot Learning」と「Vision & Language」に関する最新情報を、CLIPという研究を起点として網羅的にサーベイした記事
  • CLIPが登場してからは、「訓練データに含まれる特定ドメインしか生成できない」という制約がなくなり、現実にはありえない画像も生成できるようになった

ChatGPT による内部資料活用アプリ

qiita.com

  • OneDriveに保存した資料からChatGPTでインサイトを取得して、データベースに蓄積する
  • 利用時にインサイトに基づき必要な資料を探しだす
  • 探しだした文書をChatGPTで分析する

Azure OpenAI Service と OpenAI 本家で同じモデルに同じプロンプトを投げて時間はかってみた

zenn.dev

  • Azure OpenAI Service と OpenAI 本家の API で「text-davinci-003」を呼び出し速度を比較
  • 10回呼び出した結果のAzure OpenAI Serviceの方が短時間で処理が完了した

Introducing 100K Context Windows

www.anthropic.com

  • Claudeで取り扱うことができるコンテキストサイズが9Kから100Kに拡大した

日本語T5モデルの公開

note.com

  • 日本語データによる学習を行ったT5モデルを公開した
  • Huggingface Hubから取得し、利用できる
  • small, base, largeについてそれぞれ学習step数を変えて3種類ずつ、および XLのモデルが公開されている

techcommunity.microsoft.com

  • Azure Data Explorerをベクトル類似度検索で利用する方法
  • dynamicデータ型がベクトル値を保存するのに向いている
  • 元データと別カラムで関連メタデータとしてベクトル値を保存できる
  • ユーザ定義関数としてseries_cosine_similarity_fl というベクトル値との類似度を検索する関数が追加された

ChatGPTなど生成AIによる個人情報の開示

www.mbsd.jp

  • 入力するプロンプトを工夫することで(本来ならば拒否すべき)Eメールアドレスなどの個人情報を開示する
  • 生成AIを介して個人情報の収集が容易になれば、悪意のある者によってスパムやDoxingなどに利用される可能性もあり、このことは生成AIが犯罪に悪用されるリスクがある
  • プロンプトなどを通じて社外秘などの機微情報が学習されてしまった場合、情報漏えいに繋がるおそれがある

生成 AI の利用ガイドラインの策定、生成 AI の利用事例紹介

developers.cyberagent.co.jp

  • 情報の取り扱いなどについて記載したガイドラインを作成した
  • 入力内容が学習に使われない Azure OpenAI Service を利用した Slack Bot「AzureBot_GPT4」を導入した
  • 生成 AI については、⼀律で OK、NG と判断できるものではないためガイドラインにて「最低限のルール」を⽰した上で、事業ごとに個別判断する方針が取られている