SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023年8月28日の週に気になった記事などまとめ

LLMのファインチューニング で 何ができて 何ができないのか

note.com

  • LLMのファインチューニングで何ができて、何ができないのかまとめた記事
    • うまく機能するタスク
    • うまく機能しないタスク
    • ファインチューニング以外の手法

GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに

aiboom.net

  • 大規模言語モデル(LLM)であるGPT-4が、多肢選択問題(MCQ)において選択肢の順序に敏感であるという事実を明らかにした研究の紹介
    • 選択肢の順序を単純に入れ替えるだけで、モデルの性能に13%から75%もの大きな変動が生じることが確認された

【ローカルLLM】Hugging FaceによるGPTQ量子化ガイド

note.com

  • Hugging FaceによるGPTQ量子化ガイドを解説した記事

Google Cloud で生成 AI アプリケーションを作ろう!パート 0:Google Cloud の生成 AI ソリューション

zenn.dev

  • Google Cloud の生成 AI サービスを利用したアプリケーションのアイデアや具体的な作成例を紹介した記事
  • Generative AI App Builderを使うと、生成AIによる検索と会話を手軽にアプリケーションに組み込むことができる

Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました

note.com

  • ELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開した
  • 性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準
  • 評価用データセットや評価時の具体的な出力も公開されている

「ドキュメントの書き方」を体系的に学んだことがないエンジニアへ 書籍『エンジニアのためのドキュメントライティング』の概要

logmi.jp

  • 2023年6月12日に開催されたインフラエンジニアBooks 30分でわかる「エンジニアのためのドキュメントライティング」の書き起こし記事
  • 個人的に印象的だった箇所
    • 不要なドキュメントは減らす
    • ドキュメントを書く前にドキュメントのユーザーと直接対話する
    • 対話したら知見をまとめる
    • タイトルはドキュメントを読んで達成できるゴールの要約にする
    • 流し読みできる構成にする
    • ドキュメントが優れているのは目的にかなっている場合である

Google Colab で ELYZA-japanese-Llama-2-7b を試す

note.com

  • Google Colab」で「ELYZA-japanese-Llama-2-7b」を試した記事

生成 AI による検索体験 (SGE) のご紹介

japan.googleblog.com

  • Google社が提供する生成AIを使った検索について紹介する記事

Security-JAWS Days CTF 作問者解説

speakerdeck.com

  • Security-JAWS DAYS CTFの問題の解説資料

ご家庭用LLMでストリーミングする方法

note.com

  • ローカルLLMをREPLでストリーミングする方法について記載した記事

LLMの日本の知識を評価するデータセットの紹介

note.com

  • LLMの日本の知識を評価するデータセットの紹介記事

stockmark/gpt-neox-japanese-1.4b

huggingface.co

  • stockmark/gpt-neox-japanese-1.4bをkunishou/databricks-dolly-15k-jaのデータセットを用いてLoRAファインチューニングするコード
  • T4GPUで実行できる

大規模言語モデルを Fine Tuning すべきタイミングとその方法

speakerdeck.com

  • プロダクトを生成系 AI で成長させるのになぜ Fine Tuning が必要なのか、どのような手順で進めればよいのかを解説したスライド

Fine-tuning: gpt-3.5-turboの活用事例。絵文字分類タスク改善のプロセスと、学びの言語化

note.com

  • OpenAI社のgpt-3.5-turboをFine-tuningした記事
  • 入力されたメモに対する絵文字を分類するタスクをFine-Tuningで改善した記事
  • 100件のデータセットでFinetuning

数式を含むスキャン画像のPDFをOCRしてマークダウン形式に変換できる。Nougatを試す

note.com

  • Meta社が公開した数式を含むPDFのOCRモデル、Nougat (Neural Optical Understanding for Academic Documents)を試した記事

AWS履修者のためのAzure入門

speakerdeck.com

  • 概念や権限・ユーザー管理周りとネットワークに関連するサービスについてAWSとAzureを比較した資料

Amazon EC2 におけるセキュリティ(脆弱性)事例

scgajge12.hatenablog.com

  • Amazon EC2 上で動く Web アプリケーションの脆弱性によって脆弱性攻撃が可能だった実際の事例について紹介した記事

alfredplpl/RetrievalQA.py

gist.github.com

  • elyza/ELYZA-japanese-Llama-2-7b-instructを用いてRAGを実施するサンプルコード

Data anonymization with Microsoft Presidio

python.langchain.com

  • LangChainでMicrosoft Presidioを用いて匿名化する方法を記載した記事

LLMの推論を効率化する量子化技術調査 【技術動向調査】

blog.brainpad.co.jp

  • LLMの学習や推論の高速化や効率化に関する論文、とりわけ量子化技術について取り上げた論文を中心にレビューした結果を紹介した記事

生成AIへのプロンプト入力時における個人情報保護法上の論点まとめ(前編)

storialaw.jp

  • 生成AIへのプロンプト入力時に問題となる個人情報保護法の論点をまとめた記事

Teaching with AI

openai.com

  • OpenAIによる教師向けのChatGPTガイド
  • どのように使用するかの説明と具体的なプロンプト例を掲載している

マルチリンガル言語モデル入門:これまでとこれから

speakerdeck.com

NousResearch/Yarn-Llama-2-13b-128k

huggingface.co

  • Llama2ベースで入力が128kトークンのモデルが公開された

大規模言語モデル時代のVision and Language 研究におけるコミュニケーションの課題

speakerdeck.com

  • 大規模言語モデルの登場により、Vision and Language特化モデルとのコミュニケーション形態が変化している
    • LLM司令塔型とマルチモーダルLLM型がある

大規模言語モデル入門

https://ses.sigse.jp/2023/wp-content/uploads/2023/08/SES2023_%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB.pdf

  • LLMの基礎知識からChatGPT、LLaMA、ソフトウェアエンジニアリングへの応用まで記載したスライド
  • 説明が非常に分かりやすい