SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023年8月28日の週に気になった記事などまとめ

気になったものまとめ

LLMのファインチューニングで何ができて何ができないのか
GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに
【ローカルLLM】Hugging FaceによるGPTQ量子化ガイド
Google Cloud で生成 AI アプリケーションを作ろう！パート 0：Google Cloud の生成 AI ソリューション
Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました
「ドキュメントの書き方」を体系的に学んだことがないエンジニアへ書籍『エンジニアのためのドキュメントライティング』の概要
Google Colab で ELYZA-japanese-Llama-2-7b を試す
生成 AI による検索体験 (SGE) のご紹介
Security-JAWS Days CTF 作問者解説
ご家庭用LLMでストリーミングする方法
LLMの日本の知識を評価するデータセットの紹介
stockmark/gpt-neox-japanese-1.4b
大規模言語モデルを Fine Tuning すべきタイミングとその方法
Fine-tuning: gpt-3.5-turboの活用事例。絵文字分類タスク改善のプロセスと、学びの言語化。
数式を含むスキャン画像のPDFをOCRしてマークダウン形式に変換できる。Nougatを試す
AWS履修者のためのAzure入門
Amazon EC2 におけるセキュリティ(脆弱性)事例
alfredplpl/RetrievalQA.py
Data anonymization with Microsoft Presidio
LLMの推論を効率化する量子化技術調査【技術動向調査】
生成AIへのプロンプト入力時における個人情報保護法上の論点まとめ（前編）
Teaching with AI
マルチリンガルな言語モデル入門：これまでとこれから
NousResearch/Yarn-Llama-2-13b-128k
大規模言語モデル時代のVision and Language 研究におけるコミュニケーションの課題
大規模言語モデル入門

LLMのファインチューニングで何ができて何ができないのか

LLMのファインチューニングで何ができて、何ができないのかまとめた記事
- うまく機能するタスク
- うまく機能しないタスク
- ファインチューニング以外の手法

GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに

大規模言語モデル（LLM）であるGPT-4が、多肢選択問題（MCQ）において選択肢の順序に敏感であるという事実を明らかにした研究の紹介
- 選択肢の順序を単純に入れ替えるだけで、モデルの性能に13%から75%もの大きな変動が生じることが確認された

【ローカルLLM】Hugging FaceによるGPTQ量子化ガイド

Hugging FaceによるGPTQ量子化ガイドを解説した記事

Google Cloud で生成 AI アプリケーションを作ろう！パート 0：Google Cloud の生成 AI ソリューション

Google Cloud の生成 AI サービスを利用したアプリケーションのアイデアや具体的な作成例を紹介した記事
Generative AI App Builderを使うと、生成AIによる検索と会話を手軽にアプリケーションに組み込むことができる

Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました

ELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開した
性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準
評価用データセットや評価時の具体的な出力も公開されている

「ドキュメントの書き方」を体系的に学んだことがないエンジニアへ書籍『エンジニアのためのドキュメントライティング』の概要

2023年6月12日に開催されたインフラエンジニアBooks 30分でわかる「エンジニアのためのドキュメントライティング」の書き起こし記事
個人的に印象的だった箇所
- 不要なドキュメントは減らす
- ドキュメントを書く前にドキュメントのユーザーと直接対話する
- 対話したら知見をまとめる
- タイトルはドキュメントを読んで達成できるゴールの要約にする
- 流し読みできる構成にする
- ドキュメントが優れているのは目的にかなっている場合である

Google Colab で ELYZA-japanese-Llama-2-7b を試す

「Google Colab」で「ELYZA-japanese-Llama-2-7b」を試した記事

生成 AI による検索体験 (SGE) のご紹介

japan.googleblog.com

Google社が提供する生成AIを使った検索について紹介する記事

Security-JAWS Days CTF 作問者解説

speakerdeck.com

Security-JAWS DAYS CTFの問題の解説資料

ご家庭用LLMでストリーミングする方法

ローカルLLMをREPLでストリーミングする方法について記載した記事

LLMの日本の知識を評価するデータセットの紹介

LLMの日本の知識を評価するデータセットの紹介記事

stockmark/gpt-neox-japanese-1.4b

stockmark/gpt-neox-japanese-1.4bをkunishou/databricks-dolly-15k-jaのデータセットを用いてLoRAファインチューニングするコード
T4GPUで実行できる

大規模言語モデルを Fine Tuning すべきタイミングとその方法

speakerdeck.com

プロダクトを生成系 AI で成長させるのになぜ Fine Tuning が必要なのか、どのような手順で進めればよいのかを解説したスライド

Fine-tuning: gpt-3.5-turboの活用事例。絵文字分類タスク改善のプロセスと、学びの言語化。

OpenAI社のgpt-3.5-turboをFine-tuningした記事
入力されたメモに対する絵文字を分類するタスクをFine-Tuningで改善した記事
100件のデータセットでFinetuning

数式を含むスキャン画像のPDFをOCRしてマークダウン形式に変換できる。Nougatを試す

Meta社が公開した数式を含むPDFのOCRモデル、Nougat (Neural Optical Understanding for Academic Documents)を試した記事

AWS履修者のためのAzure入門

speakerdeck.com

概念や権限・ユーザー管理周りとネットワークに関連するサービスについてAWSとAzureを比較した資料

Amazon EC2 におけるセキュリティ(脆弱性)事例

scgajge12.hatenablog.com

Amazon EC2 上で動く Web アプリケーションの脆弱性によって脆弱性攻撃が可能だった実際の事例について紹介した記事

alfredplpl/RetrievalQA.py

gist.github.com

elyza/ELYZA-japanese-Llama-2-7b-instructを用いてRAGを実施するサンプルコード

Data anonymization with Microsoft Presidio

python.langchain.com

LangChainでMicrosoft Presidioを用いて匿名化する方法を記載した記事

LLMの推論を効率化する量子化技術調査【技術動向調査】

blog.brainpad.co.jp

LLMの学習や推論の高速化や効率化に関する論文、とりわけ量子化技術について取り上げた論文を中心にレビューした結果を紹介した記事

生成AIへのプロンプト入力時における個人情報保護法上の論点まとめ（前編）

生成AIへのプロンプト入力時に問題となる個人情報保護法の論点をまとめた記事

Teaching with AI

OpenAIによる教師向けのChatGPTガイド
どのように使用するかの説明と具体的なプロンプト例を掲載している

マルチリンガルな言語モデル入門：これまでとこれから

speakerdeck.com

マルチリンガルな言語モデルはどうやって作るか
マルチリンガルな言語モデルに関する未解決の謎
- 言語横断能力の獲得に確定的に重要という要素が分かっていない
マルチリンガルな言語モデルのこれから

NousResearch/Yarn-Llama-2-13b-128k

Llama2ベースで入力が128kトークンのモデルが公開された

大規模言語モデル時代のVision and Language 研究におけるコミュニケーションの課題

speakerdeck.com

大規模言語モデルの登場により、Vision and Language特化モデルとのコミュニケーション形態が変化している
- LLM司令塔型とマルチモーダルLLM型がある

大規模言語モデル入門

https://ses.sigse.jp/2023/wp-content/uploads/2023/08/SES2023_%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB.pdf

LLMの基礎知識からChatGPT、LLaMA、ソフトウェアエンジニアリングへの応用まで記載したスライド
説明が非常に分かりやすい