SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023年12月11日の週に気になった記事などまとめ

気になったものまとめ

アジャイル開発に欠かせない自己管理型チームを実現するTIPS10選！
Geminiの技術レポートを読み解く〜生成AIの最前線
ChatGPTをフル活用したUI勉強会！プロンプトも大公開
LangChainを使わない
LLMへの入力プロンプトを「意味を保持したまま」高度に圧縮する技術『LLMLingua』
Google GeminiのDemo PVをOpenAIのAPIで実現したコードを実行してみた
GPT-4Vを使ってゲーム実況させる
Google Colab で Gemini Pro を試す
Gemini Pro のリリースの概要
Microsoft から出た小型モデル Phi-2 を Colab で試す
Google Colab で phi-2 を試す
論文紹介『ChatGPT1周年：オープンソースLLMはChatGPTにどのくらい追いついているか？』
DeepMindの研究者らが有効性を検証した、LLMに自ら高品質な訓練データを生成させる「自己学習」
Prompt Flowで評価Flowを自作してRAGのイケてるLLMOpsを実現してみた
AIの安全性確保と活用促進に関する緊急提言
GPT-4 で作るスライド風の論文要約チャレンジ📝
リリースされたばかりの Gemini Pro API を試してみる
LLM・プロンプトの評価・テストフレームワークについてまとめてみた
生成AIに関する実態調査2023 秋
[12/9~12/15] LLM Weekly News by EXPLAZA
LLMへ至る道 Advent Calendar 2023
ChatGPTでの業務効率化を“断念”──正答率94％でも「ごみ出し案内」をAIに託せなかったワケ　三豊市と松尾研の半年間
Google Colab で Gemini Pro をもっと試す
線形回帰において「多重共線性があると推定が不安定になる」とは？〜図と理論で理解する〜
自動運転をつくる: Turing AIディレクターとしての500日
言語モデルはどのようにして知識を蓄えているのか？関連文献の紹介
敵対的プロンプト技術まとめ
GitHub Copilot はどのようにして空気を読むか？

アジャイル開発に欠かせない自己管理型チームを実現するTIPS10選！

tech-blog.abeja.asia

自己管理型チームの実現にはフラットな関係が欠かせない
メンバーとチームの主体性が大事
フラットなチームを作るコツ
- イベントのファシリテーションをスクラムマスターが占有しない
- スーパースターがいる場合は発言を控えてもらう
- ペアプロ/モブプロを推奨

Geminiの技術レポートを読み解く〜生成AIの最前線

GPTやLlama2との違いも抑えながら、Geminiの技術レポートを読み解いた記事
GPT-4やLlama2の報酬モデルでは「役立つ」「安全である」の2つの報酬スコアだったのに対し、Geminiでは「事実である」の報酬スコアを加えているのが特徴的

ChatGPTをフル活用したUI勉強会！プロンプトも大公開

UIデザインの主要作業は参加者が実践し、必要最低限必要な上流部分をChatGPTが行うことで効率化した勉強会の紹介記事

LangChainを使わない

tech-blog.abeja.asia

LangChainを使わずともOpenAI APIをシンプルに扱えるツールを作った記事

LLMへの入力プロンプトを「意味を保持したまま」高度に圧縮する技術『LLMLingua』

長いプロンプトによってLLMの応答速度が遅延したりコストが高くなったりしてしまう問題に対処する論文を紹介した記事

Google GeminiのDemo PVをOpenAIのAPIで実現したコードを実行してみた

OpenAIのgpt-4-vision-previewモデルのAPIを使って実現しているコードを実行した感想を紹介した記事

GPT-4Vを使ってゲーム実況させる

ゲーム実況スクリプトを自動で作成する方法を紹介した記事

Google Colab で Gemini Pro を試す

Gemini Pro のリリースの概要

Gemini Pro のリリースの概要の記事をまとめた記事

Microsoft から出た小型モデル Phi-2 を Colab で試す

Huggingface のライセンスはまだリサーチのみ許可するライセンス
日本語では全く答えられない}

Google Colab で phi-2 を試す

論文紹介『ChatGPT1周年：オープンソースLLMはChatGPTにどのくらい追いついているか？』

オープンソースLLMがChatGPTにどこまで追いついているのかを確認できる論文を紹介した記事

DeepMindの研究者らが有効性を検証した、LLMに自ら高品質な訓練データを生成させる「自己学習」

LLMが自律的に高品質な訓練データを生成し、データセットを自ら拡充する「自己学習」アプローチの有効性を検証した論文を紹介した記事
自己生成データによって、数学やコード生成の分野におけるLLMの能力が顕著に向上したことが確認された

Prompt Flowで評価Flowを自作してRAGのイケてるLLMOpsを実現してみた

nttdocomo-developers.jp

回答内容の正確性の評価性能を上げるため、評価Flowを自作した記事
QnA GPT Similarity Evaluationに改良を加えた
- 評価用のプロンプトを作成

AIの安全性確保と活用促進に関する緊急提言

この提言の目玉
- 国内ガイドラインの策定とAIの活用促進
- AI安全研究所の創設

GPT-4 で作るスライド風の論文要約チャレンジ📝

tech-blog.abeja.asia

スライド風のデザインでの論文まとめ（以下、スライド）を、プロンプトテクニックを使いつつ GPT-4 を使って自動作成できないか試した記事
- arxiv で参照できる学術論文やテクニカルレポートを、OpenAI API を使って4枚のスライド風にまとめることを目指した
- スライドの作成には Reveal.jsを使用
- スライドは HTML として出力
Role-Play PromptingやSTEP-BACK PROMPTINGの工夫をしている

リリースされたばかりの Gemini Pro API を試してみる

LLM・プロンプトの評価・テストフレームワークについてまとめてみた

主なLLM評価フレームワークの紹介とRAGASの利用例について紹介した記事
自動データ生成機能があるが、英語にしか対応してない

生成AIに関する実態調査2023 秋

87％が「既に生成AIの社内利用あるいは社外活用（その検討）を進めている」
実際に検討・推進している生成AIのユースケースとしては、全体の半数近くは要約や文章執筆等のテキスト生成系と回答している
- 画像や動画、音声、プログラムコード生成等の回答も全体の20％程度存在している
今後1年間が「本格導入」フェーズの1つの山を迎える
配送や物流などのフィジカルを利用する職種、品質管理や財務経理などのリスク管理の意識が強い職種などでは相対的に生成AI活用が進んでいない

[12/9~12/15] LLM Weekly News by EXPLAZA

LLMへ至る道 Advent Calendar 2023

LLM(大規模言語モデル)に至るまでの自然言語処理における機械学習モデルの歴史を説明するアドベントカレンダー

ChatGPTでの業務効率化を“断念”──正答率94％でも「ごみ出し案内」をAIに託せなかったワケ　三豊市と松尾研の半年間

www.itmedia.co.jp

三豊市では本格導入の条件を“正答率99％”としていたため、今回ごみ出し案内へのChatGPTの導入は見送られることになった
- AIが間違った案内をしてしまうとその案内に基づいて行動した市民や収集業者などに迷惑が掛かる

Google Colab で Gemini Pro をもっと試す

チャットを使うことで、開発者が会話履歴を管理しなくても、マルチターン会話が可能
- 会話履歴の確認もできる

線形回帰において「多重共線性があると推定が不安定になる」とは？〜図と理論で理解する〜

多重共線性があると、わずかな入力データの違いで推定結果が大きく変わってしまう
- これは、推定量の分散が大きいことを意味する
多重共線性に対処方法として、以下を実施するとどのようなことが起こるかを可視化している
- サンプルサイズを増やす
- Ridge回帰などの正則化を含んだ手法を適用する

自動運転をつくる: Turing AIディレクターとしての500日

Turingの自動運転開発の軌跡を振りかえった記事

言語モデルはどのようにして知識を蓄えているのか？関連文献の紹介

言語モデルと知識獲得に関する文献をいくつか紹介した記事

敵対的プロンプト技術まとめ

GitHub Copilot はどのようにして空気を読むか？

tech-blog.abeja.asia

公開されているブログ記事や論文、プレゼンテーションなどを基にGitHub Copilotの動作を推測した記事