SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2024年4月1日の週に気になった記事などまとめ

10bクラスの大規模言語モデルが、ファインチューニングを経てタスクを解けるようになるメカニズムを探るメモ

note.com

XZ Utilsの脆弱性 CVE-2024-3094 についてまとめてみた

piyolog.hatenadiary.jp

Google Colab で BAAI/bge-reranker-v2-m3 を試す

note.com

ローカルLLM : 最近作成したデータセットについての記録

note.com

日本語最高性能のRerankerをリリース / そもそも Reranker とは?

secon.dev

Megatron-LMとGKEで作るMixtral 8x7Bの継続事前学習

drive.google.com

Advanced RAG Techniques

www.pinecone.io

【LLMの研究者向け】400本を超えるLLMに関する論文のリストを公開・更新しています

qiita.com

(10b程度の)大規模言語モデルが「種々のスキル」を身につけるために必要な要素や学習量を考えるメモ

note.com

言語処理学会第30回年次大会(NLP2024) チュートリアル3「作って学ぶ日本語大規模言語モデル」松田寛先生(株式会社リクルート Megagon Labs)

www.youtube.com

Many-shot jailbreaking

www.anthropic.com

  • 多ショット有害なアシスタントの回答を入力することでジェイルブレイクを実現する方法を解説するブログ

Release of Pre-Trained Models for the Japanese Language

arxiv.org

  • rinnaが公開した日本語事前学習モデルをまとめた論文

Semantic Routerを試す

zenn.dev

ChatGPT - LLMシステム開発大全

speakerdeck.com

React フレームワークの 動向と選定基準

speakerdeck.com

LLMアプリケーションの実験管理の運用まとめてみた〜PromptLayerを使った本番運用〜

zenn.dev

インターンでRAGシステムの検索エンジンの改善をおこないました

tech.uzabase.com

エンジニア生存戦略2024

qiita.com

画像生成AIの誕生と変遷(4) 画像生成AIの2014-2024におきたパラダイムシフト

note.com

GitHub Copilotを使いこなすためのコツを解説してみた

www.youtube.com

社内のクリエイターに向けて発表した「画像生成AIガイドライン」策定の裏側

www.cyberagent.co.jp

Chat Vectorを使って日本語LLMをチャットモデルに改造する

qiita.com

Hugging FaceのAI系Cookbook

note.com

Google Colab で japanese-reranker-cross-encoder-large-v1 を試す

note.com

生成AIによる「ブログの原稿作り」手順やプロンプトを公開

blog.soracom.com

LangChain Evaluations【生成物の評価方法】

zenn.dev

Devin を含むAIソフトウェアエンジニアと周辺技術のざっくり紹介

tech.algomatic.jp

Comparison of Models: Quality, Performance & Price Analysis

artificialanalysis.ai

  • 商用LLMが比較されているサイト

Command R の 概要

note.com

techcommunity.microsoft.com

  • Azure AI Searchが安くなった

今、知っておきたい! 生成AIエージェントの世界

speakerdeck.com

[04/01~04/05] 生成AI Weekly News

note.com

llama.cpp: CPU+GPUのプロンプト処理が高速化される(#6083)

sc-bakushu.hatenablog.com

LLMアプリケーションの評価の運用についてまとめてみた

zenn.dev

LLMの検索結果をさらに正確にする手法『CRAG』(Corrective Retrieval Augmented Generation:修正型の検索拡張生成)

ai-data-base.com

Chat VectorにならぬCode Vectorは作れるのか

note.com

マルチモーダルなAIの活用@Next_in_LLM

www.docswell.com

Djangoとハギングフェイスライブラリを用いてローカルLLMで動くLINE_botを作る。

qiita.com

ChatGPTのログをexportしてjsonlにするメモ (指示データセットに使いたい)

note.com

【エンジニアの日常】エンジニア達の自慢の作業環境を大公開 Part1

tech.findy.co.jp

Command-R 35B × memGPT インテグレーションレポート

ykrv.net

Chat VectorとMath Vectorは併用できるのか

note.com

LLM同士をストリートファイター3で戦わせる方法

note.com

LLMに敢えて間違わせてルールを覚えさせるプロンプト手法 Google DeepMindなどが考案

ai-data-base.com

LLMアプリ開発の必須ツール?!Langfuseがすごい!

qiita.com

Claude3にプロジェクト全体をぶち込むためのプロジェクトの構造とファイル内容を自動でまとめるPythonスクリプト

zenn.dev

C4AI Command-R Google Colab L4で動かしてみた

hamaruki.com

Command-R+の衝撃! 100Bモデルで本当にこんなことできんの!?ダウンロードしてローカルで実行可能

note.com

大和セキュリティ勉強会: AWSインシデント対応入門

chocopurin.hatenablog.com