SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023-01-01から1年間の記事一覧

2023年6月26日の週に気になった記事などまとめ

対話体験における生成系 AI の活用を探る: Amazon Lex, LangChain, SageMaker JumpStart による事始め RAGアプリにおけるプロンプトとtemperatureの応答品質への影響ほんとのところ RLHFを利用して用途に応じたLLMを生成できるツールの紹介 3カ月で26万回も…

2023年6月19日の週に気になった記事などまとめ

text-generation-webui で Rinna・OpenCALM・RWKV を試す Azure OpenAI on your data でノーコードで ChatGPT 対応エンタープライズサーチを構築する 【ChatGPT】データサイエンティストが読むべきChatGPT関連の記事・動画まとめ LangChainドキュメント:複…

2023年6月12日の週に気になった記事などまとめ

ChatGPTに会話の長期記憶を持たせてみる GPT3.5 APIで16kトークンを扱えるようになった!...で、16kトークンってどのぐらいの分量の情報なの?という人向けの記事 ChatGPTとLangChainを活用してデータ分析アプリを作ってみた LangChain の「OpenAI Functions…

2023年6月5日の週に気になった記事などまとめ

SageMaker での LLM Instruction Tuning GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り JP Language Model Evaluation Harness 「大規模言語モデル(LLM)カオスマップ」2023年度6月版が公開 製造業のニーズに最適な機械学習サービスの選…

2023年5月29日の週に気になった記事などまとめ

Scikit-LLM: Sklearn Meets Large Language Models LLM推論にGPUは1つでいい?FlexGenについてまとめてみた LangChainのJSON出力パーサー rinna、人間の評価を利用したGPT言語モデルの強化学習に成功 LEARN GENERATIVE AI Short Courses Rinna-3.6B を llama…

2023年5月22日の週に気になった記事などまとめ

スーパーコンピュータ「富岳」政策対応枠における大規模言語モデル分散並列学習手法の開発について AWS による Jupyter の 生成系 AI の民主化とノートブック実行のスケールのための新しい拡張機能を発表 Microsoft Build2023 BOOK OF NEWS Microsoft Build …

2023年5月15日の週に気になった記事などまとめ

CTOの視点から見たAzure OpenAI ServiceとOpenAIのChatGPT APIの深堀り比較 privateGPT ChatGPTなど生成AIのガイドラインとサービス規約を超要約、何がOKで何がNGか確認する 高精度な生成系 AI アプリケーションを Amazon Kendra、LangChain、大規模言語モデ…

2023年5月8日の週に気になった記事などまとめ

チャットボット・アリーナで大規模言語モデルの性能を比較してみた セミナー:ChatGPTと生成AIに関する法的倫理的課題 LangChainのPandas Dataframe Agentをつかって自然言語でテーブルデータの分析をしてみる Introducing the Microsoft 365 Copilot Early …

2023年5月1日の週に気になった記事などまとめ

Azure Open AIのコーポレートガバナンスについて考える 生成AIの利用ガイドライン LangChainのChromaの使い方メモ 「統計的機械学習」の中核としての統計数理シンポジウム(オンライン開催) SharePoint in the AI Era: Introducing Copilot in SharePoint &…

2023年4月24日の週に気になった記事などまとめ

『ChatGPTによって描かれる未来とAI開発の変遷』日本マイクロソフト株式会社 蒲生 弘郷氏(2023年4月21日) 大規模言語モデルのための強化学習 ChatGPTに日本語テキストを入力するとき、日本語テキストがどのように分割されてトークンに変換されるかをtiktok…

2023年4月17日の週に気になった記事などまとめ

Azure OpenAI Service を検証目的で使い始めるまでにやったことまとめ AWS侵入テストのドキュメントが更新されているので確認する 【AI】生成AIを利用する場合に気を付けなければならない著作権の知識 [輪講資料] LoRA: Low-Rank Adaptation of Large Langua…

2023年4月10日の週に気になった記事などまとめ

プロンプトを管理しやすくするツールを作ってみた / I created a tool to make the prompts easier to manage. DeepSpeed Chat: ChatGPTライクなモデルを簡単・高速・低コストに、あらゆるスケールで学習 大規模言語モデル(LLM)に関するビジネスと法律…

2023年4月3日の週に気になった記事など一覧

New – Ready-to-use Models and Support for Custom Text and Image Classification Models in Amazon SageMaker Canvas Prompt Engineering Guideの日本語訳 New – Ready-to-use Models and Support for Custom Text and Image Classification Models in Am…

3月27日の週に気になった記事などまとめ

大規模言語モデルの驚異と脅威 生成系 AI の業務利用ガイドラインを紹介します ChatGPT 人間のフィードバックから強化学習した対話AI Amazon Kendraによる検索結果のチューニング 大規模言語モデルの驚異と脅威 speakerdeck.com 大規模言語モデルの脅威を実…

3月20日の週に気になった記事などまとめ

【徹底解説】これからのエンジニアの必携スキル、プロンプトエンジニアリングの手引「Prompt Engineering Guide」を読んでまとめてみた JPCERT/CC、「EmoCheck」v2.4を公開 ~再び活発化しつつある「Emotet」の最新版の対応 Amazon Linux 2023 – 長期サポー…

3月13日の週に気になった記事などまとめ

Foundation Model and Robotics | 基盤モデルとロボティクス 高性能・高速・軽量な日本語言語モデル LINE DistilBERTを公開しました 言語処理学会第29回年次大会 併設ワークショップ JLR2023 - プログラム AWS サーバーレス SaaS ワークショップ ECサイト構…

3月6日の週に気になった記事などまとめ

ChatGPT APIを使ってExcelやCSVのデータからレポートを自動作成してみる Build solutions faster with Microsoft Power Platform and next-generation AI ChatGPT APIとFaissを使って長い文章から質問応答する仕組みを作ってみる StreamlitでGPT3のチャット…

2月27日の週に気になった記事などまとめ

たった数枚の画像で Stable Diffusion をファインチューニングできる効率的な Amazon SageMaker JumpStart の使い方 脆弱性診実習用アプリ(通称「やられサイト」)Bad Todo List Introducing ChatGPT and Whisper APIs DiffusionによるText2Imageの系譜と生…

SageMaker Canvasをインターネットに接続なしVPC Onlyドメインで実行するために作成したVPCエンドポイント

SageMaker Canvasをインターネット接続なしのVPC専用モードで動かすときにどのサービスのVPCエンドポイントを作る必要があるか分からなかったので、やってみた結果を残す 困ったこと 以下のページを見ると、SageMaker Canvasが使用できるサービスのVPCエンド…

2023年2月20日の週に気になった記事などまとめ

TRANSFORMER MODELS: AN INTRODUCTION AND CATALOG Prompt Engineering Guide FlexGen OWASP Kubernetes Top 10 PyGWalker: A Python Library for Exploratory Data Analysis with Visualization The 2023 MAD (Machine Learning, Artificial Intelligence &…

2023年2月13日の週に気になった記事などまとめ

30分で完全理解するTransformerの世界 Comparison of Japanese Sentence Segmentation Tools Introduction to Azure OpenAI Service 状態空間モデルを用いた因果効果の推定: CausalImpact Automate deployment of an Amazon QuickSight analysis connecting …

pyinstallerで作成したtabulaを利用したexeが実行時にエラーになったときの対処法

tabulaを利用したPythonアプリケーションをpyinstallerでexe化しようとしたときに、 エラーが発生したので、その時に実施した作業をメモ 発生したエラー アプリケーション実行時に、「Unable to access jarfile C:\Users\・・・・\tabula\tabula-1..-jar-wit…

2023年2月6日の週に気になった記事などまとめ

Amazon Kendra で簡単に検索システムを作ってみよう ! DocsGPT Developers Summit 2023にてパスキーについて講演しました DX白書2023 機械学習を実用化するエンジニアリングスキル 新着情報 – Amazon VPC 作成エクスペリエンスから VPC リソースを視覚化する…

2023年1月30日の週に気になった記事などまとめ

『Kaggleに挑む深層学習プログラミングの極意』(講談社)のサンプルコードを含むGitHubリポジトリ ランサムウェア/攻撃グループの変遷と繋がり (Rev.2) The Kaggle Workbook: Self-learning exercises and valuable insights for Kaggle data science comp…

2023年1月23日の週に気になった記事などまとめ

JALの「草の根」データ活用が約1800人に拡大、仕掛け人が語る仲間づくりの要諦 情報処理推進機構(IPA)が気になるサイバー攻撃や自社の情報セキュリティ対策状況といった情報を入力すると、想定損害額や対策、効果などの情報を出力するExcelシート「NANBOK…

2023年1月16日の週に気になった記事まとめ

なぜ変化を起こすのが難しいのか? - 数年以上にわたって難しさに向き合い・考え取り組んできたこと CircleCIへの不正アクセスについてまとめてみた デジタル庁が手がけるデータ標準とオープンデータ 研究とプロダクト開発の境界を越えたチーミングでユーザ…

PowerQueryでExcelのセルに記入したパスからファイルを読み込む方法

PowerQueryでExcelに記入したパスからファイルを読み込みしようとしたら、はまったためやり方を記録する 確認した環境 Windows 11 Excel2019 やり方 エクセルのセルにヘッダー「ファイルのパス」、値にファイルのパスを記入する 「データ」→「テーブルまたは…

2023年1月9日の週に気になった記事などまとめ

統計的因果推論の理論と実装「潜在的結果変数の枠組み」 Pearl「入門統計的因果推論」の概要と活用イメージ In-House vs. External Pen Testing: Which is Right For Your Organization? 機械学習を「社会実装」するということ 2023年版 Regional Scrum Gath…

2023年1月2日の週に気になった記事などまとめ

AI 激動の年!2022年の人工知能10大トレンドと必読論文 PyTorchのnightlyに侵害 「すぐにアンインストールしてください」 私のセキュリティ情報収集法を整理してみた(2023年版) Twitterから流出したとみられる約2億件のデータについてまとめてみた 私のブ…

2022年12月26日の週に見た気になった記事まとめ

行政職員のためのデータ活用一歩前 ChatGPTのようなものをオープンソースで作成しているリポジトリ 日本のAI導入効果がアメリカの7分の1程度しかないのはなぜなのか AWS App Runnerがそろそろ本番環境でも使い物になりそう 【まとめ】エンジニア向けデザイン…