SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2023-01-01から1年間の記事一覧

2023年12月25日の週に気になった記事などまとめ

無料 GPT-4 アプリを活用した Instruction データセット作成の取り組み 機械学習におけるEDAって結局何するの? Vertex AI Gemini ProとLangChainで実現するMultimodal RAG 23/12/25 覚醒したguidanceを使ってローカルLLMからノイズの無い生成してもらい、4…

2023年12月18日の週に気になった記事などまとめ

AI Lab、官公庁・自治体向けに生成AIを活用したチャットボットの実証実験を開始 わずか2行のプロンプトでも実効性のある新しいアライメント手法『URIAL』 品質要件が厳しいLLMアプリケーションのトライアル評価を通じて得た知見 本編 日本はこうなる!?~20…

2023年12月11日の週に気になった記事などまとめ

アジャイル開発に欠かせない自己管理型チームを実現するTIPS10選! Geminiの技術レポートを読み解く〜生成AIの最前線 ChatGPTをフル活用したUI勉強会!プロンプトも大公開 LangChainを使わない LLMへの入力プロンプトを「意味を保持したまま」高度に圧縮する…

2023年12月4日の週に気になった記事などまとめ

マルチモーダルLLMの応用動向の論文調査 RAG用途に使える、Wikipedia 日本語の embeddings とベクトル検索用の faiss index を作った 生成AIの進化に置いてかれないためにフォロー必須なアカウント47選 2023年12月時点で英語圏で人気のある大規模言語モデル…

2023年11月27日の週に気になった記事などまとめ

GPT APIを使ったテキスト生成コンペ@YANS2023に参加した話 日常能力を試すテスト『GAIA』正答率、人間92%に対してGPT-4は15% 一般的なニーズに応えるAI開発の指針に ドメインの放棄 企業はどのようにドメインを捨てるべきか? re:Invent関連イベントスケジュ…

2023年11月20日の週に気になった記事などまとめ

Amazon OpenSearch ServiceとBedrockを組み合わせてRAGを作る(LangChainいらず) 検索付き LLM 手法 REPLUG の再現実験 生成AI活用により9万6,000時間/月、 国内パートナー数の10%にあたる600人月相当の業務時間を創出 ~「AI活用No.1企業グループ」に向け…

2023年11月13日の週に気になった記事などまとめ

1行から始めるプロンプトインジェクション対策 OpenAI Python API ライブラリ 1.x への移行 GPTs のプロンプトリーキング対策 20231112_ChatGPTの活用によるデータサイエンス人材の育成 Assistants APIでretrievalをStreamlitで使ってみる ALMA_7B_Ja_V2_g…

2023年11月6日の週に気になった記事などまとめ

LLMのための日本語インストラクションデータ作成プロジェクト 拡散モデルによる金融時系列生成 ブラウザでリロードしながらキャッシュの挙動を確認してる全ての開発者へ Retrieval-based LM (RAG system) ざっくり理解する 日英・英日機械翻訳モデルALMA-7B-…

Windows11でNASNEのフォルダ共有が利用できなくなった時の対応

Windows11のPCでNASNEの共有フォルダを利用しようとしたところ、アクセスできなくなっていたことに対応したのでメモ 発生した事象 ネットワークでnasne-###XXXが表示されない やったこと 「Windowsの機能の有効化または無効化」の「SMB 1.0/CIFS クライアン…

2023年10月30日の週に気になった記事などまとめ

IBIS2023チュートリアル「大規模言語モデル活用技術の最前線」 2023年度版「データサイエンティスト スキルチェックリストver.5」および「データサイエンス領域タスクリスト ver.4」を発表 MT-Benchによる各種LLMの日本語運用能力評価まとめ(23/10/31更新) …

2023年10月23日の週に気になった記事などまとめ

構成図を描く際に気をつけていること MiniGPT-4のAPIを実装する。 プログラムでマルチモーダルを自由に操作する。 キャッチアップ速度が速い #とは Azureにおける IPv4アドレス枯渇との戦い方 自動運転のための大規模なVisual QAデータセット・AutoScene…

2023年10月16日の週に気になった記事などまとめ

アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明(生成AIウィークリー) Diffusion modelを用いたfew-shot商品画像分類の検討 Kaggleコンペ(LLM Science Exam)の振り返りと上位解法まとめ autowarefoundation/au…

2023年10月9日の週に気になった記事などまとめ

Google Colab で LLaVA-1.5 を試す シュッと AutoGen と戯れる 商用利用可能な「Japanese StableLM Instruct Alpha 7B v2」をリリースしました Automatic Prompt Engineer aws-samples/generative-ai-use-cases-jp 続・生成AI周回遅れキャッチアップ勉強会…

2023年10月2日の週に気になった記事などまとめ

GPT-4などのLLMが「AはB」から「BはA」を導かない『逆転の呪い』における誤解なき解釈と対策 GPT-4、Bard、Claude2などの異なるLLMが円卓を囲み議論した結果の回答は品質が高いとの検証報告。円卓ツールも公開 Stable LM 3Bのご紹介: 持続可能で高性能な言語…

2023年9月25日の週に気になった記事などまとめ

LLMを用いたLLMの自動評価について 〜可能性と注意点〜 llm-jp/awesome-japanese-llm Webやアプリの日本語を読みやすく折り返す「BudouX」。GoogleがGitHubで公開 Google Colab で DeepSpeed によるLLMのフルパラメータの指示チューニングを試す サイバーセ…

2023年9月18日の週に気になった記事などまとめ

足りないパッケージを自分で判断して、インストールして再実行してくれる機能の実装例 yoheinakajima/instagraph 【ChatGPTにできることを正しく理解する③】グノシーのChatGPT活用法とは Open InterpreterをDockerで動かす GPT-3.5-turbo を Fine-tuning し…

生成AIの利用ガイドラインまとめ ※更新中

生成AIの利用ガイドラインで見つけたものを張っていく 東京都職員向け文章生成AIの利活用に関するガイドライン 中小企業のための「生成AI」活用入門ガイド JDLA 生成AIの利用ガイドライン 初等中等教育段階における生成AIの利用に関する暫定的なガイドライン…

2023年9月11日の週に気になった記事などまとめ

microsoft/promptflow 好みのチャットbotを短い文章で作れるツール「Prompt2Model」 米カーネギーメロン大などが開発 LLMの出力制御や新モデルについて【技術動向調査】 ELYZAが公開した日本語LLM「ELYZA-japanese-Llama-2-7b」についての解説 : (1) 事前学…

2023年9月4日の週に気になった記事などまとめ

ChatGPTに渡す文章の適切な区切り線について検証した記事 小売業で売り上げ数量の予測を実現するサンプルソリューションを公開しました OWASP Top 10 for LLMでLLM Applicationsのセキュリティについて学ぶ 【ChatGPTにできることを正しく理解する①】ChatGPT…

2023年8月28日の週に気になった記事などまとめ

LLMのファインチューニング で 何ができて 何ができないのか GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに 【ローカルLLM】Hugging FaceによるGPTQ量子化ガイド Google Cloud で生成 AI アプリケーションを作ろ…

2023年8月21日の週に気になった記事などまとめ

AIが「理解」するから、API仕様書のコピペでアプリができあがるローコード開発環境「Flowise」を試す azure-openai-design-patterns プログラミング言語に特化した10億パラメータのLLM、Decicoderの使い方 japanese-text-generation-webui-colab 【ローカルL…

2023年8月14日の週に気になった記事などまとめ

Multiple Retrieval Sources 36億パラメータの日本語言語モデルを公開しました hojichar Lambda + DynamoDB + LangChainで外部情報に対応したサーバレスチャットボットを作ってみる 検索結果の品質向上 LangChainを格段に使いやすくするtips ChatGPTにマクロ…

line-corporation/japanese-large-lm-3.6b-instruction-sftを動かしてみた

ほぼ、npakaさんの記事そのままですが、誰かの役に立つかもしれないので、 line-corporation/japanese-large-lm-3.6b-instruction-sftをGoogle ColabのT4GPUで動かしたときのメモを残します # パッケージのインストール !pip install transformers accelerat…

2023年8月7日の週に気になった記事などまとめ

最近の話題にも詳しい14億パラメータの日本語LLMの公開 日本語言語モデル「Japanese StableLM Alpha」をリリースしました Text Split Explorer 日本語指示データ・日本語擬似レビューの公開 Parent Document Retriever japanese-stablelm-base-alpha-7bのLoR…

2023年7月31日の週に気になった記事などまとめ

rinna、日英バイリンガル大規模言語モデルをオープンソースで公開 JP RAG SOLUTION VS Codeエディタ入門 Amazon QuickSight の Generative BI 機能を発表 無料版Colabでrinna/bilingual-gpt-neox-4b-instruction-ppoを動かす Unleash the Power of Azure Ope…

2023年7月24日の週に気になった記事などまとめ

エンジニアはLLMとどう付き合うか / How engineer get along with LLM OpenAI API サンプルコード・ラッパーまとめ 機械学習を「社会実装」するということ 2023年7月版 大規模言語モデル時代のHuman-in-the-Loop機械学習 開発チーム作成ガイドを公開します …

2023年7月17日の週に気になった記事などまとめ

プロダクトでのデータ活用を推進するために回避すべき 10 の罠 GPTで作ったAIに24時間お問合せ対応をしてもらう方法とは? 導入手順とそのリアルな成果と課題を徹底レポート! LLM Meetup Tokyo #3 streamlit_agent/chat_with_documents.py OpenAIのAPIを使…

2023年7月10日の週に気になった記事などまとめ

ChatGPT Code Interpreterの活用方法を片っ端から試していく Kaggle(Airline Customer Holiday Booking Dataset)をCode Interpreterで分析してみる GitHub Copilotの全社導入とその効果 Amazon SageMaker で OpenChatKit モデルを活用し カスタムチャットボ…

2023年7月3日の週に気になった記事などまとめ

外部データをRetrievalしてLLM活用する上での課題と対策案 GPT系の日本語LLMモデル sudy-super/CoTangent 日本語に特化した大規模言語モデル(生成AI)を試作 第2回 LLM 勉強会 OpenAIの埋め込みよりも高性能?多言語E5を日本語で評価してみる 複数の ChatGP…

PowerQueryで複数ファイルの複数シートのデータを読み込むときに列ずれが起きた時に確認すること

PowerQueryで複数シート、複数ファイルを一つのシートにまとめるときに困ったことがあるので、 困ったことをメモしておく 困ったこと 特定のシートを読み込んだときに列ずれが発生してしまう 対処方法 ファイルを読み込むときに選択したサンプルファイルの各…