curiosity
github.com
- Perplexityのようなユーザ体験を持つチャットボットを構築する試みのリポジトリ
- Tavilyを利用して検索して実現する
【ServerlessDays 2024】生成AIアプリ実装におけるトレンド3選
qiita.com
スクラムに必要な知的生産性を上げるソフトスキル
speakerdeck.com
ArXivから論文を参照してLLMをColabでファインチューニングしてみる。
bwgift.hatenadiary.jp
- ローカルLLMを使い論文のabstractの解析を行い、そのデータセットでLoRAによるファインチューニングを試した記事
【株式会社ELYZA】|GENIAC成果報告会 自社開発モデルプレゼンテーション
speakerdeck.com
話題のGraphRAGにAWSで挑戦しよう!(LlamaIndexとNeptuneに入門)
qiita.com
- Neptune Analyticsは大規模ワークロード向け
Axcxept社、EZO×Qwen2.5シリーズでGPT-4-Turboを凌ぐ日本語LLM/自動CoT・RAGを採用
prtimes.jp
- 内部的に複数のステップを踏んで思考を深化させるAuto-CoTやリアルタイムでWeb検索する機能もある
Amazon SageMaker Studio now supports automatic shutdown of idle applications
aws.amazon.com
- SageMaker Studioにアイドル時間が続くとシャットダウンする機能が追加された
speakerdeck.com
Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more
developers.googleblog.com
- Gemini-1.5-Pro-002とGemini-1.5-Flash-002がリリースされた
LLM-jp-3 1.8B・3.7B・13B の公開
llmc.nii.ac.jp
Google Colab で LLM-jp-3 1.8B を試す
note.com
Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely
arxiv.org
- RAGの種類とタスクに基づいて、4つの種類のクエリに分類することを提案した論文
大規模言語モデルの性能の自動評価に関する問題点のメモ書き:Tanuki-8x8Bの事例から
zenn.dev
- CoTを用いた推論と単純な回答のみを返すことを求める場合で評価が異なってしまう
Gemini-1.5-Pro-002・Gemini-1.5-Flash-002・Gemini-1.5-Flash-8B-Exp-0924 の概要
note.com
- Gemini 1.5 Proの価格が50%以上下がっている
- Gemini 1.5 Flashはレイテンシーが削減されている
Azure AI Confidential Inferencing Preview
techcommunity.microsoft.com
待望の新機能!OpenAIのボイスモードの使用感を解説してみた
www.youtube.com
第10回フィッシング対策勉強会
www.antiphishing.jp
Llama 3.2 の概要
note.com
- 画像エンコーダーと言語モデルの間にアダプターが挿入された
- Llama 3.2 1B、3Bでも128Kトークンのコンテキスト長をサポートしている
Llama 3.2 を試す
note.com
- 1Bと3Bの軽量LLMはマルチリンガルの文章生成やツールの呼び出し能力に優れている
Small Language Models: Survey, Measurements, and Insights
arxiv.org
Enterprise trust in Azure OpenAI Service strengthened with Data Zones
azure.microsoft.com
- Azure OpenAI Serviceにデータゾーンデプロイメントが追加される
仕事を前に進めるためのコツ - 判断と決断と共有
speakerdeck.com
- 問題を理解するうえで重要なこと
- 未知のものは何か
- 与えられているものはなにか
- 条件はなにか
- タスクを分解するときには5W1Hを最初に整理する
- タスクの終了の定義と完成の定義が重要
- 情報を集めることができない中で答えを出すのが決断
- 決断が必要な場面のために基準を持つ
qiita.com
RAGに関する主要な論文を時系列順にまとめていく(2024年度版)
note.com
Beyond Bots: How AI Agents Are Driving the Next Wave of Enterprise Automation
menlovc.com
- ドメインへの特化性とLLMの自立性でエージェント市場をマップした記事
Upgrading the Moderation API with our new multimodal moderation model
openai.com
- OpenAIが新たなモデレーションモデルを導入した
- テキストと画像の両方のモデレーションを実現する
- 非英語コンテンツで以前のモデルよりも正確になった
speakerdeck.com
- 日本語の安全性に特化したモデルはほとんどない
- 安全性に関する評価データセットもモデルと同様の状況
OpenAI の新しくなった Moderation API を試す
note.com
憧れている人はいるか
konifar-zatsu.hatenadiary.jp
- 1年後/3年後どうなっていたいかの質問の代わりにあこがれている人はいますかと聞く
LLM-jp-3 を gguf に変換する手順
note.com
生成AIを用いた音声データ活用:記事作成プロセスの自動化
note.com
- 複数人で同時に話す場面では誰が発言しているかを正確に識別することが難しい
Microsoft、物議醸した「Recall」(リコール)を再設計 10月にプレビューへ
www.itmedia.co.jp
- 初期設定ではリコールを無効化
- リコールの完全削除も可能
Cursorを1年弱触っているエンジニアの最近の使い方
note.com
- Cursorを使うとコードの中身を簡単にAIに渡せる
生成AIの推論が高度になればなるほど、使う人間の側にも高度な知識が求められる
tjo.hatenablog.com
- 生成AIの推論が高度すぎるとハルシネーションかどうかの判定も難しくなる
LLM-jp-3 を llama.cpp を使って iPhone・Android で動かす
note.com
Llama-3.2-1B-Instructを少しだけファインチューニングしてColabでためす。
bwgift.hatenadiary.jp
Llama 3.2 の使い方
note.com
- transformers実装では入力された最後の画像のみに注目する
- 欧州連合に居住する個人、欧州連合に主たる事業所がある企業にはマルチモーダルモデルを使用するライセンス権が付与されない
- 日本語はサポートしてない
- bitsandbytes を使用して8bitまたは4bitで読み込むこともできる
RAGの性能を評価しよう
speakerdeck.com
CreateInquiryViaBedrock
github.com
- Bedrockを使って問い合わせ内容が問い合わせのガイドラインに沿っているかを確認するアプリ
Step FunctionsからはじめるBedrock @ JAWS-UG AI/ML
speakerdeck.com
Amazon Q data integration in AWS Glue 試してみた
speakerdeck.com
Amazon Titan Image Generator v2 の全機能を徹底検証:機能解説と実践ガイド
qiita.com
- 入力言語は英語のみ対応
- ネガティブプロンプトを利用し、画像に含めたくない要素を指定可能
speakerdeck.com
- AIがコーディングを担うようになると、開発自体にはそれほど時間がかからなくなる
- その分何をつくるのかの検討、作ったものの評価の時間と回数が増える
- 開発サイクルが短くなり、一日スプリントが基本になっていく
- より小さなチーム、より多くのチームへ
llm-jp-3-1.8b-instruct-Q4_K_MをollamaとColabでうごかしてみる。
bwgift.hatenadiary.jp
www.docswell.com
- 複雑なプログラムを一発で生成させるとコードの品質が安定しない
- 処理を分割したうえで、個々にテストファーストで進めたほうが内部品質は向上する
つよつよリーダーが 抜けたらどうする? 〜ナビタイムのAgile⽀援組織の変遷〜
speakerdeck.com
- つよつよリーダーが抜けたら不安を吐き出した
- 現状の課題やそれぞれのやりたいことを見直すきっかけとした