- GPT-4などのLLMが「AはB」から「BはA」を導かない『逆転の呪い』における誤解なき解釈と対策
- GPT-4、Bard、Claude2などの異なるLLMが円卓を囲み議論した結果の回答は品質が高いとの検証報告。円卓ツールも公開
- Stable LM 3Bのご紹介: 持続可能で高性能な言語モデルをスマートデバイスへ
- 筋肉ですべてを解決する人のプログラミング上達方法
- AWS ECSを用いた物体検出サービスの開発
- HuggingFace Transformers の チャットモデルテンプレート を試す
- hppRC/simple-simcse-ja
- OpenAI Python SDKの1.0がプレビューされている
- リポジトリ全体のコーディング作業を一気に自動編集する生成AI「CodePlan」 米Microsoftが開発
- AutoGen
- Function CallingがFineTuningに対応した
- 生成AI・LLMのツール拡張に関する論文の動向調査 2023年9月版
GPT-4などのLLMが「AはB」から「BはA」を導かない『逆転の呪い』における誤解なき解釈と対策
- ある教師データによって示された事実を別の角度から言い換えることはできない逆転の呪いの事象を説明した論文の紹介
- 逆転の呪いへの対処法についても記載されている
GPT-4、Bard、Claude2などの異なるLLMが円卓を囲み議論した結果の回答は品質が高いとの検証報告。円卓ツールも公開
Stable LM 3Bのご紹介: 持続可能で高性能な言語モデルをスマートデバイスへ
- ハンドヘルドやラップトップなどの携帯デジタル機器上で動作するように設計されたコンパクトな言語モデル「Stable LM 3B 」が公開された
- モデルはベースモデル
- CC-By-SA4.0ライセンスで公開されている
筋肉ですべてを解決する人のプログラミング上達方法
- すごいエンジニアの学び方のメソッドについて
- まず、自分が何が遅いかを把握しないといけない
AWS ECSを用いた物体検出サービスの開発
- MMDetection を利用した物体検出モデル(Object Detection)をWeb Serviceとしてデプロイする際に直面した問題をどのように解決したかを紹介した記事
- 個人的に印象的だったこと
HuggingFace Transformers の チャットモデルテンプレート を試す
hppRC/simple-simcse-ja
- SimCSEをベースに多様な事前学習済み言語モデル・訓練データセット・ハイパーパラメータで訓練を行い、実験の結果選定された設定でfine-tuningを行った、事前学習済みの日本語文埋め込みモデルが4つ公開された
- SimCSEでファインチューニングする場合にベースとして選ぶべきモデル、利用すべきデータセットが公開されている
OpenAI Python SDKの1.0がプレビューされている
- 以下のような大きな変更があるため、注意が必要
- クライアントをインスタンス化することがおすすめされている
リポジトリ全体のコーディング作業を一気に自動編集する生成AI「CodePlan」 米Microsoftが開発
AutoGen
Function CallingがFineTuningに対応した
- Finetuningに完全な関数定義が存在しない場合も同様の応答を取得できるようになる
- 関数とパラメータの説明を省略
- パラメータを省略
- 関数を省略
- 関数呼び出しの正確性を高める