SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

2021-01-01から1年間の記事一覧

AWS Certified Data Analytics - Specialtyのために勉強したことまとめ

AWS Certified Data Analytics - Specialtyを受験のために、勉強中に学んだことをこのページに記述していく ※更新中 RedShift 自動スナップショット Redshiftでは、自動スナップショットを取得できる. デフォルトだと、8時間ごとまたは1ノードのデータが5GB…

独学大全を読みました

読もうと思った理由 効率よく独学をしたいと考えたから 今よりも効率よく勉強する方法があると考えたから 時間がない中でどのように学習すればよいか知りたかったから 全体的な感想 一人で学習することは難しいことだということを感じた 学んだことがやりっ…

AWS Certified Machine Learning – Specialtyに合格しました

昨日、AWS 認定 機械学習 – 専門知識を受験して、 合格したので、その時にやった勉強方法や学んだ感想を記録します。 資格を受けようと思ったきっかけ AWSを使うことで、機械学習モデルの構築・運用をどのようにサポートされるかを理解したい ついでにAWSの…

AWS関係勉強メモまとめ_2021年4月

最近のAWS関係の勉強で不明点をTwitterにメモったことをまとめておく ひとまず、Tweetを張って追加で調べたほうがいいことを考える 機械学習周り SageMaker、Kinesisあたりでいろいろと新しいことを知ったが、整理できてない感が。。。 SageMaker SageMaker…

AWS SageMakerの因数分解機について調べてみた

AWSの因数分解機について理解できていないので、調べてメモを残す 分類や回帰に使用できる 線形回帰よりも疎なデータセットにおいて、計算効率がよい レコメンドに使用される 利用イメージ 密なユーザ行列と密なアイテム行列を使って、疎な評価行列(ユーザ*…

Partial Dependence Plotについて調べてみた

Partial Dependence Plotについて調べたので、理解できた内容を以下に記録する ターゲットと対象の入力特徴のセットとの間の依存性を示す 興味のある変数以外の影響を周辺化して消す 元の説明変数の値からある説明変数の値をすべて何かの値xに置き換えて、予…

Permutation Importanceについて調べてみた

Permutation Importanceについて調べてみたので、分かったことについて以下にまとめる 調べて理解できたこと 「ある特徴量がどれだけモデルの予測精度向上に寄与しているのか」を解釈したもの ある特徴量をランダムに並べ替えて、どの程度モデルの誤差へ影響…

SHAP理解できたこと

まだまだ勉強中ですが、SHAPについて理解できたことをメモしておく。 ちゃんと理解できていないので、間違いがあると思いますが、 その際は優しくご指摘いただけると幸いです。 近似するモデルについて 予測結果に対する各変数の寄与を求める手法 学習したモ…

Docker上にWordCloud + MeCab +Jupyter環境構築する際にはまったこと

Docker上にWordCloud + MeCab +Jupyter環境を構築したがはまったので、 非常に雑だがメモしておく。 はまったこと MeCabを利用しようとしたら、以下のエラーが出る error message: [ifs] no such file or directory: /usr/local/etc/mecabrc 以下を実行して…

AI・データ分析プロジェクトのすべてを読みました

読もうと思った理由 データ分析プロジェクトのはまりどころを把握したかった データサイエンティストの情報収集方法を知りたかった 全体的な感想 今まで暗黙知になりがちだったノウハウが文書化されていて、プロジェクトを進めるうえで非常に参考になる 本で…

t-SNEについて調べてみた

t-SNEとは?となり調べたので、理解できたことをメモしておく。 書いてみて、ちゃんと理解できてない感たっぷりですが、そのまま残しておきます。 t-SNEは高次元のデータを二次元または三次元に圧縮して可視化する 元の特徴空間上で近い点が圧縮後の次元でも…

Amazon QuickSight のML インサイトについて調べてみた

Amazon QuickSight のML インサイトについて簡単に調べてみたので、メモをしておく MLインサイトでできること ML を使用した異常検出 ランダムカットフォレストにて、異常検知する ML を使用した予測 - 異常なデータポイントを除外し、予測する 自動説明文 …

AWS Data Pipeline について調べてみた

AWS Data Pipelineがよくわからなかったので、調べてみたことを以下に記述する。 完全にメモですので、ご了承ください。 AWS Data Pipelineとは データの移動と変換をスケジュールベースで自動化するサービス 1日に一回程度発生するデータの回収やバックアッ…