Kou

時系列

時系列データとトランザクションデータの違いとは

時系列データ 時系列データとは、その名の通り、時系列に生成できたデータのことを指します。例えば自分が体重を毎日測定しているとして、10日間のデータを示すとこのようになります。 日にち体重 (kg)1/150.01/250....
機械学習

Lasso回帰の特徴とメリットデメリット

Lasso回帰とは Lasso回帰、またはL1正則化線形回帰は、統計学および機械学習の分野でよく用いられる手法の一つです。回帰分析の目的は、データに最もよく適合するモデルを見つけることです。通常の線形回帰では、予測値と実際の値との差...
時系列

時系列分析に関する特徴量エンジニアリングの基本

時系列データは、経済学、気象学、医学など、多くの分野で一般的に使用されるデータの一つです。時系列データの予測や解析のためには、適切な特徴量の生成が必要です。本記事では、時系列分析における基本的な特徴量エンジニアリングのテクニックを紹介しま...
IT

応用情報技術者試験に2か月で合格したので、勉強方法を公開します

応用情報技術者試験とは 応用情報技術者試験(通称:応用情報)は、日本における情報技術者の資格試験の一つで、情報処理推進機構(IPA)が実施しています。この試験は、情報技術に関する基本的な知識を持ち、さらに実務経験を通じてその知識を実...
深層学習

分類予測の評価に用いられるROC曲線とAUCの解説と有用性

はじめに ROC(Receiver Operating Characteristic)曲線とAUC(Area Under the Curve)は、機械学習や統計分析において、分類モデルの評価と比較に広く使用される重要な指標です。この...
未分類

RCT等で用いられる「傾向スコア」とは。算出方法とメリットを理解しよう

傾向スコアとは 傾向スコアとは、実験や観察研究などで観測されたデータから、因果関係を推定するために用いられる数値です。具体的には、介入群(例えば治療群)と非介入群(例えば対照群)との間で、バイアスを調整するために使用されます。傾向ス...
深層学習

深層学習で用いられている学習率とその役割とは

はじめに 深層学習は、機械学習の分野において驚異的な成果を上げています。その中でも、ニューラルネットワークの訓練において重要な役割を果たすのが「学習率」です。本記事では、深層学習においてどのように学習率が利用されているか、その役割や...
統計

NMF(非負値行列因子分解NMF)の特徴と使い方

NMFとは データ解析の領域では、非負値行列因子分解(Non-negative Matrix Factorization、NMF)は強力な統計処理手法として注目を浴びています。NMFは、多次元データの表現を非負の要素から構成される基...
統計

集合の計算に用いられるダイス係数とは

ダイス係数とは データ解析や情報検索の分野では、複数の集合や文書の類似度を評価する必要があります。そのために用いられる指標の一つが「ダイス係数」です。この記事では、ダイス係数の概要とその計算方法、応用例について解説します。 ダ...
統計

SGD回帰の特徴と重回帰との違いとは

SGD回帰とは SGD回帰は、確率的勾配降下法を用いて回帰モデルのパラメータを最適化する手法です。通常、単回帰として使用されますが、複数の説明変数を考慮する場合もあります。SGD回帰では、データセット全体ではなく、ランダムなサンプル...
Copied title and URL