Matsu Blog

マーケティング、事業開発、統計学をテーマに何かしらを書き留めていきます

データサイエンス

ロジスティック回帰さん 独占インタビュー「分類を行う私がなぜ"回帰"と名乗るのか」

司会「本日はロジスティック回帰分析さんにお越しいただきました。ロジさん、本日はよろしくお願いいたします。」 ロジスティック回帰(以下ロジ)「はい、よろしくお願いいたしますー。」 司会「早速ですけど自己紹介をお願いします。」 ロジ「はい、ロジス…

生存時間分析とマーケティング

あることがきっかけで生存時間分析(survival time analysis)を勉強することになったので、調べたことを簡単にまとめてみようと思います。 生存時間分析では生存時間を分析します(そのまま)。定義は以下の通り。 生存時間解析 (survival time analysis) で…

VIF(分散拡大要因)とは結局何なのか

重回帰分析を行う際、多重共線性を回避するため、あらかじめその有無をVIF(Variance inflation factor: 分散拡大要因)によって確認することか一般的かと思います。 一般的にはVIFが10を超えると多重共線性の問題が生じる恐れがあると判断し1、適切な対処が…

Pythonでコンジョイント分析に挑戦

マーケティング戦略や施策を検討する際、その第一歩として、自社の顧客を深く理解することが重要となります。 ここ数年のAI・データサイエンティストブームもあってか、属性・行動データの分析を顧客理解の主たる手段として位置付けているケースをしばしば目…

因子分析を行う前に知っておきたいこと

多変量解析について調べるとよく目にする因子分析(Factor analysis)。 個人的には使ったことがなく、わからないことが多かったので今回いろいろ調べてみました。 基本的な考え方というよりは、分析の大前提や注意点を中心にまとめていきます。 因子分析とは …

交互作用と単純傾斜分析についてまとめてみた

はじめに 回帰分析シリーズ(?)第5弾です。 今回は、回帰分析で複数の説明変数の相乗効果を考慮するための方法について記事にまとめました。 過去記事 回帰係数の有意性の話 -その説明変数に説明力はあるか?- - Matsu's blog 相関係数と偏回帰係数の関係性と…

相関係数と偏回帰係数の関係性 -何が違い、どう解釈すればよいか?-

はじめに 「相関係数と偏回帰係数って何がどう違うの?」というかつて抱いてた疑問に対する答えを書き留めます。 なお、回帰分析について何となく理解していることを前提に書いています。 回帰係数のおさらい 偏回帰係数 ある説明変数について、それ以外の説…

多重共線性の対応事例をまとめてみた

はじめに 多重共線性については以前同じような記事を書いたのですが、公表されている論文で実際にどう扱われているか気になったので調べてみました。 はじめに 事例1:高い相関関係にある変数のうち一方を除外するパターン 事例2:VIF<10を満たすように変数追…

回帰係数の有意性の話 -その説明変数に説明力はあるか?-

はじめに 回帰分析を行うのは簡単ですが、その結果を解釈するのはなかなか難しいものがあります。 私自身、理解できていない部分があったため、今回はそのことについてまとめてみました。 回帰分析の結果を見てみる 重回帰分析を行い、その結果を確認してみ…

重回帰分析における多重共線性への対応

はじめに StatsModels(Python)で重回帰分析をしたところ以下のようなメッセージ(多重共線性の発生)が表示され困惑したため、そのとき調べたことをまとめてみました。 [2] The smallest eigenvalue is 7.16e-29. This might indicate that there are strong…

aikoにとっての"あなた"は20年でどう変化したか -word2vecによる歌詞の分析-

※当記事は過去にQiitaに投降したものと同様です qiita.com 分析に至った背景 以前から自然言語処理で何か面白いことをしたいと思ってはいたものの、手をつけないまま何か月も過ごしていました。しかし!!!今年のGWは奇跡の10連休です。思い切って何かに挑…