これは日本人が機械学習(またはデータサイエンス)の各手法を簡単に使えるようにするためのリポジトリです。そのため、READMEやコメントはなるべく日本語で書くつもりです。
必要なモジュールをインストールしましょう。
pip install -r requirements.txt
でインストールできます。pipが使えない場合はググっでpipをインストールしてください。あるいは、pipではなくanacondaでも各モジュールをインストールできます。
kaggleのTitanicデータはすでにdata
の中に入っていますが、簡単にダウンロード方法を紹介します。
kaggleのTitanicデータは以下からダウンロードできます。kaggleへの登録(無料)が必要です。
https://www.kaggle.com/c/titanic/data
$すると、 titanic.zip
というデータがダウンロードできます。そのデータをこのリポジトリのdatai/titanic
ディレクトリの中に移動してください。そして、zipファイルを展開します。