Kaggle | Getting Started:Titanic

为了方便在浏览网页时对不太认识的英文进行标注,我安装了chrome的diigo插件,免费版限制1000个标记,可以对文字进行高亮或者加备注,并且可以对做过标注的页面增加tag,便于管理。
官网
我做标记的一个页面

安装kaggle API

kaggle API github 地址

  • 在Anaconda新建了一个名为kaggle的环境,在该环境下执行
pip install kaggle
  • 获取CPI Token。在Kaggle账户中点击Create API Token并下载。

Image

  • 将该.json文件移动到C:\Users\Windows-username.kaggle\kaggle.json

如果在该目录下没有.kaggle文件夹,先确认kaggle已经安装成功,然后在环境中输入任意一个kaggle命令(例如获取比赛列表kaggle competitions list),出现需要token的提示后再刷新该目录。

  • 完成。输入下载数据集的命令进行测试。下载文件夹的路径为C:\Users\Windows-username.kaggle\competitions\titanic
kaggle competitions download -c titanic

学习kernal

Scikit-Learn ML from Start to Finish

安装了许多可视化的包,尤其是seaborn,真的是格外的强大了。例如:

sns.barplot(x="Pclass", y="Survived",hue="Sex", data=data_train);

Image

sns.pointplot(x="Pclass", y="Survived", hue="Sex", data=data_train,
              palette={"male": "blue", "female": "pink"},
              markers=["*", "o"], linestyles=["-", "--"]);

Image

Introduction to Ensembling/Stacking in Python

首先,第一级分类采用5个基本模型(Support Vector Machine,AdaBoost,GradientBoosting,ExtraTrees,RandomForest),其次第二级采用xgboost进行预测。
其中特别需要注意的是,XgBoost的安装不能直接用pip,而是需要将github上源码编译后才能安装。这里提供一个简单的安装方法,来自博客 Windows下在Anaconda3中安装python版的XGBoost库

  • 打开网址https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost,根据自己系统选择对应的文件并下载。
  • 将下载后的文件放在C:\Anaconda3\mywhl中(自定义其他位置也可以)
  • 运行Anaconda,切换目录至文件所在的文件夹,并输入命令
pip install xgboost-0.71-cp36-cp36m-win_amd64.whl
  • 安装成功

上传预测结果

kaggle competitions submit -c titanic -f submission.csv -m "Message"
Comments
Write a Comment