泰坦尼克号生存者预测(Titanic Survival)是谷歌Kaggle人工智能大赛中的经典亲例。本任务要求根据给定的1300余位乘客的特征(姓名、性别、年龄、舱位等】及幸存情况(0-死亡,1-幸存】建立神经网络模型,能够较巿准确地预测测试集中乘客的幸存情况。
主要流程为:
- 数据的导人及预处理
- 建立全连接网络蟆型
- 模型的训练与可视化(MatplotLib)
- 评估、预测
通过对本案例的学习,可以达到以下目的:
1)回顾和掌握数据预处理方法
2) 熟练掌握基于SequentiaL模式,建立全连接神经网络模型的方法
3) 掌握模型的编译与训练方法
4) 掌握训练过程可视化方法(使用MatplotLib)
5) 掌握模型的评估与预测方法
一、熟悉数据集
数据集下载地址:
https://www.kaggle.com/c/titanic
主要字段说明(其余字段如家庭地址等对建幔意义不大,省略)
Survival列是数据的标签(Label),本任务属于监督学习,模型训练的目的是从训练集中学到样本的特征和标签的映射规则,从而可以预测新的样本特征的标签。
模型的用途是预测标签为0或1,因此属于监督学中的二分类问题。
二、导入数据集
下载数据集命名为tita