此次目的:
准备出几期博客来记录我学习kaggle数据科学入门竞赛的过程,顺便也将其中所学习到的知识分享出来。这是第一集(了解赛题),后面还会更新更详尽的代码和讲解等。(所学主要的内容来自与b站大学恩师“编程教学-Python“的教学视频内容)
简介
泰坦尼克号机器学习竞赛是 Kaggle 上的经典入门竞赛,旨在帮助新人熟悉 Kaggle 平台和机器学习的基本概念。通过预测哪些乘客在泰坦尼克号沉没事件中幸存下来,你将学习如何处理数据、构建预测模型,并最终提升你的数据科学技能。
泰坦尼克号 - 从灾难中学习机器学习竞赛地址
竞赛背景
1912 年 4 月 15 日,泰坦尼克号在首次航行中与冰山相撞并沉没。这场灾难导致超过 1500 人遇难,成为历史上最臭名昭著的海难之一。虽然生存带有一定的运气成分,但统计数据表明某些人群比其他人更有可能生还。
挑战任务
你的任务是基于乘客的特征(如姓名、年龄、性别、社会经济阶层等)构建一个机器学习模型,预测哪些乘客在这场海难中幸存下来。你将使用两个数据集:train.csv
包含 891 名乘客的详细信息,包括他们是否幸存的结果;test.csv
包含 418 名乘客的信息,但未提供他们的生还情况。你的任务是预测这些乘客的生还情况,并提交预测结果。
首先我们要下载数据下来(从赛题页面下载),或者在博客上方我已经帮大家下载好了,大家可以直接下载解压使用。