O famoso desafio do Titanic do Kaggle, nós propoêm criação de um model de algoritmo de machine learning para prever com alta taxa de acerto, quais passageiros sobreviverão ao naufrágio do Titanic.
O RMS Titanic foi um dos navios mais famosos e luxuosos já construídos na época. Ele foi projetado como um navio de passageiros de classe mundial e foi construído no início do século 20. O Titanic foi operado pela White Star Line e era aclamado como "inafundável" devido ao seu design inovador e tecnologia de segurança.
Em sua viagem inaugural, o Titanic partiu de Southampton, Inglaterra, em 10 de abril de 1912, com destino a Nova York. No entanto, em 14 de abril de 1912, o navio colidiu com um iceberg no Atlântico Norte, a cerca de 600 km ao sul da Terra Nova. A colisão danificou seriamente o casco do navio, resultando em seu naufrágio.
O naufrágio do Titanic é um dos desastres mais conhecidos da história. Devido à falta de botes salva-vidas suficientes e à má preparação para uma evacuação de emergência, mais de 1.500 pessoas perderam a vida. O navio afundou na madrugada de 15 de abril de 1912, e apenas cerca de 700 sobreviventes foram resgatados por navios que vieram em seu socorro.
Nesta competição, teremos acesso a dois conjuntos de dados semelhantes que incluem informações sobre os passageiros, como nome, idade, sexo, classe socioeconômica etc. Um conjunto de dados é intitulado train.csv e o outro é intitulado test.csv.
O train.csv conterá os detalhes de um subconjunto dos passageiros a bordo (891, para ser exato) e, o que é mais importante, revelará se eles sobreviveram ou não, também conhecido como "verdade básica".
O conjunto de dados test.csv contém informações semelhantes, mas não revela a "verdade básica" de cada passageiro. Sua tarefa é prever esses resultados.
Usando os padrões encontrados nos dados train.csv, devemos prever se os outros 418 passageiros a bordo (encontrados em test.csv) sobreviveram.
Fonte desafio: Titanic - Machine Learning from Disaster