본 Kaggle Competition Study는 이미 종료된 대회를 다시 분석하고 뜯어보는 Study입니다. Top Ranker들의 공개된 커널을 필사했습니다. 처음에는 하나 하나 이해하며 그대로 필사를 했고, 그 다음은 필사한 코드를 처음부터 다시 쭉 복습을 했고, 마지막으로 처음부터 다시 복습하며 전체적인 흐름을 재차 익혔습니다. 즉, 하나의 커널당 3번을 분석했습니다. Competition 및 커널 선정은 캐글코리아 이유한님의 커널커리큘럼을 참고했습니다.
Ridge, Lasso, Random Forest, Gradient Boost를 통한 자전거 수요량 예측
다양한 Feature Engineering 후 XGBoost를 통한 향후 판매량 예측
다양한 모델 성능 검증을 위한 Iris 꽃 종류 예측
2003.1.6.부터 2015.5.13.까지 샌프란시스코에서 발생한 범죄 분류 문제
브라질의 자동차 보험 회사인 Porto Seguro의 안전 운전자 예측. 특정 차주가 내년에 보험 청구를 할 확률을 예측
각 고객의 정보를 기반으로 해당 고객이 대출한 돈을 갚을 수 있을지 없을지에 대한 확률을 예측
한 가정이 가지고 있는 140여 개의 속성을 기반으로 그 가정이 가난한 가정인지 부유한 가정인지 판단 (Multi Class Classification)
본 대회는 위성으로 바다 위를 찍은 사진을 기반으로 그 물체가 빙하인지 배인지 분류하는 대회입니다. (Statoil과 C-CORE는 회사 이름입니다.)