[KT Aivle 3기 AI] 23일차. 미니프로젝트 2차 (1)
KT Aivle School 3기 AI 23일차
- 강사 : 박은원 강사님
- 주제 : 미세먼지 농도 예측 머신러닝 모델링
✅ 미니프로젝트 2차 (1)
이번 미니프로젝트도 두 가지 주제로 한 가지는 하루안에 끝내고, 다른 한가지는 2일동안 진행되었다. 먼저 하루짜리 프로젝트를 먼저 진행했는데, 시계열 데이터로 날씨와 미세먼지에 관련된 데이터에서 1시간 후의 미세먼지 농도를 예측하는 머신러닝 모델링이었다.
👍 느낀 점
시계열 데이터를 처리하는 방법, 처리할 때 주의사항 등을 느낄 수 있었다(시간순으로 정렬 되어있어야 하며, 결측치 행을 함부로 삭제해서는 안된다. 결측치를 처리할 때는 시계열 데이터의 특징을 이용하자. 전처리하는 과정에서 target을 만들 수 있는 feature를 생성하지는 않는지 주의하자. 등등). 실습을 진행한 데이터의 경우 Linear Regression이 가장 좋게 나왔으며, 미세먼지 특성에만 높은 coef를 가지는 것을 확인할 수 있었다. RandomForest나 Gradient Boosting 등등을 사용해도 마찬가지로 미세먼지 특성에 매우 높은 feature importance를 보였다. 일반적으론 Linear Regression 보다 고차원의 모델이 성능이 좋을 것이라 예측하지만 Task에 따라서 결과는 다르게 나올 수 있다.
다른 분들의 발표를 들어보면 엄청나게 잘하시는 분들이 많다는 것도 알게 되었고, 내가 한것도 나쁘지 않게 잘 했다는 것도 느낄 수 있었다. 항상 현재에 안주하지 말고, 거만하지 않고 겸손하게 내 실력을 향상 시켜 나가자!!