Jihwan Blog

[사전학습] 3.5 데이터 축소 - 특징 선택

3. 데이터 전처리 이해와 실무 3.1 데이터 축소 : 특징 선택 특징 선택 (Feature Selection) 가장 좋은 성능을 보여줄 수 있는 데이터의 부분 집합(Subset)을 찾아내는 방법 => 모델 생성에 밀접한 데이터의 부분 집합을 선택하여 연산 효율성 및 모델 성능을 확보 목적 및 필요성 연산 효율성 특징 생성과는 다르게 원 데...

[사전학습] 3.4 데이터 변환 - 특징 생성

3. 데이터 전처리 이해와 실무 3.1 데이터 변환 : 특징 생성 특징 생성 (Feature Creation) 원본 데이터의 조합/변환 등을 기반하여 새로운 특징들을 구축 및 생성하는 방법 => 원본 데이터로 특징을 새롭게 생성하여 분석 과정 내 성능과 효율성 확보하고자 함 목적 및 필요성 품질 확보 : 가공을 거치지 않은 ...

[사전학습] 3.3 데이터 변환 - 구간화 정규화

3. 데이터 전처리 이해와 실무 3.1 데이터 변환 : 구간화 정규화 데이터 변환 (Transformation) 여러 형태로 표현된 데이터 값을 다양한 분석 방법론에 적용하기 위해 원시 형태에서 다른 형식으로 바꾸는 과정 => 주어진 목적 기반의 올바른 결과 획득을 위하여 원시 데이터를 데이터 분석에 용이하도록 형태 변환 변환 목적 ...

[사전학습] 3.2 이상 데이터 처리

3. 데이터 전처리 이해와 실무 3.1 데이터 정제 : 이상 데이터 처리 이상치(Outlier) 관측된 데이터 내 전체적 패턴에서 아주 작게 혹은 아주 크게 벗어난 값 => 데이터 분석 과정 및 결과에서 영향을 미쳐 분석 결과 및 의사 결정의 왜곡을 불러일으킬 수 있음 이상치 유형 잘못 수집된 경우 (오류 데이터) : 센서 ...