본문 바로가기

머신러닝2

Feature Scaling이란? 오늘은 머신러닝에서 활용하는 Feature Scaling에 대해 알아보려 합니다. 저는 대학에서 통계학에 대해 공부하진 않았지만, 고등학교 시절 통계 단원에 나왔던 정규화와를 떠올리며 이해하니 조금은 이해가 잘 되었던 것 같습니다. 개념 Feature Scaling은 데이터의 범위를 조정하거나 표준화하는 방법입니다. 특성 간에 다른 범위나 척도를 가진 데이터를 같은 범위나 척도로 변경하는 것을 목표로 합니다. Feature Scaling은 머신러닝 모델의 입력 데이터로 사용되는 특성의 값들이 너무 크거나, 혹은 특성 간의 범위 차이가 클 때 모델 성능에 영향을 줄 수 있기 때문에 중요합니다. 활용 이유 Feature Scaling은 머신러닝 모델의 성능을 향상시키는 데 도움이 됩니다. 모든 특성이 비슷한.. 2023. 7. 4.
One-Hot Encoding이란 오늘은 ML/DL에서 데이터 전처리 시 활용하는 One-Hot Encoding에 대해 알아보겠습니다. 개념 One-hot 인코딩은 머신러닝에서 범주형 데이터를 처리할 때 자주 사용되는 기법입니다. 이는 범주형 변수를 컴퓨터가 이해할 수 있는 형태로 변환하는 방법 중 하나입니다. 머신러닝 알고리즘들은 대부분 숫자를 입력으로 받습니다. 그러나 많은 데이터셋들은 숫자가 아닌 범주형 데이터, 예를 들어 '붉은', '파란', '녹색'과 같은 색상 레이블 또는 '고양이', '개', '토끼' 등의 동물 범주를 포함하고 있을 수 있습니다. One-hot 인코딩은 이러한 범주형 데이터를 0과 1로 이루어진 벡터로 변환합니다. 범주 각각에 대해 고유한 이진 벡터를 생성하며, 해당 범주에 해당하는 요소는 1이고, 나머지 요.. 2023. 7. 3.