원핫인코딩1 Python으로 전처리 파이프라인 설계하기 Python으로 전처리 파이프라인 설계하기 파이프라인 이란 파이프라인(영어: pipeline)은 한 데이터 처리 단계의 출력이 다음 단계의 입력으로 이어지는 형태로 연결된 구조를 가리킨다. 이렇게 연결된 데이터 처리 단계는 한 여러 단계가 서로 동시에, 또는 병렬적으로 수행될 수 있어 효율성의 향상을 꾀할 수 있다. 각 단계 사이의 입출력을 중계하기 위해 버퍼가 사용될 수 있다. 이번 포스트에서는 간단히 데이터 셋을 로드하고 난 이후에 자동적으로 전처리가 가능한 간단한 전처리 파이프라인 (preprocessing pipeline)을 작성해 볼 예정입니다. 라이브러리 1 2 3 4 import pandas as pd from sklearn.imput import SimpleImputer from sklea.. 2022. 3. 22. 이전 1 다음