Бұл бастапқы деректерді түсінікті пішімге түрлендіретін деректерді өңдеу әдісі. Шикі деректер (нақты дүние деректері) әрқашан толық емес және бұл деректерді үлгі арқылы жіберу мүмкін емес. Бұл белгілі бір қателерді тудырады. Сондықтан үлгі арқылы жібермес бұрын деректерді алдын ала өңдеу керек
Деректерді неліктен алдын ала өңдеу керек?
Бұл өңделмеген деректерді түсінікті пішімге түрлендіретін деректерді өндіру әдісі Шикі деректер (нақты әлем деректері) әрқашан толық емес және бұл деректерді үлгі арқылы жіберу мүмкін емес. Бұл белгілі бір қателерді тудырады. Сондықтан үлгі арқылы жібермес бұрын деректерді алдын ала өңдеуіміз керек.
Сынақ деректерін алдын ала өңдеуім керек пе?
Бұның негізгі мәні: Сынақ немесе поезд деректерін түрлендіру үшін бүкіл деректер жиынында орнатылған алдын ала өңдеу әдісін пайдаланбау керек. Олай етсеңіз, сіз абайсызда пойыз жинағынан сынақ жинағына ақпаратты тасымалдайсыз.
Деректердің ағу мәселесі дегеніміз не?
Деректердің ағып кетуі - бұл ұйым ішінен сыртқы межелі орынға немесе алушыға деректердің рұқсатсыз берілуі … Деректердің ағуы, сондай-ақ төмен және баяу деректерді ұрлау деп те аталады, үлкен мәселе. деректер қауіпсіздігі үшін және көлеміне немесе саласына қарамастан кез келген ұйымға келтірілген залал ауыр болуы мүмкін.
Сынақ деректерін қалай түрлендіруге болады?
трансформация барлық мүмкіндіктерді орташаны алып тастау және дисперсияға бөлу арқылы түрлендіреді. Ыңғайлы болу үшін бұл екі функция шақыруын fit_transform арқылы бір қадамда жасауға болады.