-1 এবং 1 এর মধ্যে ডেটা কীভাবে সাধারণ করা যায়?


36

আমি সর্বনিম্ন সর্বাধিক স্বাভাবিককরণের সূত্রটি দেখেছি কিন্তু এটি 0 এবং 1 এর মধ্যে মানগুলিকে স্বাভাবিক করে তোলে আমি কীভাবে আমার ডেটা -1 এবং 1 এর মধ্যে স্বাভাবিক করব? আমার ডেটা ম্যাট্রিক্সে আমার নেতিবাচক এবং ধনাত্মক উভয় মান রয়েছে।


1
আপনি যদি আরে কাজ করছেন তবে কয়েকটি বিকল্পের জন্য এই থ্রেডটি দেখুন । বিশেষত, গৃহীত উত্তরের একটি মন্তব্যে এই ফাংশন রয়েছে যেখানে আপনি 'নিউম্যাক্স' কে 1 এবং 'নিউমিন' থেকে -1 এ সেট করেছেন এবং আপনার ডেটাতে ফাংশনটি চালান
mtreg

: আপনি নিম্নরূপ উইকিপিডিয়া রেফারেন্স জানতে পারেন en.wikipedia.org/wiki/Normalization_(statistics)
সালেম

জাভাস্ক্রিপ্ট উদাহরণ, এখান থেকে নেওয়া । ফাংশন রূপান্তর (মান, r1, r2) {রিটার্ন (মান - r1 [0]) * (আর 2 [1] - আর 2 [0]) / (আর 1 [1] - আর 1 [0]) + আর 2 [0]; } রূপান্তরকরণ (328.17, [300.77, 559.22], [1, 10]); >>> 1.9541497388276272
জিউসেপ ক্যানেল

1
@ কোভেফি আপনি যদি এখনও আশেপাশে থাকেন তবে আপনি যে কোনও একটি উত্তর গ্রহণ করতে চাইতে পারেন
সিমোন

উত্তর:


97

সঙ্গে: আপনি আপনার বৈশিষ্ট্য স্বাভাবিক এক্স মধ্যে [0,1] x[0,1]

x=xminxmaxxminx
x[0,1]

[-1,1] এ স্বাভাবিক [1,1]করতে আপনি ব্যবহার করতে পারেন:

x=2xminxmaxxminx1

সাধারণভাবে, আপনি সবসময় একটি নতুন পরিবর্তনশীল পেতে পারেন x এর মধ্যে [a,b] :

x=(ba)xminxmaxxminx+a

15
সত্যিই এর জন্য আমার কাছে উদ্ধৃতি নেই। এটি কেবল একটি এলোমেলো ভেরিয়েবলের লিনিয়ার রূপান্তর is একটি এলোমেলো ভেরিয়েবলের সমর্থনে রৈখিক রূপান্তরগুলির প্রভাবটি দেখুন।
সাইমন

-1

আমি এলোমেলোভাবে উত্পন্ন ডেটা পরীক্ষা করেছি এবং

Xout=(ba)XinminXinmaxXinminXin+a

বিতরণ আকৃতি সংরক্ষণ করে না। এলোমেলো ভেরিয়েবলের ফাংশন ব্যবহার করে এটির যথাযথ উত্সাহটি দেখতে চাই।

আমার জন্য যে আকৃতিটি আকৃতি সংরক্ষণ করেছিল তা ব্যবহার করছিল:

Xout=Xinμinσinσout+μout

কোথায়

σout=ba6

(আমি স্বীকার করি যে 6 ব্যবহার করা কিছুটা নোংরা ) এবং

μout=b+a2

এবং

a এবং হ'ল কাঙ্ক্ষিত পরিসীমা; সুতরাং আসল প্রশ্ন অনুযায়ী এবং ।ba=1b=1

এই যুক্তি থেকে আমি ফলাফলটিতে পৌঁছেছি

Zout=Zin

Xoutμoutσout=Xinμinσin


3
আপনি কি নিশ্চিত যে এই গ্যারান্টিটি রুপান্তরিত তথ্য সীমার মধ্যেই থাকবে? আর সালে দেখুন: set.seed(1); scale(rnorm(1000))*.333। আমি একটি সর্বোচ্চ পেতে 1.230871। আপনার পদ্ধতিটি অনুরোধ অনুসারে এটিকে স্বাভাবিক করার চেয়ে ডেটা মানক করার জন্য কেবল একটি ঝাঁকুনি বলে মনে হচ্ছে। নোট করুন যে প্রশ্নটি এমন কোনও পদ্ধতির জন্য জিজ্ঞাসা করে না যা বিতরণের আকার সংরক্ষণ করে (যা সাধারণীকরণের জন্য একটি অদ্ভুত প্রয়োজনীয়তা হবে)।
গাং - মনিকা পুনরায়

3
আমি নিশ্চিত না যে কীভাবে আসল রূপান্তরটি ডেটার আকার সংরক্ষণে ব্যর্থ হতে পারে। এটি একটি ধ্রুবককে বিয়োগ করা এবং তারপরে ধ্রুবক দ্বারা ভাগ করার সমতুল্য, যা আপনার প্রস্তাবনাটি করে এবং যা ডেটার আকার পরিবর্তন করে না। আপনার প্রস্তাবটি ধরে নিয়েছে যে সমস্ত ডেটা গড়ের তিনটি স্ট্যান্ডার্ড বিচ্যুতির মধ্যে পড়ে যা ছোট, প্রায় সাধারণভাবে বিতরণ করা নমুনাগুলির সাথে কিছুটা যুক্তিযুক্ত হতে পারে তবে বড় বা অ-সাধারণ নমুনাগুলির সাথে নয়।
নোহ

1
@ নোয়া এটি ধ্রুবক দ্বারা বিয়োগ এবং ভাগ করার সমতুল্য নয় , কারণ সর্বনিম্ন এবং সর্বোচ্চ ডেটা এলোমেলো পরিবর্তনশীল। প্রকৃতপক্ষে, বেশিরভাগ অন্তর্নিহিত বিতরণের জন্য এগুলি বেশ পরিবর্তনশীল - বাকী ডেটাগুলির চেয়ে আরও পরিবর্তনশীল - যেহেতু মানককরণের কোনও ফর্মের জন্য এগুলি ব্যবহার করা সাধারণত কোনও ভাল ধারণা নয়। এই উত্তরটি এটা স্পষ্ট কি এবং গড় বা কিভাবে তারা তথ্য এর সাথে সম্পর্কিত করা যেতে পারে। ab
হোবার

2
@ যাইহোক সত্য, তবে আমি বোঝাতে চাইছি যে একটি প্রদত্ত ডেটাসেটে (অর্থাত্, ডেটাটিকে স্থির হিসাবে গণ্য করা), তারা ধ্রুবক, একইভাবে কোনও ডেটাসেটকে মানীকরণ করার সময় নমুনাটির অর্থ এবং নমুনার স্ট্যান্ডার্ড বিচ্যুতিটিকে ধ্রুবক হিসাবে দেখায়। আমার ধারণাটি ছিল যে ওপি কোনও বিতরণ নয়, একটি ডেটাসেটকে স্বাভাবিক করতে চেয়েছিল।
নোয়া

@ নোহায় আমারও একই ধারণা ছিল তবে আমি বিশ্বাস করি বর্তমান পোস্টটি অন্য কোনও ব্যাখ্যায় সাড়া জাগাতে পারে।
হোবার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.