ডেটা ট্রান্সফর্মিং: সমস্ত ভেরিয়েবল না কেবল নরমাল?


14

এসপিএসএস ব্যবহার করে অ্যান্ডি ফিল্ডের আবিষ্কারক পরিসংখ্যানগুলিতে তিনি বলেছেন যে সমস্ত ভেরিয়েবলকে রূপান্তর করতে হবে।

তবে প্রকাশনায়: "ভৌগোলিকভাবে ওজনযুক্ত রিগ্রেশন I: মডেল ডিজাইন এবং মূল্যায়ন ব্যবহার করে ভূমি ব্যবহার এবং জলের মানের মধ্যে স্থানিকভাবে পরিবর্তিত সম্পর্কের পরীক্ষা করা" তারা নির্দিষ্টভাবে বলেছে যে কেবলমাত্র নরমাল পরিবর্তনশীল রূপান্তরিত হয়েছিল।

এই বিশ্লেষণ নির্দিষ্ট? উদাহরণস্বরূপ, অর্থের তুলনায়, কাঁচা ডেটার সাথে লগগুলির তুলনা করা স্পষ্টতই একটি তাত্পর্যপূর্ণ ফল অর্জন করতে পারে, যখন ভেরিয়েবলের মধ্যে সম্পর্ক তদন্ত করতে রিগ্রেশন জাতীয় কিছু ব্যবহার করার সময় এটি কম গুরুত্বপূর্ণ হয়ে ওঠে।

সম্পাদনা করুন: এখানে "ডেটা ট্রান্সফর্মেশন" বিভাগের সম্পূর্ণ পাঠ্য পৃষ্ঠাটি রয়েছে:

এবং কাগজের লিঙ্কটি এখানে: http : //www.sज्ञानdirect.com/s ज्ञान/ article / pii / S0048969708009121


16
আপনার পোস্ট করা নতুন চিত্রের উপর ভিত্তি করে লেখক "পর্যবেক্ষণ" দিয়ে "পরিবর্তনশীল" কে বিভ্রান্ত করছেন বলে মনে হয়। পি এর শীর্ষে। 154 তিনি যথাযথভাবে জোর দিয়েছিলেন যে আপনি যখন একটি পরিবর্তনশীল রূপান্তর করেন, আপনাকে অবশ্যই তার সমস্ত মান (পর্যবেক্ষণ) একইভাবে রূপান্তর করতে হবে, অন্যথায় কোনও কিছুর তুলনা করা অসম্ভব হয়ে যায়। (এটি "ভেরিয়েবলের মধ্যে সম্পর্কের কোনও পরিবর্তন ঘটবে না") এটির জন্য, যদিও সঠিক হওয়ার জন্য একটি চূড়ান্ত উদার ব্যাখ্যা প্রয়োজন)) পি এর নীচের অংশটি। 154 এত স্পষ্টতই ভুল, বাক্য দ্বারা বাক্যটি (এমনকি পাদটীকাতেও), এটির সাথে সমস্ত সমস্যাগুলি গণনা করাও সময়োপযোগী নয়।
হোবার

উত্তর:


17

আপনি বেশ কয়েকটি পরামর্শের উদ্ধৃতি দিয়েছেন, এগুলির মধ্যে সন্দেহাতীতভাবে সহায়তার উদ্দেশ্য নয়, তবে এটির কোনওটিতেই যথেষ্ট যোগ্যতা পাওয়া কঠিন।

প্রতিটি ক্ষেত্রে আমি আপনাকে সংক্ষিপ্তসার হিসাবে যা উদ্ধৃত করি তার উপর সম্পূর্ণ নির্ভর করি। লেখকদের রক্ষার জন্য আমি বিশ্বাস করতে চাই যে তারা পার্শ্ববর্তী বা অন্যান্য উপাদানগুলিতে উপযুক্ত যোগ্যতা যুক্ত করেছে। (স্বাভাবিক নাম (গুলি), তারিখ, শিরোনাম, (প্রকাশক, স্থান) বা (জার্নাল শিরোনাম, ভলিউম, পৃষ্ঠাগুলি) বিন্যাসে সম্পূর্ণ গ্রন্থপঞ্জি রেফারেন্স প্রশ্নটিকে বাড়িয়ে তুলবে))

ক্ষেত্র

এই পরামর্শটি সহায়তার উদ্দেশ্যে করা হয়েছে তবে এটি সর্বোত্তমভাবে প্রশস্ত করা হয়েছে। ক্ষেত্রের পরামর্শগুলি সাধারণত উদ্দেশ্যপ্রাপ্ত বলে মনে হয়; উদাহরণস্বরূপ, লেভেনের পরীক্ষার রেফারেন্সটি বৈকল্পিক বিশ্লেষণে কিছু অস্থায়ী ফোকাসকে বোঝায়।

(1,0)

আরও সাধারণভাবে, এটি অনেক সাধারণ ক্ষেত্রে - অনেক ক্ষেত্রেই স্বাভাবিক পরিস্থিতি - যে কোনও ভবিষ্যদ্বাণীকারীদের রুপান্তরিত করা উচিত এবং বাকীটি যেমন রয়েছে তেমন বামে।

এটা সত্য যে কোনও কাগজ বা গবেষণামূলক গবেষণার মুখোমুখি হওয়া বিভিন্ন রূপান্তরকের (যেমন একটি বিশেষ কেস, পরিচয় রূপান্তর বা যেমনটি রেখে যাওয়া) আলাদাভাবে প্রয়োগ করা হয় তা পাঠকের জন্য উদ্বেগের বিষয় হয়ে দাঁড়িয়েছে। এই মিশ্রণটি কি পছন্দের একটি সুচিন্তিত সেট, বা এটি স্বেচ্ছাসেবী এবং মজাদার ছিল?

তদ্ব্যতীত, ধারাবাহিক অধ্যয়নের ধারাবাহিকতায় পদ্ধতির ধারাবাহিকতা (সর্বদা একটি প্রতিক্রিয়াতে লগারিদম প্রয়োগ করা, বা কখনই করা হয় না) ফলাফলের তুলনা করতে প্রচুর পরিমাণে সহায়তা করে এবং ভিন্ন ভিন্ন পদ্ধতির ফলে এটি আরও কঠিন হয়ে যায়।

তবে এর অর্থ এমন নয় যে রূপান্তরগুলির মিশ্রণের কারণ হতে পারে না।

আমি দেখতে পাই না যে আপনি যে বিভাগটি উল্লেখ করেছেন তার বেশিরভাগ অংশে আপনি হলুদ রঙে হাইলাইট করে দেওয়া মূল পরামর্শটি নিয়ে বেশি প্রভাবিত। এটি নিজেই উদ্বেগের বিষয়: এটি একটি পরম নিয়ম ঘোষণা করা এবং তারপরে সত্যিকার অর্থে এটি ব্যাখ্যা না করা এক বিস্ময়কর ব্যবসা। বিপরীতে, আদেশ "মনে রাখবেন" নির্দেশ করে যে ফিল্ডের ভিত্তি বইয়ের আগে সরবরাহ করা হয়েছিল।

নামবিহীন কাগজ

এখানে প্রসঙ্গটি হ'ল রিগ্রেশন মডেল। প্রায়শই, ওএলএসের কথা বলা অদ্ভুতভাবে মডেলটির চেয়ে অনুমানের পদ্ধতির উপর জোর দেয় তবে আমরা কী বুঝতে চাই তা বুঝতে পারি। জিডাব্লুআরআর আমি ভৌগোলিকভাবে ওজনযুক্ত রিগ্রেশন হিসাবে বিবেচনা করি।

এখানে যুক্তিটি হ'ল আপনার অ-স্বাভাবিক ভবিষ্যদ্বাণীকারীদের রূপান্তর করা উচিত এবং অন্যকে যেমন হয় তেমন ছেড়ে দেওয়া উচিত। আবার, এটি সূচক ভেরিয়েবলগুলি দিয়ে আপনি কী করতে পারেন এবং কী করতে হবে তা নিয়ে একটি প্রশ্ন উত্থাপিত হয়, যা সাধারণত বিতরণ করা যায় না (যা উপরে হিসাবে উত্তর দেওয়া যেতে পারে যে ক্ষেত্রে অস্বাভাবিকতা কোনও সমস্যা নয়)। তবে নিষেধাজ্ঞার পিছনে এটি বোঝানো হয়েছে যে এটি ভবিষ্যদ্বাণীকারীদের স্বাভাবিকতা যা সমস্যা। তেমন নয়; ভবিষ্যদ্বাণীকারীদের প্রান্তিক বিতরণ সম্পর্কে কিছু অনুমান করার জন্য এটি রিগ্রেশন মডেলিংয়ের কোনও অংশ নয়।

এক্সβ

এই ফোরামে রূপান্তরের বিষয়ে এত অসাধারণ ভাল পরামর্শ রয়েছে যে আপনি যেটা উদ্ধৃত করবেন তা আলোচনায় আমি মনোনিবেশ করেছি।

পিএস আপনি শুরু করে একটি বিবৃতি যুক্ত করুন "উদাহরণস্বরূপ, উপায়ের তুলনায়, কাঁচা ডেটার সাথে লগগুলির তুলনা করলে স্পষ্টতই একটি তাত্পর্য পাওয়া যায়" " আপনার মনে কী আছে তা আমি পরিষ্কার করছি না, তবে অন্য দলের জন্য মানগুলির লগারিদমের সাথে একটি গোষ্ঠীর জন্য মানগুলির তুলনা করা অযৌক্তিক হবে। আমি আপনার বাকী বাক্যটি মোটেও বুঝতে পারি না।


নিক, আমি আমার বক্তব্যটি দ্রুত এবং সংক্ষিপ্তভাবে পেতে চেয়েছিলাম, যা আমার মনে হয় আমি করেছি did গুগল বিশ্বে, আমি মূল নথিগুলি সহজে অ্যাক্সেস করার জন্য পর্যাপ্ত তথ্য সরবরাহ করেছি, যদি তাদের প্রয়োজন হয়। উপায় সম্পর্কে মোটামুটিভাবে উত্তর দেওয়ার জন্য আপনাকে ধন্যবাদ, আপনি আমাকে ঠিক যে তথ্যটি চেয়েছিলেন তা সরবরাহ করেছিলেন: ফিল্ডের পরামর্শ অনুসারে সমস্ত পরিবর্তনশীলকে রূপান্তরিত করা, তার ডেটা ট্রান্সফরমেশন বিভাগে ডেটা ট্রান্সফর্মেশনের একটি ভুল পদ্ধতি।
আই হার্ট

14
+1 টি। আমি অবাক হয়ে দেখি যে আপনি কীভাবে দক্ষতার সাথে এমন উপাদানকে সম্বোধন করতে পরিচালিত করেছেন যা একেবারেই ভুল। এসপিএসএস বইয়ের এখানে এবং সেখানে স্যুইমিং পৃষ্ঠাগুলি আমরা এই সাইটে আমরা পেয়েছি এমন কিছু সত্যই বিভ্রান্তিকর প্রশ্নের অন্তর্দৃষ্টি দেয়: আমার মনে হয় সেগুলি অবশ্যই সেই বইয়ের পাঠকদের কাছ থেকে আসা উচিত। এটি ত্রুটি, ভুল তথ্য এবং সম্পূর্ণরূপে বিভ্রান্তিতে পূর্ণ।
হোবার

@ আই হার্ট বিটস খুশি হয়ে আপনি উত্তরটি সহায়ক খুঁজে পেয়েছেন, তবে সঠিক রেফারেন্সিংয়ের জন্য আমার অনুরোধ রইল। আপনি পাশাপাশি বলতে পারেন যে অসম্পূর্ণ উল্লেখগুলি সর্বদা রক্ষার যোগ্য কারণ আগ্রহী লোকেরা সর্বদা গুগল করতে পারে। বিপরীতে, ভাল স্কলারশিপ এবং বিজ্ঞান ভাল গ্রন্থাগার চর্চায় সাহায্য করা হয়, সম্পূর্ণ বিবরণ দেয় এবং না তৈরি করে (অনেক) পাঠক অপ্রয়োজনীয় কাজ করে না।
নিক কক্স

@ নিক আমার প্রশ্নে সম্পাদনা দেখুন। আমি বিশ্বাস করি যে নিবন্ধটি ওপেন সোর্স, এবং আমি প্রসঙ্গে পাঠ্যের একটি সম্পূর্ণ পৃষ্ঠা যুক্ত করেছি।
আমি হার্ট

8
রেফারেন্স বাড়ানোর জন্য ধন্যবাদ। আপনি ফিল্ড থেকে আরও উদ্ধৃত করেছেন। "ডেটা ট্রান্সফর্ম করা ভেরিয়েবলের মধ্যে সম্পর্ককে পরিবর্তন করবে না" এই দৃser়তা সহ একটি অতিরিক্ত বিভাগ দৃশ্যমান রয়েছে। হয় "সম্পর্ক" এর একটি মূ .় অর্থ সম্পর্কিত পিভটগুলি, বা (সম্ভবত আমি আশঙ্কা করি) এটি অসহায়, সত্যিই বেশ ভুল। আমাদের সামনে প্রমাণের বিষয়ে প্রশ্নে বইটির বিষয়ে @ ভুবার সাথে একমত হওয়ার জন্য আমি দুঃখিত (এক অর্থে) আফসোস করছি । (আপডেট: whuber মূলত একই পয়েন্টটি একই সাথে করছিল: প্রশ্নে তার মন্তব্য দেখুন))
নিক কক্স

10

প্রথমত, উভয় উদ্ধৃতিই ইনসোফারকে বিভ্রান্ত করছে কারণ কোনও রিগ্রেশন মডেল ব্যবহারের উদ্দেশ্যে ডেটা প্রয়োগ করা কোনও রূপান্তরকে পরিবর্তনশীল পিডিএফগুলিকে আরও সাধারণভাবে বিতরণ করার জন্য করা হয় না, এটি মডেলের রেসিডুয়ালগুলিকে আরও প্রতিসাম্য তৈরি করার জন্য করা হয়েছে যেহেতু ক্লাসিক রিগ্রেশনটিতে একটি ধারণা অনুমান করা হয় যে ত্রুটিগুলি গাউসিয়ান হয়। এটি কেবল পিডিএফকে প্রতিসাম্য তৈরি করার চেয়ে কঠোরতা এবং কঠোরতার গভীর স্তরকে বোঝায়।

তদতিরিক্ত উভয় উক্তি দুর্বল যে কেউই তাদের প্রেসক্রিপশনগুলির জন্য প্রেরণাগুলি আবিষ্কার করে না (অন্তত প্রদত্ত তথ্যের ভিত্তিতে)। যেমনটি ঘটে, আমি উভয়ের সাথে একমত নই।

আপনি যে প্যাসেজটি হাইলাইট করেছেন তাতে এসপিএসএস বই দাবি করেছে যে রূপান্তরগুলির মিশ্রণগুলি (যেমন, একটি ভেরিয়েবলের জন্য প্রাকৃতিক লগ, অন্যটির জন্য বর্গমূল) অনুমোদিত নয়। কেন এটি অবৈধ? রূপান্তরগুলির মিশ্রণগুলি এমন কোনও রিগ্রেশন অনুমান লঙ্ঘন করে যা আমি সচেতন। এই কেসটি রয়েছে তা নিশ্চিত করতে দয়া করে রিগ্রেশন অনুমানের উপর যে কোনও রিগ্রেশন পাঠ্য পরীক্ষা করুন। রূপান্তর মিশ্রণগুলি তাদের ব্যাখ্যার দিক থেকে একটি সংক্ষিপ্ত বর্ণনামূলক সমস্যা উপস্থাপন করতে পারে তবে মিশ্রটি অবৈধ কিনা তা কোনও প্রশ্ন নয়। এসপিএসএস লোকটি ভুল।

দ্বিতীয় পাঠ্য হিসাবে আবার, রূপান্তরগুলি পুরোপুরি বিশ্লেষকদের পছন্দের বিষয় - এটি সেগুলি আদৌ করে না কেন, সমস্ত ইনপুট বা কিছু ভেরিয়েবলকে রূপান্তর করে এবং অন্যকে নয়। এর কোনওটিই অনুমানকে লঙ্ঘন করে না।

যেখানে আমি মনে করি যে দ্বিতীয় উক্তিটি রেলপথ থেকে দূরে চলেছে, "... ... সম্ভাব্য বহুবিধ রক্ষা এড়ানোর জন্য ... কেবলমাত্র একটি ভূমি ব্যবহারের সূচক (ব্যবহৃত হয়েছিল) ..." এটি স্পষ্টতই খারাপ পরামর্শ এবং এর মতো শব্দ কিছু বিশ্লেষক একটি মাত্রা হ্রাস কৌশল হিসাবে এটি করবে যেখানে তারা ভেরিয়েবলগুলির একটি গুচ্ছকে বিশ্লেষণ করবে এবং প্রতিটি ফ্যাক্টরের উপর সর্বোচ্চ লোডিং ভেরিয়েবল চয়ন করবে। এই হিউরিস্টিকটি বছরের পর বছর ধরে চলেছে এবং আমি এটি ব্যবহার করি বা প্রস্তাব করি না। আবার এটি বিশ্লেষক পছন্দ এবং প্রশিক্ষণের বিষয়। তবে এই নির্দিষ্টটি আপনার নির্দিষ্ট প্রশ্নের উত্তর দেওয়ার জন্য লক্ষ্যবস্তু নয়।

দিন শেষে, উভয় উক্তি সরবরাহকারীর তথ্যের ভিত্তিতে কোনও সমর্থনকারী প্রমাণের অভাবে লেখকের মতামতের প্রতিবেদন হিসাবে প্রকাশিত হয়।


8
আমরা বিস্তৃতভাবে অনুরূপ পয়েন্টগুলি তৈরি করি, তবে আমি সেই ভাল পাঠগুলি যুক্ত করতে চাই যে গৌসিয়ান ত্রুটিগুলি রিগ্রেশন মডেলিংয়ের ক্ষেত্রে ন্যূনতম গুরুত্বপূর্ণ অনুমান এবং অনেকগুলি উদ্দেশ্যে প্রয়োজনীয় নয়।
নিক কক্স

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.