র‌্যাঙ্ক ক্রম সক্ষম করার জন্য একাধিক ভেরিয়েবল থেকে মানের একটি সূচক তৈরি করা


22

আমার চারটি সংখ্যার ভেরিয়েবল রয়েছে। এগুলির সবগুলিই মাটির গুণমানের ব্যবস্থা। উচ্চতর ভেরিয়েবল, উচ্চমানের। তাদের সবার পরিসর আলাদা:

1 থেকে 10 পর্যন্ত ভার 1

1000 থেকে 2000 পর্যন্ত ভার 2

150 থেকে 300 পর্যন্ত ভার 3

0 থেকে 5 পর্যন্ত ভার 4

আমার একক মাটির মান স্কোরের সাথে চারটি ভেরিয়েবল একত্রিত করতে হবে যা সাফল্যের সাথে অর্ডার দেবে।

আমার ধারণা খুব সহজ। চারটি ভেরিয়েবলকে মানক করুন, তাদের যোগফল যোগ করুন এবং যা কিছু পাবেন তা হ'ল র‌্যাঙ্ক-অর্ডার করা order আপনি এই পদ্ধতির প্রয়োগ করতে কোনও সমস্যা দেখছেন? আপনি সুপারিশ করবে অন্য কোন (আরও ভাল) পদ্ধতির আছে?

ধন্যবাদ

সম্পাদনা:

ধন্যবাদ বন্ধুরা. প্রচুর আলোচনা "ডোমেন দক্ষতা" এ চলেছিল ... কৃষিক্ষেত্র ... যেখানে আমি আরও পরিসংখ্যান-আলাপ আশা করেছি। প্রযুক্তির ক্ষেত্রে আমি যেটি ব্যবহার করব ... এটি সম্ভবত সাধারণ পরীক্ষার হিসাবে জেড স্কোরের সমষ্টি + লজিস্টিক রিগ্রেশন। কারণ স্যাম্পলগুলির সিংহভাগের মানের নিম্নমান রয়েছে 90% আমি 3 মানের বিভাগগুলিকে একের সাথে একত্রিত করতে যাচ্ছি এবং মূলত বাইনারি সমস্যা রয়েছে (কিছুটা বনাম-মানের নয়)। আমি একটি পাথর দিয়ে দুটি পাখি মেরেছি। আমি ইভেন্টের হারের বিবেচনায় আমার নমুনা বাড়িয়ে তুলি এবং আমি আমার নমুনাগুলিকে আলাদা করার জন্য বিশেষজ্ঞদের ব্যবহার করি। বিশেষজ্ঞের শ্রেণিবদ্ধ নমুনাগুলি তখন বিশেষজ্ঞদের সাথে একত্রীকরণ / মতবিরোধের মাত্রা সর্বাধিকীকরণ করার জন্য লগ-রেজ মডেল ফিট করতে ব্যবহৃত হবে .... কীভাবে আপনার এটি শোনাচ্ছে?

উত্তর:


19

প্রস্তাবিত পদ্ধতিটি একটি যুক্তিসঙ্গত ফলাফল দিতে পারে, তবে কেবল দুর্ঘটনাক্রমে। এই দূরত্বে - অর্থাত ভেরিয়েবলের অর্থ ছদ্মবেশে মুখের মূল্যে প্রশ্নটি নেওয়া - কিছু সমস্যা স্পষ্ট:

  1. এটিও স্পষ্ট নয় যে প্রতিটি পরিবর্তনশীল "মানের" সাথে ইতিবাচকভাবে সম্পর্কিত। উদাহরণস্বরূপ, 'ভার 1' এর জন্য 10 এর অর্থ যদি "1" যখন মানের 1 এর চেয়ে মানের থেকেও খারাপ হয় তবে কী হবে? তারপরে যোগফলটি যোগ করা কোনও কাজ হিসাবে যতটা ভুল হিসাবে কাজ করা হয়; এটি বিয়োগ করা প্রয়োজন।

  2. মানককরণটি বোঝায় যে "গুণমান" ডেটা সেট করার উপর নির্ভর করে। সুতরাং সংজ্ঞাটি বিভিন্ন ডেটা সেটগুলির সাথে বা এই ডেটাতে সংযোজন এবং মোছার সাথে পরিবর্তিত হবে। এটি "গুণমান "টিকে একটি স্বেচ্ছাসেবী, ক্ষণস্থায়ী, অ-উদ্দেশ্যমূলক নির্মাণ এবং ডেটাসেটের মধ্যে তুলনামূলক মূল্যায়ন করতে পারে।

  3. "গুণমান" এর কোনও সংজ্ঞা নেই। এর অর্থ কী? দূষিত জলের স্থানান্তর অবরুদ্ধ করার ক্ষমতা? জৈব প্রক্রিয়া সমর্থন করার ক্ষমতা? নির্দিষ্ট রাসায়নিক প্রতিক্রিয়া প্রচার করার ক্ষমতা? এর মধ্যে একটির জন্য ভাল মাটি অন্যের জন্য বিশেষত দরিদ্র হতে পারে।

  4. উল্লিখিত সমস্যার কোনও উদ্দেশ্য নেই: কেন "গুণমান" র‌্যাঙ্ক করা দরকার? আরও বিশ্লেষণের ইনপুট, "সেরা" মাটি নির্বাচন করা, একটি বৈজ্ঞানিক অনুমানের সিদ্ধান্ত নেওয়া, একটি তত্ত্ব বিকাশ করা, কোনও পণ্য প্রচার করা কী - র‌্যাঙ্কিংয়ের জন্য কী ব্যবহার করা হবে?

  5. র‌্যাঙ্কিংয়ের পরিণতি সুস্পষ্ট নয়। র‌্যাঙ্কিং যদি ভুল বা নিকৃষ্ট হয় তবে কী হবে? বিশ্ব কি হাঙ্গর হয়ে উঠবে, পরিবেশ আরও দূষিত হবে, বিজ্ঞানীরা আরও বিভ্রান্ত হবেন, উদ্যানরা আরও হতাশ হবেন?

  6. কেন ভেরিয়েবলের রৈখিক সংমিশ্রণ উপযুক্ত হতে হবে? কেন এগুলি বহুগুণ বা তাত্পর্যপূর্ণ বা একজাতীয় বা আরও কিছু রহস্যজনক হিসাবে সংযুক্ত করা উচিত নয় ?

  7. কাঁচা মাটির মান ব্যবস্থাগুলি সাধারণত পুনরায় প্রকাশ করা হয়। উদাহরণস্বরূপ, লগ ব্যাপ্তিযোগ্যতা সাধারণত ব্যাপ্তিযোগ্যতার থেকে বেশি কার্যকর এবং লগ হাইড্রোজেন আয়ন ক্রিয়াকলাপ (পিএইচ) কার্যকলাপের চেয়ে অনেক বেশি কার্যকর much "গুণমান" নির্ধারণের জন্য ভেরিয়েবলগুলির উপযুক্ত পুনরায় প্রকাশগুলি কী কী?

কেউ আশা করবেন যে মৃত্তিকা বিজ্ঞান এগুলির বেশিরভাগ প্রশ্নের উত্তর দেবে এবং নির্দেশিত হবে "মানের" এর কোনও উদ্দেশ্যগত অনুভূতির জন্য ভেরিয়েবলগুলির উপযুক্ত সমন্বয় কী হতে পারে। যদি তা না হয় তবে আপনি একটি বহু-গুণযুক্ত মূল্যায়ন সমস্যার মুখোমুখি । উইকিপিডিয়া নিবন্ধ এটিকে মোকাবেলার জন্য কয়েক ডজন পদ্ধতি তালিকাবদ্ধ করে। আইএমএইচও, তাদের বেশিরভাগ বৈজ্ঞানিক প্রশ্নের সমাধানের জন্য অনুপযুক্ত। একটি দৃ theory় তত্ত্ব এবং অনুগত অভিজ্ঞতা সম্পর্কে সম্ভাব্য প্রয়োগের সাথে কয়েকটি হ'ল কেইনে এবং রাইফার একাধিক বৈশিষ্ট্যের মূল্যায়ন তত্ত্ব(MAVT)। ভেরিয়েবলের যে কোনও দুটি নির্দিষ্ট সংমিশ্রণের জন্য এটি নির্ধারণ করতে আপনার সক্ষম হওয়া দরকার, দুজনের মধ্যে কোনটির উচ্চতর হওয়া উচিত। এই জাতীয় তুলনাগুলির একটি কাঠামোগত অনুক্রম প্রকাশ করে (ক) মানগুলি পুনরায় প্রকাশের উপযুক্ত উপায়; (খ) পুনঃপ্রকাশিত মানগুলির একটি লিনিয়ার সংমিশ্রণ সঠিক র‌্যাঙ্কিং তৈরি করবে কিনা; এবং (গ) লিনিয়ার সংমিশ্রণটি যদি সম্ভব হয় তবে এটি আপনাকে সহগগুলি গণনা করতে দেবে। সংক্ষেপে, MAVT আপনার সমস্যা সমাধানের জন্য অ্যালগরিদম সরবরাহ করে আপনি যদি নির্দিষ্ট ক্ষেত্রে কীভাবে তুলনা করতে চান তা ইতিমধ্যে জানতেন।


আরআর: ১. আমি নিশ্চিতভাবে জানি যে চারটি ভেরিয়েবলের জন্য "সংখ্যার চেয়ে বেশি, গুণমানের উচ্চতর" RE: 2. ভাল পয়েন্ট। দুটি
ডেটাসেটকে

2
@ ব্যবহারকারীর আমার প্রস্তাবনাগুলি সর্বশেষ অনুচ্ছেদে রয়েছে: সম্ভবত, বৈজ্ঞানিক সাহিত্যে "গুণমান" এর একটি পরিমাণগত অভিব্যক্তি সন্ধান করুন। বাদে এমএভিটি প্রয়োগ করুন। উভয়ই ডেটাসেটের চেয়ে পৃথক একটি নির্দিষ্ট সূত্র উত্পাদন করে। যে তুলনামূলকতা আশ্বাস দেয়।
whuber

1
@ হুবুহু, উপলভ্য তথ্যের উপর ভিত্তি করে গঠনমূলক ব্যবস্থা তৈরির সমস্যা হিসাবে কেউ কি এটি দেখতে পাচ্ছে না, এই ক্ষেত্রে জেড-স্কোরগুলি সংমিশ্রণ করা আপনার পক্ষে যতটা খারাপ লাগে ততটা খারাপ নয়?
অ্যান্ডি ডব্লিউ

3
@ অ্যান্ডি আপনি কীভাবে "গঠনমূলক পরিমাপ" এবং "উপলব্ধ তথ্য" বলতে চাইছেন তা ব্যাখ্যা করতে পারেন? // আমার উল্লেখ করা উচিত যে কৃষির জন্য মাটির উপযোগের অনেকগুলি পদক্ষেপ এমনকি একঘেয়েও বেশি নয়, লিনিয়ার খুব কম: উদাহরণস্বরূপ, একটি উদ্ভিদ পিএইচ-র একটি পরিসরের মধ্যে বিকাশ লাভ করতে পারে তবে উভয় দিকেই এই পরিসর ছাড়িয়ে পিএইচ-এর ক্ষতি হতে পারে । এটি প্রকৃতপক্ষে একটি বিশেষ পরিস্থিতিতে হবে - সম্ভবত একটি সংকীর্ণ মূল্যবোধের সাথে জড়িত - যদি মাটির বৈশিষ্ট্যের একটি সাধারণ লিনিয়ার সংমিশ্রণের সাথে কৃষির গুণাবলীর সাথে কোনও উদ্দেশ্যমূলক সম্পর্ক থাকে।
শুক্র

2
(Y1,...,Y)(x1,,xk)
whuber

3

যে কেউ রাসেল জি কঙ্গাল্টনের 'রিমোটলি সেন্সড ডেটা'র শ্রেণিবিন্যাসের নির্ভুলতার মূল্যায়নের রিভিউ'র দিকে নজর রেখেছিল? 1990? এটি ম্যাট্রিক্স পরিবর্তিত করার জন্য ত্রুটি ম্যাট্রিক্স হিসাবে পরিচিত একটি প্রযুক্তি বর্ণনা করে, এছাড়াও তিনি 'নর্মালাইজিং ডেটা' নামে পরিচিত এমন একটি শব্দ ব্যবহার করেন যার মাধ্যমে একজন সমস্ত বিভিন্ন ভেক্টর পান এবং 'নরমালাইজ' করেন বা তাদের 0 থেকে 1 এর সমান করে দেন আপনি মূলত সমস্ত ভেক্টরকে এতে পরিবর্তন করেন সমান 0 থেকে 1।


0

আর একটি বিষয় যা আপনি আলোচনা করেন নি তা হ'ল পরিমাপের স্কেল। ভি 1 এবং ভি 5 দেখে মনে হচ্ছে এগুলি র‌্যাঙ্ক অর্ডারের এবং অন্যটি মনে হয় না। সুতরাং মানীকরণ স্কোর স্কিওং হতে পারে। সুতরাং আপনি সমস্ত পরিবর্তনশীলকে সারিতে আরও ভালভাবে রূপান্তর করতে এবং প্রতিটি ভেরিয়েবলের জন্য একটি ওজন নির্ধারণ করতে পারেন, কারণ এটির ওজন একইরকম হওয়ার সম্ভাবনা খুব কম। সমান ওজন হ'ল "কিছুই নয়" ডিফল্ট। আপনি কিছু প্রাথমিক ওজন নিয়ে আসতে কিছু পারস্পরিক সম্পর্ক বা রিগ্রেশন বিশ্লেষণ করতে চাইতে পারেন।


ওজন নির্ধারণের জন্য আমি কীভাবে পারস্পরিক সম্পর্ক বিশ্লেষণ ব্যবহার করতে পারি?
ব্যবহারকারী 333

আপনার যদি ইতিমধ্যে গুণমানের পূর্ব-বিদ্যমান সামগ্রিক পরিমাপ থাকে, যেমন বিশেষজ্ঞের মতামত, (বা এর জন্য প্রক্সি হিসাবে অন্যান্য ভেরিয়েবলগুলি গ্রহণ করতে ইচ্ছুক), আপনি সর্বাধিক সম্পর্কযুক্ত ভেরিয়েবলগুলি চয়ন করতে পারেন এবং এটিকে সর্বোচ্চ ওজন দিতে পারেন।
র‌্যাল্ফ উইন্টারস

-3

র‌্যাল্ফ উইন্টার্সের উত্তর অনুসরণ করে আপনি উপযুক্ত মানযুক্ত স্কোরের ম্যাট্রিক্সে পিসিএ (মূল উপাদান বিশ্লেষণ) ব্যবহার করতে পারেন। এটি আপনাকে একটি "প্রাকৃতিক" ওজন ভেক্টর দেবে যা আপনি ভবিষ্যতের স্কোরগুলি একত্রিত করতে ব্যবহার করতে পারেন।

সমস্ত স্কোরকে র‌্যাঙ্কে রূপান্তরিত করার পরে এটিও করুন। ফলাফলগুলি যদি খুব একই রকম হয় তবে আপনার কোনও পদ্ধতি অবিরত করার ভাল কারণ রয়েছে। যদি বিভেদ থাকে তবে এটি আকর্ষণীয় প্রশ্ন এবং আরও ভাল বোঝার দিকে পরিচালিত করবে।


4
আমি একমত নই যেহেতু কেউ কৌতূহলের জন্য আন্তঃ-আইটেম পারস্পরিক সম্পর্কের ক্ষেত্রে আগ্রহী হবে, সমস্ত ভেরিয়েবলগুলি অরথোগোনাল হতে পারে তবে এখনও মানটিতে অবদান রাখতে পারে। মূর্খ উদাহরণের জন্য অ্যান্টার্কটিকার মাটিতে অনুকূল নাইট্রোজেনের পরিমাণ থাকতে পারে তবে আমি সন্দেহ করি যে এটি উপযুক্ত জলবায়ু হিসাবে যথেষ্ট হবে।
অ্যান্ডি ডব্লিউ

@ অ্যান্ডি ডাব্লু: সেক্ষেত্রে সমস্ত ভেরিয়েবল সমানভাবে ওজন করা উচিত, এবং পিসিএ আপনাকে তা জানিয়ে দেবে। এটি আপনাকে এও বলবে যে শীর্ষস্থানীয় উপাদানটি কেবল স্কোর ম্যাট্রিক্সের সামগ্রিক পরিবর্তনের অপেক্ষাকৃত ছোট ভগ্নাংশের জন্য অ্যাকাউন্ট করে।
হ্যান্স এঙ্গলার

3
আমি এখনও একমত না। স্কোরগুলি সমানভাবে ওজন করা উচিত কিনা তা আপনাকে জানায় না। দুটি আইটেমের ইতিবাচক পারস্পরিক সম্পর্ক থাকতে পারে তবে প্রত্যেকটির "মানের" সাথে বিপরীত সম্পর্ক রয়েছে। আন্তঃ-আইটেম পারস্পরিক সম্পর্ক অবশ্যই প্রদত্ত প্রসঙ্গে অনাবৃত পরিমাপ সম্পর্কে কিছু বলবে না। মানটি যদি একটি সুপ্ত পরিবর্তনশীল ছিল এবং ভেরিয়েবলগুলি সেই সুপ্ত নির্মাণের "প্রতিফলনশীল" ছিল যা সত্য হতে পারে, তবে এই প্রদত্ত উদাহরণে তেমনটি হয় না।
অ্যান্ডি ডব্লিউ

একজনমি×এনσ1তোমার দর্শন লগ করাবনামটিএকজনএনবনামবনাম
হ্যান্স এঙ্গলার

3
আমি এখনও একমত না। এমনকি সমিতি যদি একই দিকের দিকে প্রত্যাশিত হয় তবে এর অর্থ এই নয় যে সূচকগুলিকে আন্তঃ-আইটেম পারস্পরিক সম্পর্কের ভিত্তিতে সহজাতভাবে কোনও ওজন দেওয়া উচিত given ভাগ করা বৈকল্পিক সূচকগুলির মধ্যে সম্পর্ক সম্পর্কে কেবল কিছু বলতে পারে। একটি রিগ্রেশন মডেলটির কথা চিন্তা করুন যেখানে আমরা এই সূচকগুলি থেকে গুণমানের একটি পরিচিত পরিমাপের পূর্বাভাস দিই। সূচকগুলির মধ্যে আন্তঃ-আইটেম সম্পর্কগুলি আপনাকে প্রত্যাশিত opালু কী হবে তা বলে দেয় না।
অ্যান্ডি ডব্লিউ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.