ব্যাখ্যামূলক বনাম ভবিষ্যদ্বাণীমূলক মডেলিং সম্পর্কে ব্যবহারিক চিন্তাভাবনা


70

এপ্রিলে ফিরে আমি ইউএমডি ম্যাথ বিভাগের পরিসংখ্যান গোষ্ঠী সেমিনার সিরিজের "টো ব্যাখ্যায়িত বা ভবিষ্যদ্বাণী?" শীর্ষক একটি আলোচনায় অংশ নিয়েছি। বক্তব্যটি দিয়েছেন ইউএমডির স্মিথ বিজনেস স্কুলে অধ্যাপক গালিত শমুয়েলি । তাঁর আলোচনার ভিত্তিতে তিনি গবেষণার ভিত্তিতে তৈরি করেছিলেন "ভবিষ্যদ্বাণীপূর্ণ বনাম স্পেসিটারেটরি মডেলিং ইন আইএস রিসার্চ" শীর্ষক একটি গবেষণাপত্র , এবং "টো ব্যাখ্যা বা টান প্রেডিক্ট ?" শীর্ষক একটি ফলোআপ ওয়ার্কিং পেপার। ।

ডাঃ শমুয়েলের যুক্তিটি হল যে পরিসংখ্যানের মডেলিংয়ের প্রসঙ্গে ভবিষ্যদ্বাণীমূলক এবং ব্যাখ্যামূলক পদগুলি সংঘাতের সাথে সংযুক্ত হয়ে গেছে এবং পরিসংখ্যানিক সাহিত্যে পার্থক্যের পুরোপুরি আলোচনার অভাব রয়েছে। গবেষণাপত্রে, তিনি উভয়ের বিপরীতে এবং তাদের ব্যবহারিক প্রভাব সম্পর্কে কথা বলেছেন। আমি আপনাকে কাগজপত্র পড়তে উত্সাহিত করি।

অনুশীলনকারী সম্প্রদায়ের কাছে আমি যে প্রশ্নগুলি উত্থাপন করতে চাই সেগুলি হ'ল:

  • বর্ণনামূলক / বর্ণনামূলক বনাম আপনি কীভাবে ভবিষ্যদ্বাণীমূলক অনুশীলনকে সংজ্ঞায়িত করবেন? আপনি যদি নির্দিষ্ট অ্যাপ্লিকেশন সম্পর্কে কথা বলতে পারেন তবে এটি কার্যকর হবে।
  • অন্যটি ব্যবহার করার অর্থ যখন আপনি কখনও একটির ব্যবহারের ফাঁদে পড়েছেন? আমি অবশ্যই আছে। আপনি কোনটি ব্যবহার করবেন তা কীভাবে জানবেন?

2
এই প্রশ্নটি বন্ধ করার প্রস্তাব করা হচ্ছে। দেখুন: meta.stats.stackexchange.com/questions/213/… আমি দেখতে পাচ্ছি যে এর 2 টি ভোট রয়েছে। আপ-ভোটাররা বা ওপিরা কীভাবে তারা মেটা থ্রেডে প্রশ্নটি খোলা থাকতে চান বলে মন্তব্য করতে পারে?

9
আপনি কেন এটি বন্ধ করতে চান তা ব্যাখ্যা করে শুরু করার বিষয়ে "এটি বন্ধ করা উচিত Someone কাউকে এটির উচিত defend" খুবই অস্পষ্ট? তারপরে স্পষ্টতার জন্য জিজ্ঞাসা করুন। এটি আমার কাছে একটি যুক্তিসঙ্গত প্রশ্ন বলে মনে হচ্ছে। প্রশ্নকারী একটি কাগজ উপস্থাপন করে এবং ভবিষ্যদ্বাণীমূলক এবং ব্যাখ্যামূলক পরিসংখ্যানের মধ্যে পার্থক্য সম্পর্কে জিজ্ঞাসা করে। আমি প্রশ্নের মধ্যে কেবলমাত্র পরিবর্তন করব তা হ'ল প্রশ্নটি ঠিকভাবে ব্যাখ্যা করা যাতে ভোট দেওয়া সহজ হয়।
জেডি লং

2
আমি ইতিমধ্যে মেটা থ্রেডের জন্য একটি কারণ প্রস্তাব করেছি। আমি মনে করি যে প্রশ্ন সম্পর্কে 'মেটা আলোচনা' এই বিশেষ পৃষ্ঠাটিকে বিশৃঙ্খলা করবে।

2
@ শ্রীকান্ত @ জেডি আমি এই প্রশ্নটি শেষ করব। সাহায্য করার জন্য ধন্যবাদ. আমি মনে করি এটি আলোচনার যোগ্য একটি বিষয়।
ওয়াহালুলু

4
আপনি উপরে উল্লিখিত টক / কাগজগুলিতে সঠিক লিঙ্কগুলি যুক্ত করতে পারেন?
chl

উত্তর:


39

এক বাক্যে

ভবিষ্যদ্বাণীপূর্ণ মডেলিং "" কী ঘটবে বলে সম্ভাব্য? "সবকিছুরই রয়েছে, তবে ব্যাখ্যামূলক মডেলিং" এটি সম্পর্কে আমরা কী করতে পারি? "

অনেক বাক্যে

আমি মনে করি মূল পার্থক্যটি হ'ল বিশ্লেষণটি দিয়ে কী করা উচিত। আমি প্রস্তাবটি অনুমানের চেয়ে হস্তক্ষেপের জন্য ব্যাখ্যা অনেক গুরুত্বপূর্ণ বলে পরামর্শ দেব । আপনি যদি কোনও ফলাফল পরিবর্তন করতে কিছু করতে চান, তবে কেন এটি সঠিকভাবে হয় তা ব্যাখ্যা করার জন্য আপনি সবচেয়ে ভালভাবে খোঁজেন। ব্যাখ্যামূলক মডেলিং, যদি ভালভাবে করা হয়, আপনাকে কীভাবে হস্তক্ষেপ করবেন (কোন ইনপুটটি সামঞ্জস্য করা উচিত) তা আপনাকে জানাবে। তবে, আপনি যদি হস্তক্ষেপ করার কোনও উদ্দেশ্য (বা ক্ষমতা) ছাড়াই ভবিষ্যত কেমন হবে তা যদি আপনি কেবল বুঝতে চান তবে ভবিষ্যদ্বাণীমূলক মডেলিং উপযুক্ত হওয়ার সম্ভাবনা বেশি।

অবিশ্বাস্যরূপে আলগা উদাহরণ হিসাবে, "ক্যান্সার ডেটা" ব্যবহার করে।

"ক্যান্সার ডেটা" ব্যবহার করে ভবিষ্যদ্বাণীপূর্ণ মডেলিং উপযুক্ত (বা কমপক্ষে দরকারী) যদি আপনি বিভিন্ন হাসপাতালের ক্যান্সার ওয়ার্ডগুলিকে অর্থায়ন করছিলেন তবে উপযুক্ত হবে। লোকেরা কেন ক্যান্সারে আক্রান্ত হয় সে বিষয়ে আপনাকে আসলেই ব্যাখ্যা করার দরকার নেই, বরং কেবলমাত্র কতগুলি পরিষেবা প্রয়োজন হবে তার একটি সঠিক অনুমানের প্রয়োজন। ব্যাখ্যামূলক মডেলিং সম্ভবত এখানে খুব সাহায্য করবে না। উদাহরণস্বরূপ, ধূমপান ক্যান্সারের উচ্চ ঝুঁকির দিকে পরিচালিত করে তা জেনে নিজেই আপনাকে বলে না যে ওয়ার্ড এ বা ওয়ার্ড বি কে আরও বেশি অর্থ প্রদান করা হবে কিনা tell

"ক্যান্সারের ডেটা" এর ব্যাখ্যামূলক মডেলিং উপযুক্ত হবে যদি আপনি জাতীয় ক্যান্সারের হার হ্রাস করতে চান - ভবিষ্যদ্বাণীমূলক মডেলিং এখানে মোটামুটি অপ্রচলিত হবে। ক্যান্সারের হারের সঠিকভাবে পূর্বাভাস দেওয়ার ক্ষমতা আপনাকে কীভাবে এটি হ্রাস করবেন তা সিদ্ধান্ত নিতে খুব কমই সম্ভব হয়। তবে, ধূমপান ক্যান্সারের ঝুঁকি নিয়ে যাওয়ার বিষয়টি জেনে রাখা মূল্যবান তথ্য - কারণ আপনি যদি ধূমপানের হার হ্রাস করেন (উদাহরণস্বরূপ সিগারেটকে আরও ব্যয়বহুল করে), এটি কম ঝুঁকিযুক্ত আরও বেশি লোকের দিকে পরিচালিত করে, যা (আশাকরি) ক্যান্সারে প্রত্যাশিত হ্রাস বাড়ে হার।

এইভাবে সমস্যার দিকে তাকিয়ে আমি ভাবব যে ব্যাখ্যামূলক মডেলিংটি মূলত প্রত্যক্ষ বা অপ্রত্যক্ষভাবে ব্যবহারকারীর নিয়ন্ত্রণে থাকা ভেরিয়েবলগুলিতে ফোকাস করে। অন্যান্য ভেরিয়েবল সংগ্রহ করার প্রয়োজন হতে পারে, তবে আপনি যদি বিশ্লেষণে কোনও ভেরিয়েবল পরিবর্তন করতে না পারেন তবে আমি সন্দেহ করি যে বর্ণনামূলক মডেলিংটি কার্যকর হবে, যদি না আপনাকে সেই পরিবর্তনশীলগুলির উপর নিয়ন্ত্রণ বা প্রভাব অর্জনের আকাঙ্ক্ষা দেওয়া হয় তবে যা গুরুত্বপূর্ণ। ভবিষ্যদ্বাণীপূর্ণ মডেলিং, অশোধিতভাবে, কেবল ব্যবহারকারী দ্বারা নিয়ন্ত্রিত কিনা তা ভেরিয়েবলের মধ্যে সংযোগগুলির সন্ধান করে। পূর্বাভাস দেওয়ার জন্য আপনাকে কেবল ইনপুট / বৈশিষ্ট্য / স্বতন্ত্র ভেরিয়েবল / ইত্যাদি সম্পর্কে জানতে হবে, তবে কোনও ফলাফলকে হস্তক্ষেপ করার জন্য এবং পরিবর্তনগুলি পরিবর্তন করতে আপনাকে ইনপুট / বৈশিষ্ট্যগুলি / স্বাধীন ভেরিয়েবলগুলি ইত্যাদি সংশোধন বা প্রভাবিত করতে সক্ষম হতে হবে need ।


9
+1, সুন্দরভাবে সম্পন্ন! আমি নীটপিককে ঘৃণা করি, তবে আমি লক্ষ করতে চাই যে ভবিষ্যদ্বাণী ভবিষ্যতের বিষয়ে হওয়া উচিত নয়। উদাহরণস্বরূপ, একজন প্রত্নতাত্ত্বিক পূর্ববর্তী সময়ে একটি অঞ্চলে বৃষ্টিপাতের মাত্রা নির্ধারণ করতে (অর্থাত্ বৃষ্টিপাতের প্রভাবগুলি) যা জ্ঞান রেখে বাকি থাকতে পারে তা নির্ধারণ করতে চাইতে পারে।
গাং

@ গুং - আমি ভেবেছিলাম আমি আমার প্রতিক্রিয়াটি শব্দ করেছিলাম যাতে এটি না ঘটে। স্পষ্টতই, আমি একটি জায়গা মিস করেছি :-)
সম্ভাব্যতা

চমৎকার উত্তর. আমি মনে করি ভবিষ্যতে কেমন দেখাচ্ছে এবং কেন তা আমাদের অনেক ক্ষেত্রে জানতে হবে। মনে করুন, গ্রাহক মন্থন অধ্যয়ন করার সময়, আপনি জানতে চান পরবর্তী এন মাসে কতজন গ্রাহক (এবং ঠিক কোন গ্রাহক) মন্থন করেন এবং তারপরে তারা কেন মন্থন করেন যাতে বিপণন তাদের ধরে রাখতে হস্তক্ষেপ করতে পারে। তারপরে আমাদের ভবিষ্যদ্বাণীমূলক (ভবিষ্যতের নম্বর এবং গ্রাহকদের শেখার জন্য) এবং কেন তা আমাদের বলার জন্য ব্যাখ্যামূলক প্রয়োজন, যাতে আমরা মন্থরগুলি হ্রাস করতে পারি। সুতরাং, আমরা উভয় বা একটিই যথেষ্ট হিসাবে সংকর মডেল আছে? ভার্টি এই বলে স্পর্শ করেছেন যে "পরিচিত সম্পর্কটি বর্ণনামূলক / বর্ণনামূলক বিশ্লেষণ বা অন্য কোনও কৌশল থেকে উদ্ভূত হতে পারে"
এস্পান্ত

@gung আমি ভালবাসেন nitpick হবে: প্রত্নতত্ত্ববিদ অভিজ্ঞতা ভবিষ্যদ্বাণী করা ক্ষুধা তার ভবিষ্যৎ (অর্থাত, যেখানে তিনি ভবিষ্যতে কিছু সময়ে হবে অতীত উচ্চ বৃষ্টিপাতের ট্রেস খুঁজে পূর্বাভাসের)।
অ্যালেক্সিস

@ অ্যালেক্সিস, এটি অবশ্যই সম্ভব, তবে এটিও সম্ভব যে এটি প্রত্নতাত্ত্বিকের প্রাথমিক গবেষণার আগ্রহ নয়, এবং এই তথ্যগুলি অন্যান্য গবেষকরা (প্যালিওক্লেমাটোলজিস্ট) ইতিমধ্যে সংগ্রহ করেছেন এবং প্রত্নতাত্ত্বিকেরা কেবলমাত্র সেই তথ্যগুলি তত্ত্বগুলি পরীক্ষা করার জন্য ব্যবহার করতে চান তাদের প্রাথমিক তাত্ত্বিক আগ্রহ ( গিল, ২০০ )।
গাং

30

আমার দৃষ্টিতে পার্থক্যগুলি নিম্নরূপ:

ব্যাখ্যামূলক / বর্ণনামূলক

কোনও ব্যাখ্যামূলক / বর্ণনামূলক উত্তর চাইলে প্রাথমিক ফোকাসটি আমাদের কাছে থাকা ডেটার দিকে থাকে এবং শব্দটি শোনার পরে আমরা ডেটার মধ্যে অন্তর্নিহিত সম্পর্কগুলি আবিষ্কার করতে চাই।

উদাহরণ: এটি কি সত্য যে নিয়মিত অনুশীলন করা (প্রতিদিন 30 মিনিট বলুন) রক্তচাপকে কম করে? এই প্রশ্নের উত্তরের জন্য আমরা রোগীদের তাদের ব্যায়ামের পদ্ধতি এবং সময়ের সাথে রক্তচাপের মান সম্পর্কে তথ্য সংগ্রহ করতে পারি। লক্ষ্যটি হ'ল আমরা অনুশীলন পদ্ধতিতে পরিবর্তনের মাধ্যমে রক্তচাপের বিভিন্নতা ব্যাখ্যা করতে পারি কিনা ।

রক্তচাপ কেবলমাত্র ব্যায়ামের দ্বারা অন্যান্য বিভিন্ন কারণেই প্রভাবিত হয় না যেমন কোনও ব্যক্তি সোডিয়ামের পরিমাণ খায় These এই অন্যান্য কারণগুলি উপরোক্ত উদাহরণে শব্দ হিসাবে বিবেচিত হবে কারণ ব্যায়ামের নিয়ম এবং এর মধ্যে সম্পর্ক ছড়িয়ে দেওয়ার দিকে দৃষ্টি নিবদ্ধ করা হচ্ছে as রক্তচাপ.

ভবিষ্যদ্বাণী

ভবিষ্যদ্বাণীমূলক অনুশীলন করার সময়, আমরা হাতে থাকা তথ্যগুলির মধ্যে পরিচিত সম্পর্কগুলি ব্যবহার করে আমরা অজানাতে এক্সটোরপোলটিং করছি । পরিচিত সম্পর্কটি ব্যাখ্যামূলক / বর্ণনামূলক বিশ্লেষণ বা অন্য কোনও কৌশল থেকে উদ্ভূত হতে পারে।

উদাহরণ: আমি যদি প্রতিদিন 1 ঘন্টা ব্যায়াম করি তবে আমার রক্তচাপ কমে যাওয়ার সম্ভাবনা কতটা বেশি? এই প্রশ্নের উত্তরের জন্য, পূর্বাভাসটি সম্পাদন করার জন্য আমরা রক্তচাপ এবং অনুশীলনের নিয়ন্ত্রণের মধ্যে পূর্বের অনাবৃত সম্পর্ক ব্যবহার করতে পারি।

উপরোক্ত প্রসঙ্গে, ফোকাসটি ব্যাখ্যায় নেই, যদিও একটি ব্যাখ্যামূলক মডেল ভবিষ্যদ্বাণী প্রক্রিয়াতে সহায়তা করতে পারে। অবিচ্ছিন্ন পদ্ধতিগুলিও রয়েছে (যেমন, নিউরাল জাল) যা ভেরিয়েবলগুলির মধ্যে অন্তর্নিহিত সম্পর্কের প্রকৃতি হিসাবে অগত্যা আমাদের জ্ঞানের সাথে যুক্ত না করে অজানা সম্পর্কে ভবিষ্যদ্বাণী করা ভাল।


6
+1 এই জবাবটি ব্যাখ্যা, বিবরণ এবং সম্পর্কের ভাষা ব্যবহার করে মূলত কারণের সাথে বিভ্রান্তিকর সম্পর্ককে এড়িয়ে চলে। এটি এটিকে স্বচ্ছতার একটি পছন্দসই ডিগ্রী ধার দেয়।
শুক্র

4
ব্যাখ্যার অধীনে আপনি লিখেছেন "প্রাথমিক ফোকাসটি আমাদের কাছে থাকা ডেটার উপর রয়েছে" - আমি মনে করি আপনি এটি বলতে চেষ্টা করছেন যে কার্যটি পূর্ববর্তী (পূর্বাভাসের সম্ভাব্য প্রকৃতির বিরোধী)। ব্যাখ্যায় ("কার্যকারণ ব্যাখ্যা" পড়ুন) আসলে তত্ত্ব এবং ডোমেন জ্ঞানের উপর একটি বড় ফোকাস রয়েছে এবং এই অনুমানগুলি / তত্ত্বগুলি পরীক্ষা করার জন্য ডেটা ব্যবহার করা হয়। বিপরীতে, পূর্বাভাসে এটি আরও ডেটা-চালিত এবং সম্পর্কের বিষয়ে আপনি আরও উন্মুক্ত, কারণ আপনি কার্যকারিতা খুঁজছেন না বরং পারস্পরিক সম্পর্কের জন্য অনুসন্ধান করছেন।
গ্যালিট শমুয়েলি

@ গ্যালিটশ্মেলিই রেগ তত্ত্ব / ডোমেন জ্ঞান- হ্যাঁ, আমি এই বিষয়টির সাথে একমত। ভেরিয়েবলের মধ্যকার সম্পর্কের বিষয়টি সম্পর্কে ভেরিয়েবলের মান বাড়িয়ে তোলার ক্ষেত্রে কী কী গুরুত্বপূর্ণ বলে মনে হয় তার দিকে মনোনিবেশ করে আমি কেবল ভবিষ্যদ্বাণী ও ভিস-এ-ভিজিটের বিপরীতে চেষ্টা করার চেষ্টা করছিলাম। প্রক্রিয়াটিতে, আমি অবশ্যই দুটি দৃষ্টান্তের মধ্যে সূক্ষ্ম সূক্ষ্মতা অবহেলা করার জন্য দোষী।
ভার্টি

1
@ ভার্টি আমি আপনার বক্তব্যের সাথে একমত: ব্যাখ্যা / বর্ণনায় আপনি সামগ্রিক / গড় সম্পর্ক / প্রভাবের প্রতি আগ্রহী যেখানে পূর্বাভাসে আপনি স্বতন্ত্র মূল্যবোধের পূর্বাভাস দিতে আগ্রহী (অগত্যা এক্সট্রোপোলেশন নয়)
গ্যালিত শমুয়েলই

19

এখানে একটি বাস্তব সমস্যা দেখা দেয় তা হল মডেলিংয়ের পরিবর্তনশীল নির্বাচন। একটি পরিবর্তনশীল একটি গুরুত্বপূর্ণ ব্যাখ্যামূলক পরিবর্তনশীল হতে পারে (উদাহরণস্বরূপ, পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ) তবে ভবিষ্যদ্বাণীমূলক উদ্দেশ্যে কার্যকর নাও হতে পারে (যেমন, মডেলটিতে এর অন্তর্ভুক্তি ভবিষ্যদ্বাণীমূলক নির্ভুলতার দিকে নিয়ে যায়)। আমি প্রকাশিত কাগজপত্রগুলিতে প্রায় প্রতিদিন এই ভুলটি দেখি।

আর একটি পার্থক্য মূল উপাদান বিশ্লেষণ এবং ফ্যাক্টর বিশ্লেষণের মধ্যে পার্থক্য। পিসিএ প্রায়শই পূর্বাভাসে ব্যবহৃত হয়, তবে ব্যাখ্যার জন্য এতটা কার্যকর হয় না। এফএ-তে ঘূর্ণনের অতিরিক্ত পদক্ষেপ জড়িত যা ব্যাখ্যার উন্নতি করতে (এবং তাই ব্যাখ্যা) করা হয়। গ্যালিট শমুয়িলির এই ব্লগে আজ একটি সুন্দর পোস্ট আছে

আপডেট: তৃতীয় কেস সময় সিরিজে উঠে আসে যখন কোনও ভেরিয়েবল একটি গুরুত্বপূর্ণ ব্যাখ্যামূলক পরিবর্তনশীল হতে পারে তবে এটি কেবল ভবিষ্যতের জন্য উপলভ্য নয়। উদাহরণস্বরূপ, হোম loansণ জিডিপির সাথে দৃ strongly়ভাবে সম্পর্কিত হতে পারে তবে ভবিষ্যতে হোম loansণের পূর্বাভাস দেওয়ার জন্য এটি খুব বেশি কার্যকর নয় যদি না আমাদের কাছে জিডিপির ভাল পূর্বাভাস থাকে।


3
কেন / কীভাবে একটি গুরুত্বপূর্ণ ব্যাখ্যামূলক পরিবর্তনশীল ভবিষ্যদ্বাণীমূলক নির্ভুলতা হ্রাস করবে?

3
@Srikant। এটি ঘটতে পারে যখন ব্যাখ্যামূলক ভেরিয়েবলের প্রতিক্রিয়া ভেরিয়েবলের সাথে দুর্বল তবে উল্লেখযোগ্য সম্পর্ক থাকে। তারপরে সহগগুলি পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ তবে অনুমান করা শক্ত hard ফলস্বরূপ, বাদ পড়ার সাথে তুলনা করে চলক অন্তর্ভুক্ত করা হলে ভবিষ্যদ্বাণীগুলির এমএসই বৃদ্ধি পেতে পারে। (এর অন্তর্ভুক্তির সাথে পক্ষপাত হ্রাস পেয়েছে তবে
তারতম্যটি

প্রথম অনুচ্ছেদ একটি খুব, খুব ভাল পয়েন্ট। এখনও মাঝে মাঝে আরও খারাপ হয়; এখানে পিএমআইডি: 18052912 একটি দুর্দান্ত উদাহরণ যে কখনও কখনও সত্যের চেয়ে সেটটির গোলমাল অংশে আরও ভাল একটি মডেল তৈরি করা যায় - এটি স্পষ্টতই যে এলোমেলো ডেটাতে একটি ভাল মডেল করতে পারে তবে এটি কিছুটা চমকপ্রদ is ।

1
আমার অজস্রতা ক্ষমা করুন, তবে সাধারণত ঘূর্ণন পিসিএ এবং এফএর একটি অংশ নয়?
richiemorrisroe

3
একটি পরিসংখ্যানগতভাবে sig। তবে দুর্বল ভবিষ্যদ্বাণী ভবিষ্যদ্বাণী বা ব্যাখ্যার জন্য খুব কমই কার্যকর। উদাহরণস্বরূপ, যদি কোনও লিনিয়ার রিগ্রেশন সলিউশনটির পূর্বাভাসকারী এক্স 1 ব্যতীত .40 এর একটি আরএসকিউ থাকে এবং এক্স 1 এর অন্তর্ভুক্তি যদি সেই আরএসকিউতে .01 যোগ করে, তবে এক্স 1 ভবিষ্যদ্বাণী বা ব্যাখ্যার জন্য "গুরুত্বপূর্ণ" নয়।
Rolando2

17

যদিও কিছু লোক ব্যবহৃত মডেল / অ্যালগরিদমের ক্ষেত্রে পার্থক্যটি বিবেচনা করা সবচেয়ে সহজ বলে মনে করে (যেমন, স্নায়ু জাল = ভবিষ্যদ্বাণীমূলক) তবে এটি ব্যাখ্যা / পূর্বাভাসের পার্থক্যের কেবল একটি বিশেষ দিক। এখানে উভয় কোণ থেকে লিনিয়ার রিগ্রেশন শেখানোর জন্য আমি আমার ডেটা মাইনিং কোর্সে স্লাইডগুলির ডেকেছি। এমনকি একা লিনিয়ার রিগ্রেশন সহ এবং এই ক্ষুদ্র উদাহরণের সাথে বিভিন্ন ইস্যু উত্থিত হয় যা ব্যাখ্যামূলক বনাম ভবিষ্যদ্বাণীমূলক লক্ষ্যগুলির জন্য বিভিন্ন মডেলের দিকে পরিচালিত করে (ভেরিয়েবলগুলির পছন্দ, পরিবর্তনশীল নির্বাচন, কার্য সম্পাদন ব্যবস্থা ইত্যাদি))

Galit


5
কৌতূহলের বাইরে, এটা কি ইচ্ছাকৃত যে আপনার ভবিষ্যদ্বাণীটির জন্য রিগ্রেশন সম্পর্কিত আলোচনায় (প্রারম্ভিক পৃষ্ঠা 33) আপনি প্রশিক্ষণ এবং বৈধকরণের ডেটাসেটগুলিতে বিভক্ত হওয়ার পূর্বে ভবিষ্যদ্বাণীদের (পদক্ষেপ 1) চয়ন করেন (পদক্ষেপ 3)? আমি ভেবেছি যে সর্বাধিক উদ্দেশ্যমূলক এবং সৎ প্রক্রিয়াটি স্ক্যাটারপ্লটগুলি দেখার আগে (প্রথম পদক্ষেপ) শুরু করার আগেই ভাগ করা হবে। যদি পুরো ডেটাসেটের উপর ভিত্তি করে রেজিস্ট্রারগুলি বেছে নেওয়া হয়, তবে পরবর্তী সময়ে বৈধতার ডেটা প্রয়োগ করার পরেও কি এটি অনেক পরীক্ষায় আপাত তাত্পর্যপূর্ণ স্তরকে বাড়িয়ে তুলবে না?
হোবার

আমি মনে করি আরও সাধারণ প্রশ্ন হোল্ডআউট রাখার আগে আপনি ডেটা ভিজুয়ালাইজেশন সম্পাদন করেন কিনা। যখন ডেটাসেটটি বড় হয়, তখন আসলে এটি কোনও বিষয় নয় doesn't একটি ছোট নমুনা সহ, ভবিষ্যদ্বাণীকারীদের চয়ন করতে ভিজ্যুয়ালাইজেশন ব্যবহার করা সত্যই বিপজ্জনক। আমার স্লাইডগুলিতে আমি ভেরিয়েবল নির্বাচনের জন্য ভিজ্যুয়ালাইজেশন ব্যবহার করে বোঝাতে চাইছি না। "সিলেক্ট প্রেডিক্টর" আরও সাধারণভাবে "উপলব্ধ পূর্বাভাসীদের যুক্তিসঙ্গত একটি সম্ভাব্য সেট নির্বাচন করুন"। যুক্তিসঙ্গত সেট নির্বাচন করার জন্য এটি ডোমেন জ্ঞানকে অন্তর্ভুক্ত করার বিষয়ে আরও বেশি।
গ্যালিট শমুয়েলি

"ব্যাখ্যা করতে বা ভবিষ্যদ্বাণী করা" শীর্ষক বিষয় অব্যাহত রেখে আমার এখানে একটি সম্পর্কিত প্রশ্ন রয়েছে । প্রশ্নটি বেশিরভাগ আপনার কাগজের উপর ভিত্তি করে আপনি যদি একবার নজর দেন তবে আমি প্রশংসা করব।
রিচার্ড হার্ডি

প্রফেসর শমুয়েলি, আপনি এই বিষয় সম্পর্কে আপনার পেপারের 291 পৃষ্ঠায় বলেছেন যে আপনি 1993 সালের গিজার দ্বারা সংজ্ঞায়িত হিসাবে কেবল 'ননস্টোকাস্টিক প্রেডিকশন' বিবেচনা করছেন। পাশাপাশি একটি নতুন পোস্ট শুরু করতে পেরে আনন্দিত, তবে ভেবেছিলাম আমি এখানে আগে জিজ্ঞাসা করব।
ব্যবহারকার 0

11

উদাহরণ: একটি ক্লাসিক উদাহরণ যা আমি দেখেছি তা হল মানুষের কর্মক্ষমতা সম্পর্কে ভবিষ্যদ্বাণী করার প্রসঙ্গে। স্ব-কার্যকারিতা (অর্থাত, একজন ব্যক্তি যে ডিগ্রিতে মনে করেন যে তারা কোনও কাজটি ভালভাবে সম্পাদন করতে পারে) প্রায়শই কার্য সম্পাদনের দৃ a় ভবিষ্যদ্বাণী হন। সুতরাং, যদি আপনি বুদ্ধি এবং পূর্ব অভিজ্ঞতার ডিগ্রির মতো অন্যান্য ভেরিয়েবলগুলির সাথে একাধিক রিগ্রেশনটিতে স্ব-কার্যকারিতা রাখেন তবে আপনি প্রায়শই দেখতে পান যে স্ব-কার্যকারিতা একটি শক্তিশালী ভবিষ্যদ্বাণী।

এটি কিছু গবেষককে পরামর্শ দেওয়ার জন্য নেতৃত্ব দিয়েছে যে স্ব-কার্যকারিতা কার্য সম্পাদনের কারণ হয়ে দাঁড়ায়। এবং সেই কার্যকর হস্তক্ষেপগুলি সেগুলি যা কোনও ব্যক্তির স্ব-কার্যকারিতা বোধ বৃদ্ধিতে ফোকাস করে।

তবে, বিকল্প তাত্ত্বিক মডেলটি কার্য-কার্যকারিতার ফলাফল হিসাবে মূলত স্ব-কার্যকারিতা দেখে। অর্থাৎ আপনি যদি ভাল থাকেন তবে আপনি এটি জানেন। এই কাঠামোর ক্ষেত্রে হস্তক্ষেপগুলি প্রকৃত দক্ষতা বৃদ্ধি এবং অনুধাবন যোগ্যতা না বাড়ানোর উপর ফোকাস করা উচিত।

সুতরাং, স্ব-কার্যকারিতার মত একটি পরিবর্তনশীল সহ ভবিষ্যদ্বাণী বাড়তে পারে তবে আপনি স্ব-কার্যকারিতা হিসাবে ফলাফল মডেল গ্রহণ করে ধরে নিচ্ছেন, যদি মডেলটির লক্ষ্য কার্যকারণকে প্রভাবিত করে কার্যকারণ প্রক্রিয়াগুলি ব্যাখ্যা করা হয় তবে এটি ভবিষ্যদ্বাণী হিসাবে অন্তর্ভুক্ত করা উচিত নয়।

এটি অবশ্যই কার্যকারণ তাত্ত্বিক মডেলটি কীভাবে বিকাশ ও বৈধ করতে হবে তা উত্থাপন করে। এটি স্পষ্টভাবে একাধিক গবেষণার উপর নির্ভর করে, আদর্শভাবে কিছু পরীক্ষামূলক হেরফের এবং গতিশীল প্রক্রিয়া সম্পর্কে সুসংগত যুক্তি দিয়ে।

প্রক্সিমাল বনাম ডিস্টাল : গবেষকরা যখন দূরবর্তী এবং প্রক্সিমাল কারণগুলির প্রভাবের বিষয়ে আগ্রহী হন তখন আমি একই রকম বিষয় দেখেছি। প্রক্সিমাল কারণগুলি দূরবর্তী কারণগুলির চেয়ে ভাল পূর্বাভাস দেয়। যাইহোক, তাত্ত্বিক আগ্রহ সেই উপায়গুলি বোঝার ক্ষেত্রে হতে পারে যেগুলি দূরবর্তী এবং প্রক্সিমাল কারণগুলি পরিচালনা করে।

পরিবর্তনীয় নির্বাচনের ইস্যু : অবশেষে, সামাজিক বিজ্ঞান গবেষণার একটি বিশাল সমস্যা হ'ল পরিবর্তনশীল নির্বাচনের বিষয়টি। প্রদত্ত যে কোনও গবেষণায়, অসীম সংখ্যক ভেরিয়েবল রয়েছে যা পরিমাপ করা যেতে পারে তবে তা ছিল না। সুতরাং, তাত্ত্বিক ব্যাখ্যা করার সময় মডেলগুলির ব্যাখ্যার এগুলির প্রভাবগুলি বিবেচনা করা উচিত।


"দুর্বল হাইপোথিসিস" এর সামাজিক বিজ্ঞানেও একটি সমস্যা রয়েছে (উদাহরণস্বরূপ প্রভাবটি ইতিবাচক বনাম নেতিবাচক)। এবং সেই "স্ব কার্যকারিতা" উদাহরণে, আপনি দেখতে পাচ্ছেন যে প্রতিটি ব্যক্তির তৈরি করা পারফরম্যান্সের অভ্যন্তরীণ ভবিষ্যদ্বাণী হিসাবে। সুতরাং এটি সম্ভবত "ব্ল্যাক বক্স" পূর্বাভাসকে ব্যাখ্যামূলক ভেরিয়েবল হিসাবে ব্যবহার করার অনুরূপ।
সম্ভাব্যতা ব্লগ

9

স্ট্যাটিস্টিকাল মডেলিং: এল ব্রিমন দ্বারা রচিত দুটি সংস্কৃতি (2001) সম্ভবতঃ এই বিষয়টির সেরাতম কাগজ। তার প্রধান সিদ্ধান্তগুলি (নথির শেষের দিকে অন্যান্য বিশিষ্ট পরিসংখ্যানবিদদের জবাবগুলিও দেখুন) নিম্নরূপ:

  • "উচ্চতর ভবিষ্যদ্বাণীমূলক নির্ভুলতা অন্তর্নিহিত ডেটা মেকানিজম সম্পর্কে আরও নির্ভরযোগ্য তথ্যের সাথে সম্পর্কিত We
  • "অ্যালগরিদমিক মডেলগুলি ডেটা মডেলের চেয়ে ভাল ভবিষ্যদ্বাণীমূলক নির্ভুলতা দিতে পারে এবং অন্তর্নিহিত প্রক্রিয়া সম্পর্কে আরও ভাল তথ্য সরবরাহ করতে পারে।"

3
কেবল আগের সম্পর্কিত প্রশ্নের সাথে একটি লিঙ্ক তৈরি করতে: দ্য সংস্কৃতি: পরিসংখ্যান বনাম মেশিন লার্নিং?
chl

3
অ্যালগরিদমিক মডেলগুলির সমস্যা হ'ল তারা বুঝতে খুব শক্ত। এটি উদ্ভূত সম্ভাব্য সমস্যাগুলি নির্ণয় এবং সংশোধন করা শক্ত করে তোলে। কাঠামোগত মডেলটি মূল্যায়ন করা অনেক সহজ কারণ আপনি জানেন যে প্রতিটি উপাদানগুলির চেহারা কেমন হওয়া উচিত।
সম্ভাব্যতাব্লোগিক

8

আমি লিঙ্কযুক্ত কাগজের বিমূর্ততার বাইরে তাঁর কাজটি পড়িনি, তবে আমার ধারণাটি হ'ল "ব্যাখ্যা" এবং "ভবিষ্যদ্বাণী" এর মধ্যে পার্থক্যটি দূরে ফেলে দেওয়া উচিত এবং অনুশীলনের লক্ষ্যগুলির মধ্যে পার্থক্যটি প্রতিস্থাপন করা উচিত, যা হয় " কার্যকারক "বা" ভবিষ্যদ্বাণীমূলক "। সাধারণভাবে, আমি মনে করি "ব্যাখ্যা" এমন একটি অস্পষ্ট শব্দ যার অর্থ প্রায় কিছুই নেই। উদাহরণস্বরূপ, হুকের আইন ব্যাখ্যামূলক বা ভবিষ্যদ্বাণীমূলক? বর্ণালীটির অন্য প্রান্তে, ভবিষ্যদ্বাণীমূলকভাবে সঠিক সুপারিশ সিস্টেমগুলি সুস্পষ্ট আইটেম রেটিংয়ের কার্যকারণ মডেলগুলি কী? আমি মনে করি যে আমরা সবাই স্বজ্ঞাতটি ভাগ করে নিই যে বিজ্ঞানের লক্ষ্য ব্যাখ্যা, যখন প্রযুক্তির লক্ষ্যটি পূর্বাভাস; এবং তত্ত্বাবধানে শেখার অ্যালগরিদমগুলির মতো আমরা যে সরঞ্জামগুলি ব্যবহার করি সেগুলি বিবেচনা করে এই স্বজ্ঞাততা কোনওভাবে হারিয়ে যায়,

সমস্ত কিছু বলার পরে, সম্ভবত আমি কেবলমাত্র একটি শব্দটিই মডেলকে প্রয়োগ করব তা ব্যাখ্যাযোগ্য। রিগ্রেশনগুলি সাধারণত ব্যাখ্যাযোগ্য; অনেক স্তর সহ নিউরাল জাল প্রায়শই হয় না। আমি মনে করি লোকে কখনও কখনও নির্লজ্জভাবে ধরে ধরে নেয় যে একটি মডেল যা ব্যাখ্যাযোগ্য তা কার্যকারণ তথ্য সরবরাহ করে, যখন অনির্বচনীয় মডেল কেবল ভবিষ্যদ্বাণীমূলক তথ্য সরবরাহ করে। এই মনোভাবটি কেবল আমার কাছে বিভ্রান্ত বলে মনে হয়।


7

প্রশ্নটি কী তা নিয়ে আমি এখনও কিছুটা অস্পষ্ট। আমার মতে ভবিষ্যদ্বাণীমূলক এবং ব্যাখ্যামূলক মডেলের মধ্যে মৌলিক পার্থক্যটি তাদের ফোকাসের পার্থক্য।

ব্যাখ্যামূলক মডেল

xyβ

ভবিষ্যদ্বাণীমূলক মডেল

ভবিষ্যদ্বাণীপূর্ণ মডেলগুলির লক্ষ্য হ'ল কিছু ভবিষ্যদ্বাণী করা। সুতরাং, তারা পার্সিমনি বা সরলতার দিকে কম মনোনিবেশ করে তবে নির্ভরশীল ভেরিয়েবলের পূর্বাভাস দেওয়ার দক্ষতার দিকে তাদের বেশি থাকে।

তবে উপরের কিছুটা কৃত্রিম পার্থক্য হওয়ায় ব্যাখ্যামূলক মডেলগুলি পূর্বাভাসের জন্য ব্যবহার করা যেতে পারে এবং কখনও কখনও ভবিষ্যদ্বাণীমূলক মডেলগুলি কিছু ব্যাখ্যা করতে পারে।


জটিলতার উল্লেখ করার জন্য +1 যা শীর্ষ উত্তরগুলি দ্বারা সরাসরি উল্লেখ করা হয়নি। তবে, ব্যাখ্যামূলক মডেলগুলি হস্তক্ষেপের জন্য ব্যবহৃত হলে চ্যালেঞ্জটি দেখা দেয়। কেউ কীভাবে নিশ্চিত করতে পারে যে অনুমিত সহগগুলি পক্ষপাতদুষ্ট নয় যা পার্সিমনি দ্বারা সৃষ্ট একটি সাধারণ সমস্যা?
টমাস স্পিডেল

5

অন্যরা যেমন ইতিমধ্যে বলেছে, গবেষকের লক্ষ্য সম্পর্কিত বিষয়গুলি ব্যতীত পার্থক্যটি কিছুটা অর্থহীন।

ব্রাড এফ্রন, দ্য কালচার্স পেপারের অন্যতম ভাষ্যকার , নিম্নলিখিত পর্যবেক্ষণ করেছেন ( আমার আগের প্রশ্নে যেমন আলোচনা করা হয়েছে ):

ভবিষ্যদ্বাণী নিজেই কেবল মাঝে মধ্যে যথেষ্ট। পোস্ট অফিস হস্ত-লিখিত স্ক্রোলগুলি থেকে সঠিক ঠিকানাগুলির পূর্বাভাস দেয় এমন কোনও পদ্ধতিতে খুশি। পিটার গ্রেগরি ভবিষ্যদ্বাণীমূলক উদ্দেশ্যে, কিন্তু হেপাটাইটিসের চিকিত্সার ভিত্তি আরও ভালভাবে বোঝার জন্য তাঁর অধ্যয়ন শুরু করেছিলেন। বেশিরভাগ পরিসংখ্যান জরিপে তাদের চূড়ান্ত লক্ষ্য হিসাবে কার্যকারক কারণগুলির সনাক্তকরণ রয়েছে।

নির্দিষ্ট ক্ষেত্রগুলি (যেমন Medicষধি) ডেটা উত্পন্ন করে এমন অন্তর্নিহিত প্রক্রিয়া বোঝার উপায় হিসাবে ব্যাখ্যাযোগ্য প্রক্রিয়া (বিতরণ ইত্যাদি) হিসাবে মডেল ফিটিংগুলিতে একটি ভারী ওজন রাখে। অন্যান্য ক্ষেত্রগুলি এর সাথে কম চিন্তিত, এবং একটি "ব্ল্যাক বক্স" মডেল নিয়ে খুশি হবে যা খুব উচ্চমানের সাফল্য অর্জন করেছে। এটি মডেল বিল্ডিং প্রক্রিয়াটিতেও কাজ করতে পারে।


5

শ্রদ্ধার সাথে, এই প্রশ্ন আরও ভাল ফোকাস করা যেতে পারে। যখন অন্য শব্দটি বেশি উপযুক্ত হয় তখন কি লোকেরা একটি শব্দ ব্যবহার করেছে? হ্যা অবশ্যই. কখনও কখনও এটি প্রসঙ্গ থেকে যথেষ্ট পরিষ্কার হয়, বা আপনি পেডেন্টিক হতে চান না। কখনও কখনও লোকেরা তাদের পরিভাষায় খালি বা অলস হয়। এটি অনেক মানুষের ক্ষেত্রেই সত্য এবং আমি অবশ্যই এর চেয়ে ভাল।

এখানে সম্ভাব্য মান কী (ব্যাখ্যা সিভিতে বনাম পূর্বাভাস সম্পর্কে আলোচনা করা), দুটি পদ্ধতির মধ্যে পার্থক্য স্পষ্ট করা। সংক্ষেপে, কার্যকারকের ভূমিকাতে পার্থক্য কেন্দ্র। আপনি যদি বিশ্বের কিছু গতিশীল বুঝতে চান এবং কেন কিছু ঘটে তার কারণ ব্যাখ্যা করতে চান, তবে আপনাকে প্রাসঙ্গিক ভেরিয়েবলগুলির মধ্যে কার্যকারক সম্পর্ক চিহ্নিত করতে হবে। ভবিষ্যদ্বাণী করা, আপনি কার্যকারিতা উপেক্ষা করতে পারেন। উদাহরণস্বরূপ, আপনি এর কারণ সম্পর্কে জ্ঞান থেকে কোনও প্রভাবের পূর্বাভাস দিতে পারেন; আপনি জ্ঞান থেকে কারণ অস্তিত্ব পূর্বাভাস করতে পারেন যে প্রভাবটি ঘটেছে; এবং আপনি একই কারণ দ্বারা চালিত অন্য প্রভাব সম্পর্কে জ্ঞান দ্বারা এক প্রভাবের আনুমানিক স্তরের পূর্বাভাস দিতে পারেন। কেউ কেন এটি করতে সক্ষম হবেন? ভবিষ্যতে কী ঘটতে পারে সে সম্পর্কে তাদের জ্ঞান বাড়াতে, যাতে তারা সেই অনুযায়ী পরিকল্পনা করতে পারে। উদাহরণস্বরূপ, কোনও প্যারোল বোর্ড সম্ভাব্যতাটি পূর্বাভাস দিতে সক্ষম হতে পারে যে পার্লড করা হলে কোনও অপরাধী পুনরায় আদায় করতে পারে। তবে এটি ব্যাখ্যার জন্য যথেষ্ট নয়। অবশ্যই, দুটি ভেরিয়েবলের মধ্যে সত্যিকারের কার্যকারণ সম্পর্কের অনুমান করা অত্যন্ত কঠিন হতে পারে। তদতিরিক্ত, যে মডেলগুলি প্রকৃত কার্যকারিতা সম্পর্কে ক্যাপচার করে (যা বলে মনে করা হয়) প্রায়শই ভবিষ্যদ্বাণী করার জন্য খারাপ হয়। তাহলে কেন এটা করবেন? প্রথমত, এর বেশিরভাগটি বিজ্ঞানে করা হয়, যেখানে নিজের স্বার্থের জন্য বোঝার চেষ্টা করা হয়। দ্বিতীয়ত, আমরা যদি নির্ভরযোগ্যভাবে সত্য কারণগুলি বেছে নিতে পারি এবং সেগুলি প্রভাবিত করার ক্ষমতা বিকাশ করতে পারি তবে আমরা প্রভাবগুলির উপর কিছুটা প্রভাব ফেলতে পারি।

পরিসংখ্যানগত মডেলিং কৌশল সম্পর্কিত, একটি বড় পার্থক্য নেই। প্রাথমিকভাবে পার্থক্যটি কীভাবে অধ্যয়ন পরিচালনা করতে হয় তার মধ্যে রয়েছে। যদি আপনার লক্ষ্যটি ভবিষ্যদ্বাণী করতে সক্ষম হয়, মডেল ব্যবহারকারীদের কাছে ভবিষ্যদ্বাণী করার প্রয়োজন হলে তাদের কোন তথ্য উপলব্ধ হবে তা সন্ধান করুন। তাদের যে তথ্যে অ্যাক্সেস থাকবে না সেগুলির কোনও মূল্য নেই। যদি তারা সম্ভবত ভবিষ্যদ্বাণীকারীদের একটি নির্দিষ্ট স্তরে (বা একটি সংকীর্ণ সীমার মধ্যে) ভবিষ্যদ্বাণী করতে সক্ষম হতে চান, তবে সেই স্তরটিতে ভবিষ্যদ্বাণীকের নমুনা পরিসীমাটি কেন্দ্র করে সেখানে ওভার স্যাম্পল করার চেষ্টা করুন। উদাহরণস্বরূপ, যদি কোনও প্যারোল বোর্ড বেশিরভাগ 2 টি বড় ধরণের দোষী সাব্যস্ত অপরাধীদের সম্পর্কে জানতে চায় তবে আপনি 1, 2 এবং 3 টি দোষী সাব্যস্ত করে অপরাধীদের সম্পর্কে তথ্য সংগ্রহ করতে পারেন। অন্যদিকে, ভেরিয়েবলের কার্যকারিতা পরিস্থিতি মূল্যায়নের জন্য একটি পরীক্ষার প্রয়োজন হয়। এটাই, পরীক্ষামূলক ইউনিটগুলি বর্ণনামূলক ভেরিয়েবলগুলির পূর্বনির্ধারিত স্তরের এলোমেলোভাবে নির্ধারিত করা প্রয়োজন। কার্যকারণ প্রভাবের প্রকৃতি অন্য কোনও পরিবর্তনশীলের উপর নির্ভরশীল কিনা তা নিয়ে যদি উদ্বেগ থাকে তবে সেই পরিবর্তনশীলটিকে অবশ্যই পরীক্ষায় অন্তর্ভুক্ত করতে হবে। যদি সত্যিকারের পরীক্ষা চালানো সম্ভব না হয় তবে আপনি আরও অনেক জটিল পরিস্থিতির মুখোমুখি হচ্ছেন, যা এখানে প্রবেশ করা খুব জটিল।


1
(x,y,z,v)z(x,y,v)বিশ্লেষণের। আপনার শেষ অনুচ্ছেদটি আবার করুন, কৌশলটিতে তীব্র পার্থক্যের প্রমাণ দিয়ে এই সাইটে অনেকগুলি অ্যাকাউন্ট রয়েছে।
শুক্র

1
আপনি ঠিক এই গবেষণার উদ্দেশ্য উপর hinges। আমি মনে করি আমি সেটিকে স্পষ্ট করে তুলিনি (আমি কেবল আপনি কী অর্জন করতে চান সে সম্পর্কেই কথা বললাম )। এটিও সত্য যে ব্যাখ্যাটির কার্যকারণের সাথে হুবহু উদ্বিগ্ন হওয়ার দরকার নেই - কার্যকারণের সাথে সাদৃশ্যপূর্ণ কিছুটিও খাপ খায় (যেমন, মাত্রা - ভলিউম কেসটি যৌক্তিক / গাণিতিক জড়িতগুলির মধ্যে একটি)। যাইহোক, বেশিরভাগ ব্যাখ্যামূলক মডেলিং কার্যকারিতা কেন্দ্র; আমার ধারণা আমি সরলতার জন্য এই ধরণের জিনিসটি এড়িয়ে যেতে পারি। পরিশেষে, অধ্যয়নের নকশা ও ডেটা সংগ্রহের সময় কৌশলটি আলাদা হয়, তবে এক্স এর উপর y রেজিস্ট্রেশন করা প্রায় একই।
গুং

উত্তর দেওয়ার জন্য আপনাকে ধন্যবাদ। এই সাইটের অন্যান্য এক্সচেঞ্জ থেকে আমি আক্ষরিকভাবে সত্য না হয়ে লেখকের পটভূমি এবং অভিজ্ঞতা প্রতিবিম্বিত করতে "কার্যকারণে সবচেয়ে ব্যাখ্যামূলক মডেলিং কেন্দ্র" এর মতো সর্বজনীন বিবৃতি বুঝতে শিখেছি। শারীরিক এবং "কঠোর" বিজ্ঞানের ক্ষেত্রে এই বিবৃতিটি সঠিক হতে পারে তবে সামাজিক এবং "নরম" বিজ্ঞানে আমি সন্দেহ করি যে অনুশীলনকারীরা এইরকম দৃ strong় দাবি করবেন make প্রায়শই, বাস্তবে, অধ্যয়নের অধীনে থাকা সম্পর্কের সাধারণ গোপন কারণ রয়েছে বলে বিশ্বাস করা হয় তবে রেজিস্ট্রার এবং রেজিস্ট্রেন্ডের মধ্যে প্রত্যক্ষ কারণকে প্রতিফলিত করে না।
হোবার

@ তবে এটি সত্যিই সত্য যে আমার ধারণাগুলি আমার পটভূমি এবং অভিজ্ঞতা দ্বারা প্রভাবিত। যদি এই উত্তরটি কার্যকর না হয় (আমি লক্ষ্য করেছি যে কোনও ভোট পান নি) তবে আমি এটি মুছতে পারি। অন্য অনেকের উত্তর দেওয়া হয়েছে যা আমি জানাতে চাইছিলাম এমন ধারণাগুলি কভার করে।
গাং

@ হুইবার - নরম কার্যকারিতার একটি ভাল উদাহরণ হ'ল ধূমপান ক্যান্সারের কারণ হয় "- যদিও আমি নিশ্চিত যে আপনি এমন একটি চেইন স্মোকার খুঁজে পেয়েছেন যার ক্যান্সার নেই doesn't কার্যকারিতার ধারণা ঘটনাগুলির সময়ের সাথে আন্তঃসম্পর্কিত। প্রভাবটির আগে কারণটি অবশ্যই ঘটতে পারে - যা কিউব উদাহরণটি কোনও অর্থ দেয় না তা ব্যাখ্যা করে।
সম্ভাব্যতা ব্লগ

4

উত্তরগুলির বেশিরভাগই স্পষ্ট করতে সাহায্য করেছে যে ব্যাখ্যা করার জন্য মডেলিং এবং পূর্বাভাসের জন্য মডেলিং কী এবং কেন তারা পৃথক। এখন পর্যন্ত কী পরিষ্কার নয়, তারা কীভাবে আলাদা। সুতরাং, আমি ভেবেছিলাম যে আমি একটি উদাহরণ দেব যা কার্যকর হতে পারে।

মনে করুন আমরা কলেজের জিপিএ মডেলিংয়ে একাডেমিক প্রস্তুতির একটি কার্যকারিতা হিসাবে কাজ করছি। একাডেমিক প্রস্তুতির ব্যবস্থা হিসাবে, আমাদের রয়েছে:

  1. প্রবণতা টেস্ট স্কোর;
  2. এইচএস জিপিএ; এবং
  3. এপি পরীক্ষায় পাসের সংখ্যা।

ভবিষ্যদ্বাণী জন্য কৌশল

যদি লক্ষ্যটির পূর্বাভাস হয় তবে আমি এই সমস্ত পরিবর্তনশীলগুলি একই সাথে একটি রৈখিক মডেলটিতে ব্যবহার করতে পারি এবং আমার প্রাথমিক উদ্বেগটি ভবিষ্যদ্বাণীক নির্ভুলতা হবে। কলেজ জিপিএর পূর্বাভাস দেওয়ার জন্য যে কোনও ভেরিয়েবল সবচেয়ে কার্যকর প্রমাণিত হবে চূড়ান্ত মডেলটিতে অন্তর্ভুক্ত হবে।

ব্যাখ্যার কৌশল

যদি লক্ষ্যটি ব্যাখ্যা হয় তবে আমি ডেটা হ্রাস সম্পর্কে আরও উদ্বিগ্ন হতে পারি এবং স্বাধীন ভেরিয়েবলগুলির মধ্যে পারস্পরিক সম্পর্কের বিষয়ে যত্ন সহকারে চিন্তা করি। আমার প্রাথমিক উদ্বেগটি সহগের ব্যাখ্যা করবে।

উদাহরণ

পারস্পরিক সম্পর্কযুক্ত ভবিষ্যদ্বাণীকারীদের সাথে একটি সাধারণ মাল্টিভারিয়েট সমস্যায়, "অপ্রত্যাশিত" রিগ্রেশন সহগগুলি পর্যবেক্ষণ করা অস্বাভাবিক হবে না। স্বতন্ত্র ভেরিয়েবলের মধ্যে আন্তঃসম্পর্ক স্থাপনের ফলে, এই ভেরিয়েবলগুলির মধ্যে কিছুগুলির আংশিক সহগগুলি দেখলে অবাক হওয়ার কিছু থাকবে না যেগুলি তাদের শূন্য-ক্রমের সম্পর্কের মতো একই দিক নয় এবং যা স্বতঃস্ফূর্ত এবং ব্যাখ্যা হিসাবে শক্ত মনে হতে পারে।

উদাহরণস্বরূপ, ধরুন মডেলটি পরামর্শ দেয় যে (অ্যাপটিটিউড টেস্ট স্কোর এবং এপি টেস্টের সংখ্যা সফলভাবে বিবেচনায় নেওয়া) উচ্চতর উচ্চ বিদ্যালয়ের জিপিএগুলি নিম্ন কলেজের জিপিএর সাথে জড়িত । এটি পূর্বাভাসের জন্য কোনও সমস্যা নয়, তবে এটি ব্যাখ্যামূলক মডেলের ক্ষেত্রে সমস্যা তৈরি করে যেখানে এই জাতীয় সম্পর্কের ব্যাখ্যা করা কঠিন । এই মডেলটি নমুনা পূর্বাভাসগুলির থেকে সেরা প্রদান করতে পারে তবে একাডেমিক প্রস্তুতি এবং কলেজ জিপিএর মধ্যে সম্পর্কটি বুঝতে আমাদের সহায়তা করে না।

পরিবর্তে, একটি ব্যাখ্যামূলক কৌশল কিছু পরিবর্তনশীল হ্রাস যেমন ফর্মাল উপাদান, ফ্যাক্টর বিশ্লেষণ, বা এসইএম হতে পারে:

  1. সেই এক চলকটির উপরে "একাডেমিক পারফরম্যান্স" এবং মডেল কলেজ জিপিএর সেরা পরিমাপ যে পরিবর্তনশীলটিতে মনোনিবেশ করুন; অথবা
  2. মূল ভেরিয়েবলের চেয়ে তিনটি একাডেমিক প্রস্তুতির সংমিশ্রণ থেকে প্রাপ্ত ফ্যাক্টর স্কোর / সুপ্ত ভেরিয়েবলগুলি ব্যবহার করুন।

এগুলির মতো কৌশলগুলি মডেলের ভবিষ্যদ্বাণীপূর্ণ শক্তি হ্রাস করতে পারে তবে কলেজের জিপিএর সাথে কীভাবে একাডেমিক প্রস্তুতি সম্পর্কিত তা তারা আরও ভালভাবে বুঝতে পারে।


পাল্টা স্বজ্ঞাত চিহ্নের বিষয়ে, আমি আশ্চর্য হয়েছি কারণ এটি আমাদের অন্তর্দৃষ্টিটি ভুল কোয়ারিয়েটকে ব্যাখ্যা করছে - একটি প্রধান প্রভাবের মতো যেন এটি নেস্টেড বা ইন্টারঅ্যাকশন প্রভাব।
সম্ভাব্যতা ব্লগ

3

আমি বিষয়টি সম্পর্কে একটি মডেল কেন্দ্রিক দৃষ্টিভঙ্গি দিতে চাই।

ভবিষ্যদ্বাণীপূর্ণ মডেলিং হ'ল বেশিরভাগ বিশ্লেষণে। উদাহরণস্বরূপ, একজন গবেষক একগুচ্ছ ভবিষ্যদ্বাণী নিয়ে একটি রিগ্রেশন মডেল স্থাপন করেন। রিগ্রেশন সহগগুলি তারপরে গ্রুপগুলির মধ্যে ভবিষ্যদ্বাণীমূলক তুলনা উপস্থাপন করে। ভবিষ্যদ্বাণীমূলক দিকটি সম্ভাব্যতা মডেল থেকে আসে: অনুমানটি একটি সুপারপপুলেশন মডেল সম্পর্কিত পর্যবেক্ষণ করা হয় যা পর্যবেক্ষিত জনসংখ্যা বা নমুনা তৈরি করতে পারে। এই মডেলটির উদ্দেশ্য হ'ল এই সুপারপপুলেশন থেকে উদ্ভূত ইউনিটগুলির জন্য নতুন ফলাফলের পূর্বাভাস দেওয়া। প্রায়শই, এটি একটি নিরর্থক উদ্দেশ্য কারণ বিষয়গুলি সর্বদা পরিবর্তিত হয়, বিশেষত সামাজিক বিশ্বে। অথবা কারণ আপনার মডেলটি বিরল একক যেমন দেশগুলির সম্পর্কে এবং আপনি একটি নতুন নমুনা আঁকতে পারবেন না। এক্ষেত্রে মডেলটির কার্যকারিতা বিশ্লেষকের প্রশংসা থেকে যায়।

আপনি ফলাফলগুলি অন্য গোষ্ঠী বা ভবিষ্যতের ইউনিটগুলিতে সাধারণীকরণের চেষ্টা করার পরে, এটি এখনও পূর্বাভাস তবে অন্যরকম। আমরা উদাহরণস্বরূপ এটি পূর্বাভাস বলতে পারি। মূল বক্তব্যটি হ'ল আনুমানিক মডেলের ভবিষ্যদ্বাণীপূর্ণ শক্তি হ'ল বর্ণনামূলক প্রকৃতির পূর্বনির্ধারিত । আপনি গোষ্ঠীগুলির মধ্যে একটি ফলাফলের তুলনা করেন এবং এই তুলনাগুলির জন্য একটি সম্ভাবনার মডেলটিকে অনুমান করেন তবে আপনি এই সিদ্ধান্তটি তুলতে পারবেন না যে এই তুলনাগুলি কার্যকারণ প্রভাবগুলি গঠন করে।

কারণ হ'ল এই গোষ্ঠীগুলি নির্বাচনের পক্ষপাতিত্বের শিকার হতে পারে । অর্থাত্, চিকিত্সা নির্বিশেষে (কাল্পনিক কার্যকারণমূলক হস্তক্ষেপ) তাদের আগ্রহের ফলাফলের ক্ষেত্রে স্বাভাবিকভাবেই উচ্চতর স্কোর থাকতে পারে। অথবা এগুলি অন্যান্য গোষ্ঠীর তুলনায় পৃথক চিকিত্সার প্রভাবের আকারের হতে পারে। এ কারণেই, বিশেষত পর্যবেক্ষণমূলক তথ্যের জন্য, অনুমান করা মডেলগুলি সাধারণত ভবিষ্যদ্বাণীমূলক তুলনা সম্পর্কে এবং ব্যাখ্যাটি নয়। ব্যাখ্যা কার্যকারণ প্রভাব সনাক্তকরণ এবং অনুমান সম্পর্কে এবং ভাল ডিজাইন করা পরীক্ষা বা উপকরণের ভেরিয়েবলগুলির চিন্তাশীল ব্যবহারের প্রয়োজন। এই ক্ষেত্রে, ভবিষ্যদ্বাণীমূলক তুলনাগুলি কোনও নির্বাচনের পক্ষপাতিত্ব থেকে কাটা হয় এবং কার্যকারিতা প্রভাব উপস্থাপন করে। মডেলটি এভাবে ব্যাখ্যামূলক হিসাবে বিবেচিত হতে পারে।

আমি দেখতে পেয়েছি যে এই শর্তগুলির মধ্যে চিন্তাভাবনা প্রায়শই স্পষ্ট করে দিয়েছে যে কিছু ডেটার জন্য একটি মডেল স্থাপন করার সময় আমি আসলে কী করছিলাম।


+1, এখানে ভাল তথ্য আছে। তবে, "বেশিরভাগ বিশ্লেষণে ভবিষ্যদ্বাণীমূলক মডেলিং হ'ল" এই বিবৃতিটি সম্পর্কে আমি সতর্ক থাকব। ভবিষ্যদ্বাণীমূলক মডেলিং আরও সাধারণ কিনা তা শৃঙ্খলা ইত্যাদির দ্বারা পৃথক হতে পারে ইত্যাদি আমার ধারণা অনুমান করা হবে যে একাডেমিয়ায় সর্বাধিক মডেলিং ব্যাখ্যামূলক, এবং বেসরকারী খাতে প্রচুর পরিমাণে মডেলিং / ডেটা মাইনিং করা হয় (যেমন সম্ভাব্য পুনরাবৃত্তি গ্রাহকদের সনাক্তকরণ) ভবিষ্যদ্বাণীপূর্ণ। আমি সহজেই ভুল হতে পারি, তবে এটি বলা শক্ত হবে, একটি অগ্রাধিকার, যা বেশিরভাগ সময় ঘটে।
গাং

1
ঠিক আছে, আমার মতে, পর্যবেক্ষণের তথ্যগুলির বেশিরভাগ মডেলিং ভবিষ্যদ্বাণীপূর্ণ, এমনকি যদি উদ্দেশ্যটি ব্যাখ্যাযোগ্য হয়। যদি আপনি চিকিত্সার অনুষঙ্গটিকে এলোমেলো করে না দিয়ে থাকেন এবং বাস্তবে একটি পরীক্ষামূলক সেটআপে কোনও পরিবর্তন আনয়ন করেন, তবে আপনার প্রতিরোধের সহগগুলির কেবল বর্ণনামূলক মান থাকবে, অর্থাত্, তারা কেবল ভবিষ্যদ্বাণীমূলক তুলনা করার মাধ্যম সরবরাহ করে। উদাহরণস্বরূপ, আপনি ডেমোগ্রাফিক বৈশিষ্ট্যের ভিত্তিতে স্কুলে সাফল্যের পূর্বাভাস দিতে পারেন তবে এর অর্থ এই নয় যে এই ডেমোগ্রাফিকগুলি ব্যাখ্যামূলক কার্যকারণমূলক প্রভাব। কারণটি হল তুলনামূলক পূর্বাভাসগুলি নির্বাচন পক্ষপাতের সংস্পর্শে আসে।
লিওনেল হেনরি

1

ব্ল্যাক বক্স "ভবিষ্যদ্বাণীমূলক" মডেলগুলি থেকে আমরা যা ভাবি তার থেকে আমরা আরও অনেক কিছু শিখতে পারি। কীটি ইনপুট স্পেসের পরিবর্তনের ফলে মডেল OUTPUT কীভাবে প্রভাবিত হয় তা বুঝতে সত্যভাবে বুঝতে বিভিন্ন ধরণের সংবেদনশীলতা বিশ্লেষণ এবং সিমুলেশন চালানো হয়। এই অর্থে এমনকি একটি খাঁটি ভবিষ্যদ্বাণীমূলক মডেল ব্যাখ্যামূলক অন্তর্দৃষ্টি সরবরাহ করতে পারে। এটি এমন একটি বিষয় যা প্রায়শই গবেষণা সম্প্রদায় উপেক্ষা করা বা ভুল বোঝাবুঝি করে। কেবল কারণ আমরা বুঝতে পারি না কেন একটি অ্যালগরিদম কাজ করছে তার অর্থ এই নয় যে অ্যালগরিদমের ব্যাখ্যাযোগ্য শক্তি নেই ...

মূলত একটি মূলধারার দৃষ্টিকোণ থেকে, সম্ভাব্যতা ব্লগের সংক্ষিপ্ত উত্তরটি একেবারে সঠিক ...


এটি পরিষ্কার নয় যে "ব্যাখ্যামূলক অন্তর্দৃষ্টিগুলি" কীভাবে এইভাবে গ্রিন করা যেতে পারে, যদি সেই বাক্যাংশটি দ্বারা আপনি কার্যকারণকে বোঝান।
গাং

1

তিনি পরিসংখ্যানগুলিতে ব্যাখ্যামূলক এবং ভবিষ্যদ্বাণীমূলক অ্যাপ্লিকেশন যাকে বলে তার মধ্যে পার্থক্য রয়েছে । তিনি বলেন আমাদের প্রতিবারই জানা উচিত যে আমরা একে অপরকে ব্যবহার করি যা কোনটি সঠিকভাবে ব্যবহৃত হচ্ছে। তিনি বলেন আমরা প্রায়শই এগুলিকে মিশ্রিত করি, তাই সংঘাত

আমি সম্মত হই যে সামাজিক বিজ্ঞানের প্রয়োগগুলিতে, পার্থক্যটি বোধগম্য, তবে প্রাকৃতিক বিজ্ঞানের ক্ষেত্রে সেগুলি একই এবং হওয়া উচিত। এছাড়াও, আমি তাদের সাথে যোগাযোগ অনুমান বনাম পূর্বাভাস , এবং সম্মত হন যে এ সামাজিক বিজ্ঞান তাদের তালগোল করা উচিত নয়।

আমি প্রাকৃতিক বিজ্ঞান দিয়ে শুরু করব। পদার্থবিজ্ঞানে আমরা ব্যাখ্যায় মনোনিবেশ করেছি, আমরা বোঝার চেষ্টা করছি যে পৃথিবী কীভাবে কাজ করে, কী কারণে ঘটে। ইত্যাদি, অন্যদিকে, ভবিষ্যদ্বাণীমূলক দিকটিও বৈজ্ঞানিক প্রক্রিয়ার একটি অঙ্গ। প্রকৃতপক্ষে, আপনি যে তত্ত্বটি প্রমাণ করেছেন , যা ইতিমধ্যে পর্যবেক্ষণগুলি ভালভাবে ব্যাখ্যা করেছে (ইন-নমুনা সম্পর্কে ভাবেন) তা হল নতুন পর্যবেক্ষণের পূর্বাভাস দেওয়া তারপরে ভবিষ্যদ্বাণী কীভাবে কাজ করেছে তা পরীক্ষা করা। ভবিষ্যদ্বাণীপূর্ণ দক্ষতার অভাবের যে কোনও তত্ত্ব পদার্থবিজ্ঞানে গ্রহণযোগ্যতা অর্জন করতে বড় সমস্যা হবে। এজন্য মাইকেলসন-মুরলে এর মতো পরীক্ষাগুলি এত গুরুত্বপূর্ণ।

সামাজিক বিজ্ঞানে, দুর্ভাগ্যক্রমে, অন্তর্নিহিত ঘটনাটি অস্থিতিশীল, অপরিশোধনযোগ্য, অপূরণীয়যোগ্য। আপনি যদি নিউক্লিয়ায় ক্ষয় দেখে থাকেন তবে প্রতিবার যখন আপনি সেগুলি পর্যবেক্ষণ করেন তখন একই ফলাফল পাবেন এবং একশ বছর আগে আমি বা একটি ছেলে যে একই ফলাফল পেয়েছি। অর্থনীতি বা অর্থায়নে নয়। এছাড়াও, পরীক্ষাগুলি পরিচালনার ক্ষমতা খুব সীমাবদ্ধ, সমস্ত ব্যবহারিক উদ্দেশ্যে প্রায় অস্তিত্বহীন, আমরা কেবল এলোমেলো নমুনা পর্যবেক্ষণ করি এবং পরিচালনা করিপর্যবেক্ষণ। আমি চালিয়ে যেতে পারি তবে ধারণাটি হ'ল যে ঘটনাগুলি আমরা মোকাবিলা করি তা খুব অস্থিতিশীল, তাই আমাদের তত্ত্বগুলি পদার্থবিদ্যার মতো মানের নয়। অতএব, পরিস্থিতি মোকাবিলার একটি উপায় হ'ল হয় অনুমানের দিকে দৃষ্টি নিবদ্ধ করা (যখন আপনি কী কী কারণে বা কী প্রভাব ফেলবে তা বোঝার চেষ্টা করেন) বা পূর্বাভাস (কেবল আপনার কী মনে হয় যা এটি ঘটবে বা কাঠামোকে উপেক্ষা করবে)।


0

একটি স্ট্রাকচারাল মডেল ব্যাখ্যা দেবে এবং একটি ভবিষ্যদ্বাণীপূর্ণ মডেল পূর্বাভাস দেবে। একটি স্ট্রাকচারাল মডেলের সুপ্ত পরিবর্তনশীল থাকবে। স্ট্রাকচারাল মডেল হ'ল রিগ্রেশন এবং ফ্যাক্টর অ্যানালাইসিসের একসাথে পর্বতমালা

সুপ্ত পরিবর্তনশীলগুলি ভবিষ্যদ্বাণীপূর্ণ মডেলগুলিতে (রিগ্রেশন) একাধিক কলিনারিটির আকারে প্রকাশিত হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.