কেন প্যারামেট্রিক পরিসংখ্যানগুলিকে ননপ্যারমেট্রিকের চেয়ে বেশি পছন্দ করা হবে?


60

কেউ আমাকে ব্যাখ্যা করতে পারেন কেন কেউ হাইপোথিসিস টেস্টিং বা রিগ্রেশন বিশ্লেষণের জন্য কেন একটি ননপ্যারমেট্রিক স্ট্যাটিস্টিকাল পদ্ধতিতে প্যারাম্যাট্রিক বেছে নেবেন?

আমার মনে, এটি রাফটিংয়ের জন্য যাওয়া এবং জলবিহীন প্রতিরোধী ঘড়ি চয়ন করার মতো, কারণ আপনি এটি ভিজা নাও পারেন । কেন প্রতিটি উপলক্ষে কাজ করে সেই সরঞ্জামটি ব্যবহার করবেন না?


21
এটি পরিসংখ্যানগত অনুক্রমের প্রক্রিয়াতে ইনডাকটিভ পক্ষপাত প্রবর্তন করা হয়। এটি বলার অভিনব উপায়: আপনি যদি কিছু জানেন তবে এটি একটি ইঙ্গিত হিসাবে সরবরাহ করুন। এই ইঙ্গিতটি প্যারামিটারগুলিতে সম্ভাব্যতার কার্যকরী ফর্ম সরবরাহ বা পূর্বে বিতরণের মতো ফর্ম নিতে পারে। যদি আপনার ইঙ্গিত ভাল হয় তবে ফলাফলটি কোনও ইঙ্গিত ছাড়াই ভাল, এবং যদি এটি খারাপ হয় তবে ফলাফলটি আরও খারাপ।
ক্যাগডাস ওজজেঙ্ক

6
অগত্যা। মূলত আপনি খুব বড় ডেজার্টে কিছু সন্ধান করছেন। যদি কেউ আপনাকে বলে যে আপনি যা খুঁজছেন তা কোনও নির্দিষ্ট অঞ্চলে সীমাবদ্ধ রয়েছে তবে আপনার এটির সন্ধানের সম্ভাবনা উন্নত হবে। তবে যদি তারা আপনাকে ভুল তথ্য দিয়ে বিভ্রান্ত করে তবে আপনি সেই অঞ্চলটি কতটা অনুসন্ধান করুন তা আপনি খুঁজে পাবেন না।
কাগডাস ওজজেঙ্ক

17
কাঠের কাজকর্মী হিসাবে আমি শেষের সাথে উপমাটি পছন্দ করি। যে বাড়িগুলি এবং আসবাবগুলি ভালভাবে নির্মিত এবং শেষগুলি বিশেষায়িত সরঞ্জামগুলি ব্যবহার করে নির্মিত হয়। সাধারণ-উদ্দেশ্যে সরঞ্জামগুলি বাড়ির মালিকদের জন্য এবং পেশাদারদের পক্ষে দ্রুত কাজ করার প্রয়োজন হয় বা কোনও অপরিশোধিত বা অনুপযুক্ত সরঞ্জাম ব্যবহার করার সময় যে কেউ যত্ন নেয় এমন মানের পার্থক্য তৈরি করে না। কারিগরগণ, যদিও কাজের জন্য সঠিক সরঞ্জামটি নিযুক্ত করে সর্বোত্তম ফলাফল অর্জন করেন এবং কিছু জিনিস কেবল এটি ছাড়া করা যায় না। উদাহরণস্বরূপ, সাধারণ-উদ্দেশ্যমূলক হ্যান্ডসॉ দিয়ে কেউ কখনই একটি ভাল ডোভেল টেইল করেনি।
হোবার

3
আপনি কোদাল বা চা-চামচ দিয়ে খাদের খনন করেন না কেন আপনি খাঁজ দিয়ে শেষ করেন। এটা ঠিক যে আপনি যদি চামচ ব্যবহার করেন তবে আপনিও বয়স্ক।
কনজুগেটপায়ার

উত্তর:


25

কদাচিৎ যদি কখনও প্যারামেট্রিক পরীক্ষা এবং একটি প্যারামিমেট্রিক পরীক্ষার প্রকৃতপক্ষে একই নাল থাকে। প্রথম দুটি মুহুর্তের উপস্থিতি ধরে নিয়ে প্যারামিমেট্রিক টেষ্টটি বিতরণের মাধ্যমটি পরীক্ষা করছে। উইলকক্সন র‌্যাঙ্কের সমষ্টি পরীক্ষাটি কোনও মুহুর্ত ধরে না এবং পরিবর্তে বন্টনের সমতা পরীক্ষা করে। এর সূচিত প্যারামিটারটি বিতরণের একটি অদ্ভুত ক্রিয়ামূলক, একটি নমুনা থেকে পর্যবেক্ষণ অন্যটির পর্যবেক্ষণের চেয়ে কম হওয়ার সম্ভাবনা। আপনি অভিন্ন ডিস্ট্রিবিউশনের সম্পূর্ণ নির্দিষ্ট শূন্যের অধীনে দুটি পরীক্ষার মধ্যে তুলনা সম্পর্কে বাছাই করতে পারেন ... তবে আপনাকে চিনতে হবে যে দুটি পরীক্ষা বিভিন্ন অনুমানকে পরীক্ষা করছে।t

প্যারামেট্রিক পরীক্ষাগুলি তাদের অনুমানের সাথে যে তথ্য নিয়ে আসে তা পরীক্ষার শক্তি উন্নত করতে সহায়তা করে। অবশ্যই সেই তথ্যটি সঠিক হতে পারে তবে আজকের দিনে মানব জ্ঞানের কোনও ডোমেইন রয়েছে যেখানে প্রাথমিক তথ্যের অস্তিত্ব নেই। একটি আকর্ষণীয় ব্যতিক্রম যা স্পষ্টভাবে "আমি কিছু ধরে নিতে চাই না" বলে আদালতকক্ষ যেখানে নন-প্যারাম্যাট্রিক পদ্ধতিগুলি ব্যাপকভাবে জনপ্রিয় হতে থাকে - এবং এটি অ্যাপ্লিকেশনটির জন্য সঠিক ধারণা দেয়। বোধহয়, একটি ভাল কারণ শ্লেষ উদ্দেশ্যে যে ফিলিপ গুড উভয় উপর ভাল বই রচনা অ স্থিতিমাপ পরিসংখ্যান এবং আদালতের পরিসংখ্যান

এমন পরীক্ষার পরিস্থিতিও রয়েছে যেখানে ননপ্যারামেট্রিক পরীক্ষার জন্য আপনার প্রয়োজনীয় মাইক্রোডাটা অ্যাক্সেস নেই। ধরা যাক, একজনের চেয়ে অন্যের চেয়ে স্থূল কি না তা বিচার করার জন্য আপনাকে দুটি গ্রুপের তুলনা করতে বলা হয়েছিল। একটি আদর্শ বিশ্বে আপনার প্রত্যেকের জন্য উচ্চতা এবং ওজন পরিমাপ থাকবে এবং আপনি উচ্চতা অনুসারে স্তরবৃদ্ধি পরীক্ষা গঠন করতে পারেন। আদর্শের চেয়ে কম (যেমন, বাস্তব) বিশ্বে, আপনার প্রতিটি গ্রুপে কেবলমাত্র গড় উচ্চতা এবং গড় ওজন থাকতে পারে (বা নমুনার উপরে শীর্ষে এই বৈশিষ্ট্যের কিছু ব্যাপ্তি বা বৈচিত্র থাকতে পারে)। আপনার সেরা বাজিটি হ'ল প্রতিটি গ্রুপের গড় বিএমআই গণনা করা এবং যদি আপনার কাছে কেবল উপায় থাকে তবে তাদের তুলনা করুন; বা উচ্চতা এবং ওজনের জন্য দ্বিখণ্ডিত স্বাভাবিক হিসাবে ধরে নিন আপনার যদি উপায় এবং প্রকরণগুলি থাকে (আপনার নমুনাগুলি না এলে আপনাকে সম্ভবত কিছু বাহ্যিক ডেটা থেকে সম্পর্ক নিতে হবে),


3
আমি বুঝতে পারি যে পরীক্ষার ক্ষেত্রে আপনার একই নাল হবে না, যদিও আমি নিশ্চিত নই যে এটি কোনও নালকে অন্য শূন্যের চেয়ে ভাল কিনা তা বলার কোনও অর্থ হয় কিনা I'm তবে ভবিষ্যদ্বাণী করার ক্ষেত্রে কী হবে? সম্পূর্ণ ভিন্ন গল্প, এখনও প্যারামেট্রিক বনাম ননপ্যারমেট্রিকের দ্বিধা।
en1

22

অন্যরা যেমন লিখেছেন: পূর্ব শর্তগুলি মেটানো হয়, আপনার প্যারামেট্রিক পরীক্ষা ননপ্যারমেট্রিকের চেয়ে আরও শক্তিশালী হবে।

আপনার ঘড়ির সাদৃশ্যগুলিতে, অ-জল-প্রতিরোধী এটি ভিজে না যাওয়া পর্যন্ত অনেক বেশি নির্ভুল হবে। উদাহরণস্বরূপ, আপনার জল-প্রতিরোধী ঘড়িটি যে কোনও উপায়ে এক ঘন্টার মধ্যে বন্ধ হতে পারে, যেখানে অ-জল-প্রতিরোধী সঠিক হবে ... এবং আপনার রাফটিং ভ্রমণের পরে আপনাকে একটি বাস ধরতে হবে। এই জাতীয় পরিস্থিতিতে আপনার সাথে নন-জল-প্রতিরোধী ঘড়ি নেওয়া এবং এটি ভেজা না হওয়ার বিষয়টি নিশ্চিত করা বোধগম্য হতে পারে।


বোনাস পয়েন্ট: ননপ্যারমেট্রিক পদ্ধতি সর্বদা সহজ হয় না। হ্যাঁ, পরীক্ষার পরিবর্তে একটি ক্রমশক্তি পরীক্ষার বিকল্পটি সহজ। তবে একাধিক দ্বি-মুখী মিথস্ক্রিয়া এবং নেস্টেড এলোমেলো প্রভাবগুলির সাথে মিশ্র লিনিয়ার মডেলের একটি ননপ্যারমেট্রিক বিকল্প সাধারণ কলের চেয়ে সেটআপ করা বেশ কিছুটা শক্ত nlme()। আমি পেরিটেশন পরীক্ষা ব্যবহার করে এটি করেছি, এবং আমার অভিজ্ঞতায় প্যারামেট্রিক এবং ক্রমশক্তি পরীক্ষার p মানগুলি সর্বদা একসাথে খুব কাছাকাছি ছিল, এমনকি প্যারামেট্রিক মডেলের অবশিষ্টাংশগুলিও যদি খুব সাধারণ ছিল না। প্যারামেট্রিক পরীক্ষাগুলি প্রায়শই তাদের পূর্বশর্ত থেকে প্রস্থানগুলির বিরুদ্ধে আশ্চর্যজনকভাবে স্থিতিস্থাপক হয়।


এটি প্রচলিত মতামত বলে মনে হয় যে প্যারামেট্রিক পদ্ধতিগুলি যখন তাদের অনুমানগুলি মেটানো হয় তখন আরও শক্তিশালী হয়। তবে যদি এটি হয় তবে উভয় পন্থা থেকে ফলাফল মূল্যায়নের জন্য আমাদের কীভাবে পি-ভ্যালু থাকবে? আমি বলতে চাইলে যদি কোনও প্যারাম্যাট্রিক পরীক্ষা ন্যূন অনুমানটিকে কমপক্ষে 99% সম্ভাব্যতা দিয়ে প্রত্যাখ্যান করে, তবে ননপ্যারমেট্রিক টেস্ট থেকে 99% সম্ভাব্যতার সাথে নাল হাইপোথিসিসকে প্রত্যাখ্যান করা কীভাবে ভাল? প্রতি ক্ষেত্রে 0.99 এর সম্ভাবনা কি আলাদা? এটা বোঝা যাবে না।
en1

1
নাল অনুমানগুলি একটি প্যারামেট্রিক টেস্ট এবং এর ননপ্যারমেট্রিক সমকক্ষের মধ্যে পৃথক। বিশেষত, প্যারাম্যাট্রিক পরীক্ষার নাল অনুমানের মধ্যে পরীক্ষার পরিসংখ্যান বিতরণ সম্পর্কে একটি নির্দিষ্ট প্যারাম্যাট্রিক অনুমান থাকে (যা সাধারণত দুটি পরীক্ষার জন্যও বিভিন্ন উপায়ে গণনা করা হবে) - এ কারণেই একে "প্যারামেট্রিক" বলা হয়! সুতরাং দুটি পি মানগুলির একই নাম রয়েছে তবে বিভিন্ন পরীক্ষার পরিসংখ্যানের ভিত্তিতে গণনা করা হয়, যার বিভিন্ন নাল অনুমানের অধীনে বিভিন্ন বিতরণ রয়েছে।
এস। কোলাসা - মনোকিকা


3
@ স্টেফানকোলাসা, আমি আসলে আপনার উত্তরের জন্য একটি মন্তব্য লিখতে শুরু করেছি, এবং তাড়িয়ে চলে গেলাম :)
স্টাসক

12

যদিও আমি সম্মত হই যে অনেক ক্ষেত্রে, নন-প্যারাম্যাট্রিক কৌশলগুলি অনুকূল, এমন কিছু পরিস্থিতি রয়েছে যেখানে প্যারামেট্রিক পদ্ধতিগুলি আরও কার্যকর।

আসুন "দ্বি-নমুনা টি-পরীক্ষা বনাম উইলকক্সনের র‌্যাঙ্ক সমষ্টি পরীক্ষা" আলোচনার দিকে নজর দিন (অন্যথায় আমাদের পুরো বইটি লিখতে হবে)।

  1. ক্ষুদ্র গ্রুপের আকারের ২-৩, কেবল টি-টেস্টই তাত্ত্বিকভাবে 5% এর নীচে পি মান অর্জন করতে পারে। জীববিজ্ঞান এবং রসায়নে, এর মতো গ্রুপ মাপগুলি অস্বাভাবিক নয়। অবশ্যই এই ধরনের সেটিংয়ে টি-টেস্ট ব্যবহার করা সূক্ষ্ম। তবে এটি কোনও কিছুর চেয়ে ভাল। (এই বিষয়টি এই সমস্যার সাথে যুক্ত হয়েছে যে নিখুঁত পরিস্থিতিতে টি-টেস্টের উইলকক্সন পরীক্ষার চেয়ে বেশি ক্ষমতা থাকে)।
  2. বিশাল আকারের আকারের সাথে, একটি টি-টেস্টকে কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্যকে অ-প্যারাম্যাট্রিক হিসাবে ধন্যবাদ হিসাবে দেখা যেতে পারে।
  3. টি-টেস্টের ফলাফলগুলি গড় পার্থক্যের জন্য শিক্ষার্থীদের আস্থার ব্যবধানের সাথে সঙ্গতিপূর্ণ।
  4. গ্রুপগুলির মধ্যে যদি ভেরিয়েন্সগুলি তীব্রভাবে পরিবর্তিত হয়, তবে ওয়েলকের টি-টেস্টের সংস্করণ এটি বিবেচনায় নেওয়ার চেষ্টা করে, যখন উইলকক্সনের র‌্যাঙ্কের সমষ্টি পরীক্ষাটি যদি তুলনামূলকভাবে তুলনা করা হয় তবে খারাপভাবে ব্যর্থ হতে পারে (উদাহরণস্বরূপ, প্রথম ধরণের ত্রুটির সম্ভাবনা নামমাত্র স্তর থেকে অনেক আলাদা) )।

2
আমি ১ এর সাথে একমত নই Simp কেবল কোনও প্রক্রিয়া ব্যবহার করা কারণ এটি আপনাকে সিদ্ধান্ত নেওয়ার অনুমতি দেয় আসলেই কোনও ভাল কারণ নয়, বিশেষত যখন আপনার সেই প্রক্রিয়াটি বৈধ হওয়ার আশা করার কোনও কারণ নেই। আপনার যদি অল্প বা ডেটা না থাকে তবে কেবল একটি রায় দিন এবং এটি দৃor়তার ভিত্তিতে ভান করবেন না।
ডিএসএকস্টন

5
আমি আপনার সাথে একমত. এটি উচ্চ কারণের জার্নালে প্রকাশিত হলেও ফলাফলগুলি প্রায়শই পুনরুত্পাদনযোগ্য না হওয়ার কারণ এটি স্পষ্টভাবে একটি কারণ। বাজেট যদি কেবলমাত্র ক্ষুদ্র নমুনার আকার দেয় তবে গবেষক হিসাবে আপনার কাছে কী বিকল্প রয়েছে?
মাইকেল এম

1
৪ য় এবং গ্রুপগুলির মধ্যে অসম বৈকল্পিকগুলি যখন উইলকক্সন-মান-হুইটনি প্রয়োগ করার সমস্যাগুলি রয়েছে, সেখানে প্যারামেট্রিক নন-পদ্ধতি রয়েছে যা হিটারোসেসেস্টাস্টিটির অনুমতি দেয়: আমি ক্লিফের পরীক্ষা বা ব্রুনার-মুনজেল পরীক্ষাটি মনে করি, উদাহরণস্বরূপ। (আমি মনে করি না যে এই সাইটে তাদের সম্পর্কে আমাদের কাছে প্রচুর তথ্য আছে))
সিলভারফিশ

@ সিলভারফিশ: আমি প্রায়শই ব্রুনারের পদ্ধতি ব্যবহার করি এবং আমার মনে হয় আপনি ঠিক আছেন। তবে আমি সন্দেহ করি যে দৃ strong় বন্টনমূলক অনুমানগুলি তৈরি করার সময় তারা সত্যিকারের সাথে তুলনা করার অর্থ ex
মাইকেল এম

1
@ মিশেলএম হ্যাঁ অবশ্যই - এটি প্যারামেট্রিক এবং নন-প্যারামেট্রিক পদ্ধতির বিভিন্ন অনুমানযুক্ত পদ্ধতিগুলির প্রশ্নে ফিরে আসে, আমার ধারণা।
সিলভারফিশ

9

হাইপোথিসিস পরীক্ষায় ননপ্যারমেট্রিক পরীক্ষাগুলি প্রায়শই বিভিন্ন অনুমানকে পরীক্ষা করে থাকে, এটি একটি কারণ যা হ'ল প্যারাম্যাট্রিকের জন্য সর্বদা কেবল একটি ননপ্যারমেট্রিক পরীক্ষার বিকল্প দেওয়া যায় না।

আরও সাধারণভাবে, প্যারামেট্রিক পদ্ধতিগুলি অন্যথায় কাঠামোগত সমস্যার উপরে কাঠামো চাপিয়ে দেওয়ার এক উপায় সরবরাহ করে। এটি খুব কার্যকর এবং মডেলটি আক্ষরিকভাবে সত্য বলে বিশ্বাস না করে এক ধরণের সরলকরণমূলক হিউরিস্টিক হিসাবে দেখা যেতে পারে। উদাহরণস্বরূপ একটি ক্রমাগত প্রতিক্রিয়া পূর্বাভাসের সমস্যা নিন এর ভবিষ্যতবক্তা একটি ভেক্টর উপর ভিত্তি করে কিছু রিগ্রেশন ফাংশন ব্যবহার করে (এমনকি অভিমানী যে এই ধরনের একটি ফাংশন বিদ্যমান স্থিতিমাপ সীমাবদ্ধতা এক ধরনের)। যদি আমরা সম্পর্কে একেবারে কিছু না ধরে নিইx f f f ( x ) = p j = 1 β j x jyxffতবে এটি কীভাবে আমরা এই ফাংশনটি অনুমান করতে এগিয়ে যেতে পারি তা মোটেও পরিষ্কার নয়। আমাদের সন্ধানের সম্ভাব্য উত্তরের সেটটি খুব বড়। তবে যদি আমরা সম্ভাব্য উত্তরের স্থানটিকে (উদাহরণস্বরূপ) রৈখিক ফাংশনগুলির সেট তবে আমরা আসলে অগ্রগতি শুরু করতে পারি। আমাদের বিশ্বাস করার দরকার নেই যে মডেলটি ঠিকঠাক ধরে রেখেছে , যদিও আমরা কিছুটা উত্তর পেয়েছি , তবে অসম্পূর্ণ হওয়ার কারণে প্রায় একটি সংক্ষেপণ করছি।f(x)=j=1pβjxj


হ্যাঁ, এবং এটি একটি মডেল পক্ষপাতমূলক যোগ করে। গবেষকরা রিপোর্টিং-এর পি-ভ্যালু সম্পর্কে এটি কী বলে?
ক্যাগডাস ওজজেঙ্ক

@ ডিএসএক্সটন আপনি যা বলছেন তা বিভিন্ন অনুমান পরীক্ষা করার ক্ষেত্রে সত্য তবে লোকেরা এখনও তাদের একইভাবে ব্যাখ্যা করে। তারপরেও রিগ্রেশন রয়েছে, যেখানে ননপ্যারামেট্রিক এবং প্যারামেট্রিক বিশ্লেষণগুলির মধ্যে আপনি যে অন্তর্দৃষ্টিগুলি পেয়েছেন তা প্রায় একই রকম।
en1

@ ক্যাগডাস-ওজজেঙ্ক এটি আপনাকে বলে যে পি-মানগুলি মডেলটিতে শর্তাধীন। তবে বিষয়গুলি অন্যথায় কীভাবে হতে পারে তা স্পষ্ট নয় ...
কনজিগেটপায়ার

3
+1 লক্ষ করার জন্য যে আমাদের কাছে রিগ্রেশন ফাংশন সম্পর্কে কিছু অনুমান ছাড়াই কোনও রিগ্রেশনটিতে কোনও মূল্যমান অনুমান করার কোনও সম্ভাবনা নেই ।
কনজুগেটপায়ার

9

Semiparametric মডেলগুলির অনেক সুবিধা রয়েছে। তারা উইলকক্সন টেস্টের মতো পরীক্ষাগুলি একটি বিশেষ কেস হিসাবে প্রস্তাব দেয় তবে এফেক্ট রেশিও, কোয়ান্টাইলস, মানে এবং অতিরোধের সম্ভাবনার অনুমানের অনুমতি দেয়। তারা দ্রাঘিমাংশ এবং সেন্সর করা ডেটা প্রসারিত। এগুলি ওয়াই-স্পেসে শক্তিশালী এবং অনুমানের অর্থ ব্যতীত রূপান্তরকারী অবিশ্বাস্য। বিস্তারিত উদাহরণ / কেস স্টাডির জন্য কোর্স হ্যান্ডআউটে http://biostat.mc.vanderbilt.edu/rms লিঙ্কটি দেখুন ।

এর বিপরীতে সম্পূর্ণরূপে স্থিতিমাপ পদ্ধতি (থেকে -test সাধারণ একাধিক প্রত্যাবৃত্তি, মিশ্র প্রভাব মডেল, স্থিতিমাপ বেঁচে থাকার মডেল, ইত্যাদি), পূরণবাচক বা একটানা জন্য semiparametric পদ্ধতি বিতরণের সম্পর্কে অনুমান কিছুই একটি প্রদত্ত জন্য , এমনকি না যে বিতরণ একক বা মসৃণ হয়। বিতরণটির ভিতরে বা সীমানায় এমনকি মারাত্মক স্পাইক থাকতে পারে। Semiparametric মডেল দুটি ভিন্ন covariate সেটিংস এবং জন্য বিতরণের মধ্যে শুধুমাত্র একটি সংযোগ (উদাহরণস্বরূপ, একটি কক্স মডেল ক্ষেত্রে exponentiation) গ্রহণ করেY Y X X 1 X 2tYYXX1X2। উদাহরণগুলির মধ্যে আনুপাতিক বৈষম্য মডেল (বিশেষ কেস: উইলকক্সন এবং কুষকল-ওয়ালিস) এবং আনুপাতিক বিপদের মডেল (বিশেষ কেস: লগ-র‌্যাঙ্ক এবং স্তরযুক্ত লগ-র‌্যাঙ্ক পরীক্ষা) অন্তর্ভুক্ত।

কার্যত, সেমিপারামেট্রিক মডেলগুলিতে প্রচুর পরিমাণে বাধা রয়েছে। এই ইন্টারসেপ্টগুলি ননপ্যারমেট্রিকভাবে বিতরণকে এনকোড করে । এটি অবশ্য ওভারপ্যারামিটারাইজেশন নিয়ে কোনও সমস্যা তৈরি করে না।Y


1
আমি এই কিছুটা নিয়ে লড়াই করে যাচ্ছি। আপনি কি টি-টেস্টকে আধা-প্যারামেট্রিক বা নন-প্যারামেট্রিক হিসাবে বিবেচনা করেন? একদিকে, আমি সর্বদা অর্ধ-প্যারাম্যাট্রিকগুলির 'জিসস্ট' ধরে নিলাম: অনিশ্চয়তার জন্য অ্যাকাউন্ট (সুতরাং গাউসির স্কোর সমীকরণগুলির সমাধানের জন্য স্যান্ডউইচ ভিত্তিক ত্রুটিগুলি একটি আধা-প্যারামেট্রিক টি-পরীক্ষা হবে)। যাইহোক, আধা-প্যারাম্যাট্রিকগুলি প্রায় সর্বদা অংশীকরণ / কন্ডিশনিংয়ের বাইরে কিছু জড়িত থাকে যেমন কক্স মডেলগুলির মতো।
অ্যাডমো

আমি এটি মোকাবেলায় আমার উত্তরে আরও বিবরণ যুক্ত করব।
ফ্র্যাঙ্ক হ্যারেল

6

সরবরাহ করা উত্তরগুলির মধ্যে, আমি বায়েশিয়ার পরিসংখ্যানগুলিতেও মনোযোগ দেব। কিছু সমস্যার একাকী সম্ভাবনা দিয়ে উত্তর দেওয়া যায় না। একজন ফ্রিকোয়েনসিস্ট পাল্টা বাস্তব যুক্তি ব্যবহার করে যেখানে "সম্ভাব্যতা" বিকল্প মহাবিশ্বকে বোঝায় এবং একটি বিকল্প মহাবিশ্বের কাঠামো কোনও ব্যক্তির অবস্থার অনুমান করার মতো কোনও ধারণা বোধ করে না, যেমন কোনও অপরাধীর দোষ বা নির্দোষতা, বা জিনের ফ্রিকোয়েন্সিকে বাধা দেয় কিনা। প্রজাতিগুলি একটি বিশাল পরিবেশগত পালাবদলের সংস্পর্শে এসেছিল এবং এর বিলুপ্তির দিকে পরিচালিত করে। বায়েশীয় প্রসঙ্গে, সম্ভাবনা হ'ল "বিশ্বাস" ফ্রিকোয়েন্সি নয়, যা ইতিমধ্যে বৃষ্টিপাতের ক্ষেত্রে প্রয়োগ করা যেতে পারে।

এখন, বেশিরভাগ বায়েশিয়ান পদ্ধতির পূর্ব এবং ফলাফলের জন্য সম্ভাব্যতার মডেলগুলি সম্পূর্ণরূপে নির্দিষ্ট করে প্রয়োজন। এবং, এই সম্ভাবনার মডেলগুলির বেশিরভাগই প্যারামিট্রিক। অন্যেরা যা বলছে তার সাথে সামঞ্জস্য রেখে, তথ্যের অর্থবহ সংক্ষিপ্তসারগুলি তৈরি করার জন্য এগুলি ঠিক সঠিক হওয়া উচিত নয়। "সমস্ত মডেল ভুল, কিছু মডেল দরকারী" "

অবশ্যই ননপ্যারমেট্রিক বায়েশিয়ান পদ্ধতি রয়েছে। এগুলিতে প্রচুর পরিসংখ্যানগত কুঁচকে থাকে এবং সাধারণভাবে বলতে গেলে প্রায় বিস্তৃত জনসংখ্যার ডেটা অর্থপূর্ণভাবে ব্যবহার করা প্রয়োজন।


6

উপরের সমস্ত সূক্ষ্ম উত্তর সত্ত্বেও আমি যে উত্তর দিচ্ছি তার একমাত্র কারণ হ'ল আমরা প্যারামিট্রিক পরীক্ষা (কমপক্ষে কণা পদার্থবিজ্ঞানের ডেটা বিশ্লেষণে) ব্যবহার করার জন্য # 1 কারণে কেউ মনোযোগ দেয়নি। কারণ আমরা ডেটা প্যারামিট্রাইজেশন জানি। Duh! এটি এত বড় সুবিধা। আপনি আপনার কয়েকশ প্যারামিটার যা আপনার যত্ন এবং আপনার বিতরণ বর্ণনা করে তাতে আপনার শত, কয়েক হাজার বা মিলিয়ন ডেটা পয়েন্ট সিদ্ধ করছে। এগুলি আপনাকে অন্তর্নিহিত পদার্থবিজ্ঞানগুলি (বা যা বিজ্ঞান আপনাকে ডেটা দেয়) বলে দেয়।

অবশ্যই, যদি আপনার অন্তর্নিহিত সম্ভাবনার ঘনত্ব সম্পর্কে কোনও ধারণা না থাকে তবে আপনার কোনও বিকল্প নেই: নন-প্যারামেট্রিক টেস্ট ব্যবহার করুন। নন-প্যারাম্যাট্রিক পরীক্ষায় কোনও প্রাক-ধারণাযুক্ত পক্ষপাত না থাকার গুণ রয়েছে, তবে এটি প্রয়োগ করা আরও কঠিন হতে পারে - কখনও কখনও আরও শক্ত।


5

ননপ্যারমেট্রিকের নিজস্ব সমস্যা আছে! এর মধ্যে একটি হ'ল হাইপোথিসিস টেস্টিংয়ের উপর জোর দেওয়া, প্রায়শই আমাদের অনুমান এবং আত্মবিশ্বাসের অন্তর অন্তর প্রয়োজন এবং ননপ্যারমেট্রিক্স সহ জটিল মডেলগুলিতে সেগুলি পাওয়া জটিল complicated এ সম্পর্কে একটি খুব ভাল ব্লগ পোস্ট রয়েছে, আলোচনার সাথে, http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ এ আলোচনার এই অন্যান্য পোস্টের দিকে নিয়ে যায়, http: // notstatschat। tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-test , যা উইলকক্সনের উপর খুব আলাদা দৃষ্টিভঙ্গির জন্য প্রস্তাবিত । সংক্ষিপ্ত সংস্করণটি হ'ল: উইলকক্সন (এবং অন্যান্য র‌্যাঙ্ক পরীক্ষা) অনিয়ন্ত্রিত হতে পারে to


4
আমি নিশ্চিত নই যে ট্রানজিটিভিটি হ'ল সর্বাত্মক এবং সর্বাত্মক। এবং আপনি খুব দৃust় এবং দরকারী অবস্থান নির্ণায়ক আত্মবিশ্বাসের বিরতি পেতে উইলকক্সন পরীক্ষাটি উল্টাতে পারেন।
ফ্র্যাঙ্ক হ্যারেল

2
কার্যকারণীয় মডেলিংয়ে অযৌক্তিকতার পয়েন্ট রয়েছে, তবে সমিতির সাধারণ দুটি নমুনা পরীক্ষার জন্য, আমি মনে করি এটি সত্যিই একটি সমস্যা নয়। এছাড়াও, আমি ননপ্যারামেট্রিক এবং প্যারামেট্রিক পদ্ধতিগুলির মধ্যে অনুমানের পরীক্ষা / অনুমান / আত্মবিশ্বাসের ব্যবধানগুলির পার্থক্যগুলি দেখতে ব্যর্থ হয়েছি। কখনও কখনও, দৃ esti় অনুমানের সাথে, আপনি একটি কার্যক্ষম সম্ভাবনার মডেল ব্যবহার করেন যাতে সংশ্লিষ্ট প্যারামিট্রিক অনুমানটি ডেটার অর্থপূর্ণ সংক্ষিপ্তসার সরবরাহ করে (যদিও এটি প্রতি সেমে সঠিক সম্ভাবনার মডেল না হয়)। সম্ভবত আপনি এই উত্তর প্রসারিত করতে পারেন?
অ্যাডমো

2
সাধারণত উইলকক্সন পরীক্ষার জন্য কিছু অতিরিক্ত অনুমান করা হয়, যেমন একটি গ্রুপের উপর অন্য গ্রুপের স্টোকাস্টিক আধিপত্য, যদি সত্যিকার অর্থে ট্রান্সজিটিভিটি পুনরুদ্ধার হয়।
স্কোর্টচি - মনিকা পুনরায় ইনস্টল করুন

3

আমি বলব যে প্যারাম্যাট্রিকের পরিসংখ্যানগুলি প্যারামেট্রিক পরিসংখ্যানের তুলনায় কম অনুমান করা যায় সে অর্থে সাধারণত প্রযোজ্য।

তবুও, যদি কেউ একটি প্যারাম্যাট্রিক পরিসংখ্যান ব্যবহার করে এবং অন্তর্নিহিত অনুমানগুলি পূরণ হয় তবে প্যারাম্যাট্রিক পরিসংখ্যানগুলি প্যারাম্যাট্রিক ছাড়াই আরও শক্তিশালী হবে।


2

প্যারামেট্রিক পরিসংখ্যান প্রায়শই বাহ্যিক [ডেটাতে] জ্ঞানকে অন্তর্ভুক্ত করার উপায়। উদাহরণস্বরূপ, আপনি জানেন যে ত্রুটি বিতরণ স্বাভাবিক, এবং এই জ্ঞানটি পূর্ব অভিজ্ঞতা বা অন্য কোনও বিবেচনা থেকে এসেছিল এবং ডেটা সেট থেকে নয়। এই ক্ষেত্রে, সাধারণ বিতরণ ধরে ধরে আপনি এই বাহ্যিক জ্ঞানটিকে আপনার প্যারামিটারের অনুমানের সাথে সংযুক্ত করছেন, যা আপনার অনুমানকে অবশ্যই উন্নত করবে।

আপনার ঘড়ির সাদৃশ্য। এই দিনগুলিতে প্রায় সমস্ত ঘড়ি জলের প্রতিরোধী যা গয়না বা কাঠের মতো অস্বাভাবিক উপকরণযুক্ত বিশেষ টুকরা ছাড়া। এগুলি পরার কারণ হ'ল: তারা বিশেষ। যদি আপনি ওয়াটার প্রুফ বোঝাতে থাকেন তবে অনেক পোষাক ঘড়ি জল প্রমাণ নয়। এগুলি পরার কারণটি আবার তাদের ফাংশন: আপনি স্যুট এবং টাই সহ ডাইভার ওয়াচটি পরবেন না। এছাড়াও, এই দিনগুলিতে অনেকগুলি ঘড়ি ফিরে এসেছে যাতে আপনি স্ফটিকের মধ্য দিয়ে চলাচলটি উপভোগ করতে পারেন। স্বাভাবিকভাবেই, এই ঘড়িগুলি সাধারণত জলের প্রমাণ হয় না।


1
আমি এই রূপকটি পছন্দ করি! আমার মনে আছে একজন অধ্যাপক আমাদের বলেছিলেন যে আমরা একই ফল পেতে পারি কিনা তা দেখার জন্য আমাদের একই জিনিসটিতে বিভিন্ন পরিসংখ্যানগত পদ্ধতি চেষ্টা করা উচিত।
গভীর উত্তর

2

এটি হাইপোটিসিস পরীক্ষার দৃশ্য নয়, তবে এটি আপনার প্রশ্নের উত্তর দেওয়ার জন্য একটি ভাল উদাহরণ হতে পারে: আসুন ক্লাস্টারিং বিশ্লেষণ বিবেচনা করুন। হায়ারারিকাল ক্লাস্টারিং, কে-মানে ইত্যাদির মতো অনেকগুলি "নন-প্যারামেট্রিক" ক্লাস্টারিং পদ্ধতি রয়েছে তবে সমস্যাটি সর্বদা এটি সমাধান করা যায় যে আপনার ক্লাস্টারিং সমাধানটি আরও সম্ভাব্য সমাধানের চেয়ে "আরও ভাল" কিনা এবং (এবং প্রায়শই একাধিক সম্ভাব্য সমাধান রয়েছে) । প্রতিটি অ্যালগরিদম আপনাকে এটি সর্বোত্তমভাবে দিতে পারে, তবে আরও ভাল কিছু না থাকলে আপনি কীভাবে জানবেন ..? ক্লাস্টারিংয়ের জন্য এখন প্যারামেট্রিক পদ্ধতিও রয়েছে, তথাকথিত মডেল-ভিত্তিক ক্লাস্টারিংযেমন সীমাবদ্ধ মিশ্রণ মডেলগুলি। এফএমএম দিয়ে আপনি আপনার পরিসংখ্যানের মডেল তৈরি করেন যা আপনার ডেটা বিতরণের বর্ণনা দেয় এবং এটিকে ডেটাতে ফিট করে। আপনার কাছে যখন আপনার মডেল রয়েছে, আপনি মূল্যায়ন করতে পারবেন যে আপনার ডেটা এই মডেলটিকে দেওয়া কতটা সম্ভব, আপনি সম্ভাবনা অনুপাতের পরীক্ষাগুলি ব্যবহার করতে পারেন, এআইসির তুলনা করতে পারেন, এবং মডেল ফিট এবং মডেল তুলনা পরীক্ষা করার জন্য একাধিক অন্যান্য পদ্ধতি ব্যবহার করতে পারেন। নন-প্যারাম্যাট্রিক ক্লাস্টারিং অ্যালগরিদমগুলি কিছু মিলের মানদণ্ড ব্যবহার করে কেবলমাত্র ডেটা গোষ্ঠী করে, এফএমএম ব্যবহার করার সাথে সাথে আপনাকে আপনার ডেটা বর্ণনা এবং বুঝতে চেষ্টা করে, এটি কতটা ঠিক ফিট হয় তা পরীক্ষা করে, ভবিষ্যদ্বাণী করতে পারে ... অনুশীলনে নন-প্যারাম্যাট্রিক পদ্ধতিগুলি সহজ, কাজ বক্সের বাইরে থাকা এবং বেশ ভাল, এফএমএম সমস্যাযুক্ত হতে পারে তবে তবুও, মডেল-ভিত্তিক পদ্ধতিগুলি আপনাকে প্রায়শই সমৃদ্ধ আউটপুট সরবরাহ করে।


2

অনুমান এবং নতুন ডেটাতে পূর্বাভাস নন-প্যারাম্যাট্রিক মডেলগুলির জন্য প্রায়শই খুব কঠিন বা অসম্ভব। উদাহরণস্বরূপ, আমি ওয়েবুল বা লগনারমাল বেঁচে থাকার মডেলটি ব্যবহার করে পরবর্তী 10 বছরের জন্য ওয়্যারেন্টি দাবিগুলির পূর্বাভাস দিতে পারি, তবে কক্স মডেল বা কাপলান-মেয়ের ব্যবহার এটি সম্ভব নয়।

সম্পাদনা: আমাকে আরও কিছুটা পরিষ্কার হতে দিন। যদি কোনও সংস্থার ত্রুটিযুক্ত পণ্য থাকে তবে তারা প্রায়শই বর্তমান ওয়ারেন্টি দাবি এবং বিক্রয় ডেটার ভিত্তিতে ভবিষ্যতের ওয়ারেন্টি দাবি রেট এবং সিডিএফ প্রজেক্ট করতে আগ্রহী হয়। এটি তাদের পুনর্বিবেচনা প্রয়োজন কিনা তা সিদ্ধান্ত নিতে সহায়তা করতে পারে। আমি জানি না আপনি কীভাবে পেনামাইট্রিক নন মডেলটি ব্যবহার করে এটি করেন।


7
আমি আলাদা করতে অনুরোধ। কোয়ান্টাইলগুলি অনুমান করার জন্য আপনি একটি কক্স মডেল ব্যবহার করতে পারেন, অর্থ (যদি সর্বোচ্চ ওয়াই মানটি সেন্সর করা হয়) এবং সমস্ত ধরণের সম্ভাবনা। তথ্যের পরিসীমা অতিক্রম করার আগে ভবিষ্যদ্বাণী করতে সক্ষম না হওয়াই যদিও সমস্যা (যেমন আপনি উল্লেখ করেছেন) তবে আপনি বিপজ্জনকভাবে বহির্মুখী হতে পারেন।
ফ্রাঙ্ক হ্যারেল

@ ফ্র্যাঙ্কহারেল হ্যাঁ ভাল পয়েন্ট, এক্সট্রাপোলেট করার সময় সর্বদা সতর্ক থাকতে হবে।
গ্লেন

র‌্যান্ডম ফরেস্ট, ডিপ লার্নিং, বা এসভিএম সম্পর্কে কী? পূর্বাভাসের জন্য সমস্ত প্যারামেট্রিক পদ্ধতি না থাকলে তারা সবচেয়ে মারধর করে।
en1

2
চেষ্টা করুন এবং সিদ্ধান্তের গাছটিকে বাদ দিয়ে একটি তির্যক সীমানা শিখুন
বিল_ই

1

আমি সত্যই বিশ্বাস করি যে এই প্রশ্নের সঠিক উত্তর নেই। প্রদত্ত উত্তরগুলি বিচার করে, sensক্যমত্যটি হল যে প্যারামেট্রিক পরীক্ষাগুলি ননপ্যারামেট্রিক সমতুল্যের চেয়ে বেশি শক্তিশালী। আমি এই দৃষ্টিতে প্রতিদ্বন্দ্বিতা করব না তবে আমি এটি সত্যবাদী দৃষ্টিভঙ্গির চেয়ে অনুমানমূলক হিসাবে বেশি দেখছি কারণ এটি স্কুলে স্পষ্টভাবে কিছু শেখানো হয় না এবং কোনও পিয়ার পর্যালোচক আপনাকে কখনই বলতে পারবেন না "আপনার কাগজটি প্রত্যাখ্যান করা হয়েছিল কারণ আপনি নন-প্যারাম্যাট্রিক পরীক্ষা ব্যবহার করেছিলেন"। এই প্রশ্নটি এমন কিছু সম্পর্কে যা পরিসংখ্যানের জগতটি স্পষ্টভাবে উত্তর দিতে অক্ষম তবে মর্যাদার জন্য নিয়েছে।

আমার ব্যক্তিগত মতামতটি হল যে প্যারামেট্রিক বা ননপ্যারামেট্রিক উভয়েরই পছন্দটির সাথে anythingতিহ্যের সাথে অন্য যে কোনও কিছু নয় (আরও ভাল শর্তের অভাবে) with পরীক্ষার এবং পূর্বাভাসের জন্য প্যারাম্যাট্রিক কৌশলগুলি প্রথমে ছিল এবং এর দীর্ঘ ইতিহাস রয়েছে, সুতরাং এগুলি সম্পূর্ণ উপেক্ষা করা সহজ নয়। বিশেষত পূর্বাভাসের কিছু চিত্তাকর্ষক ননপ্রেমেট্রিক সমাধান রয়েছে যা আজকাল প্রথম পছন্দ সরঞ্জাম হিসাবে বহুল ব্যবহৃত। আমি মনে করি যে এটি একটি কারণ যা মেশিন লার্নিং কৌশলগুলি যেমন নিউরাল নেটওয়ার্ক এবং সিদ্ধান্ত গাছগুলি, যা প্রকৃতির দ্বারা অপরিকল্পিত, সাম্প্রতিক বছরগুলিতে ব্যাপক জনপ্রিয়তা অর্জন করেছে।


3
"conকমত্যটি হ'ল প্যারাম্যাট্রিক টেস্টগুলি ননপ্যারমেট্রিকের চেয়ে বেশি শক্তিশালী": প্যারামমিত্রিক পরীক্ষার অনুমানগুলি সঠিক হলে নন-প্যারাম্যাট্রিক পরীক্ষাগুলি কম থাকে , মূলত যেহেতু এই অনুমানগুলি মানে প্যারামেট্রিক পরীক্ষাগুলির একটি হেডস্টার্ট থাকে (সত্য বিতরণ সম্পর্কে অতিরিক্ত তথ্য) । তবে বিশেষত বড় নমুনায় বিদ্যুতের ক্ষয় হ্রাস হতে পারে : স্বাভাবিকতা ধরে রাখলে বড় নমুনায় টি-টেস্টের মতো উইলকক্সন 3/3 samples দক্ষ efficient যদি অনুমানগুলি পূরণ না করা হয় তবে প্যারামিমেট্রিক নন পরীক্ষা আরও শক্তিশালী হতে পারে! 3/π95%
সিলভারফিশ

'Sensকমত্য' অর্থ 'সাধারণ চুক্তি', আমার ব্যক্তিগত দৃষ্টিভঙ্গি নয়।
ডিজিও

2
আমি বিবৃতিটি আপনার নিজের ব্যক্তিগত দৃষ্টিভঙ্গি বা অন্যের সম্মিলিত জ্ঞানের প্রতিনিধিত্ব করে কিনা তা উল্লেখ করছিলাম না, কেবলমাত্র পয়েন্টটি দেখিয়েছিলাম যে প্যারামিট্রিক পরীক্ষার জন্য প্রয়োজনীয় শর্তগুলি সত্য হলে সত্যই বয়ানটি সঠিক । যখন শর্তগুলি ধরে না রাখে, "আর প্যারামেট্রিক টেস্টগুলি ননপ্যারামেট্রিকের চেয়ে বেশি শক্তিশালী" হতে পারে এবং বাস্তবে বিপরীতটি এটি হতে পারে (কখনও কখনও খুব বিস্তৃত ব্যবধানে)।
সিলভারফিশ

Touche! ..... +1
ডিজিও

0

এটি পরিসংখ্যানগত শক্তির একটি ইস্যু। নন-প্যারাম্যাট্রিক পরীক্ষাগুলিতে সাধারণত তাদের প্যারাম্যাট্রিক অংশগুলির তুলনায় পরিসংখ্যানগত শক্তি কম থাকে।


6
প্যারামেট্রিক পরীক্ষাগুলিতে যখন তাদের অনুমানগুলি মেটানো হয় তখন আরও শক্তি থাকবে। যখন তাদের অনুমানগুলি মেটানো হয় না, প্যারামিমেট্রিক নন পরীক্ষা আরও শক্তিশালী হতে পারে।
গুং - মনিকা পুনরায়

3
এই উত্তরটি খুব সংক্ষিপ্ত, এবং পূর্ববর্তী উত্তরে শক্তি আলোচনা করা হয়েছে। আপনি এটি কিছুটা প্রসারিত বিবেচনা করবেন?
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

4
প্যারামেট্রিক পরীক্ষাগুলি থেকে পাওয়ার লাভ হ্রাস করা হয় যখন তাদের অনুমানগুলি মেটানো হয় না তখন তারা যে ক্ষয়ক্ষতি হয় তার সাথে তুলনা করে।
ফ্র্যাঙ্ক হ্যারেল

ফ্র্যাঙ্ক, এটি পরীক্ষার উপর নির্ভর করে, কিছু পরীক্ষা তাদের অনুমানের লঙ্ঘনের জন্য আরও দৃust় হয়।
লুকানো মার্কভ মডেল

0

ইতিমধ্যে প্রচুর ভাল উত্তর কিন্তু এমন কিছু কারণ রয়েছে যা আমি উল্লেখ করে দেখিনি:

  1. পরিচিতি। আপনার শ্রোতাদের উপর নির্ভর করে, প্যারামিটারিক ফলাফল মোটামুটি সমতুল্য নন-প্যারাম্যাট্রিকের চেয়ে অনেক বেশি পরিচিত হতে পারে। যদি দু'জন একই সিদ্ধান্তে থাকে তবে পরিচিতি ভাল good

  2. সরলতা। কখনও কখনও, প্যারামেট্রিক পরীক্ষা সম্পাদন করা এবং রিপোর্ট করা সহজ। কিছু ননপ্যারমেট্রিক পদ্ধতি খুব কম্পিউটার নিবিড়। অবশ্যই কম্পিউটারগুলি অনেক দ্রুত গতি অর্জন করেছে এবং অ্যালগরিদমের পাশাপাশি উন্নতি হয়েছে, তবে .... তথ্য "আরও বড়" হয়েছে।

    1. কখনও কখনও প্যারামিট্রিক পরীক্ষায় সাধারণত অসুবিধাগুলি হ'ল আসলে একটি সুবিধা, যদিও এটি পরীক্ষাগুলির নির্দিষ্ট জোড়াগুলির জন্য নির্দিষ্ট। উদাহরণস্বরূপ, আমি সাধারণত, কোয়ান্টাইল রিগ্রেশনের ভক্ত কারণ এটি সাধারণ পদ্ধতির চেয়ে কম অনুমান করে। তবে মাঝেমধ্যে আপনি কখনও কখনও গড়ের চেয়ে সত্যিকারের গড়টি অনুমান করতে পারেন।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.