আপনি যদি সম্প্রদায়ের বুলেটিনগুলি ইদানীং পড়ছেন, আপনি সম্ভবত হান্টিং অফ দ্য স্নার্ক দেখতে পেয়েছেন, স্ট্যাকএক্সচেঞ্জ নেটওয়ার্কের প্রধান নির্বাহী জোয়েল স্পলস্কির অফিশিয়াল স্ট্যাক এক্সচেঞ্জ ব্লগে একটি পোস্ট । তিনি বাইরের ব্যবহারকারীর দৃষ্টিকোণ থেকে তাদের "বন্ধুত্ব" মূল্যায়নের জন্য এসই মন্তব্যের একটি নমুনায় পরিচালিত একটি পরিসংখ্যান বিশ্লেষণ আলোচনা করেন। মন্তব্যগুলি এলোমেলোভাবে স্ট্যাকওভারফ্লো থেকে নমুনাযুক্ত ছিল এবং সামগ্রী বিশ্লেষকরা অ্যামাজনের মেকানিকাল তুর্কি সম্প্রদায়ের সদস্য ছিলেন, এমন একটি বাজার যা কাজের জন্য সংস্থাগুলি সংস্থাগুলিকে সংযুক্ত করে যারা সাশ্রয়ী মূল্যের জন্য ছোট, সংক্ষিপ্ত কাজগুলি করে workers
এত দিন আগে, আমি রাষ্ট্রবিজ্ঞানে স্নাতক ছাত্র ছিলাম এবং যে ক্লাস নিয়েছিলাম তার মধ্যে একটি ছিল পরিসংখ্যান বিষয়বস্তু বিশ্লেষণ । ক্লাসের চূড়ান্ত প্রকল্পটি, এর সম্পূর্ণ উদ্দেশ্য ছিল নিউ ইয়র্ক টাইমসের যুদ্ধের প্রতিবেদনের বিশদ বিশ্লেষণ করা, যুদ্ধের সময় আমেরিকানরা নিউজ কভারেজ সম্পর্কে অনেক অনুমান যে সঠিক ছিল তা সঠিকভাবে পরীক্ষা করা (বিলোপকারী: প্রমাণ থেকে বোঝা যায় যে তারা না). প্রকল্পটি বিশাল এবং বেশ মজাদার ছিল তবে এখন পর্যন্ত এর সবচেয়ে বেদনাদায়ক অংশটি ছিল 'প্রশিক্ষণ ও নির্ভরযোগ্যতা পরীক্ষার পর্ব', যা আমাদের সম্পূর্ণ বিশ্লেষণের আগেই ঘটেছিল। এর দুটি উদ্দেশ্য ছিল (বিশদ বিবরণের জন্য লিঙ্কযুক্ত কাগজের পৃষ্ঠা 9 দেখুন, পাশাপাশি বিষয়বস্তু বিশ্লেষণের পরিসংখ্যানের সাহিত্যে ইন্টারকোডার নির্ভরযোগ্যতার মানগুলির উল্লেখ):
সমস্ত কোডার, অর্থাৎ সামগ্রীর পাঠকদের নিশ্চিত করুন, একই গুণগত সংজ্ঞায় প্রশিক্ষণ দেওয়া হয়েছিল। জোয়েলের বিশ্লেষণে এর অর্থ এই প্রকল্পটি কীভাবে "বন্ধুত্বপূর্ণ" এবং "বন্ধুত্বপূর্ণ" সংজ্ঞায়িত হয়েছিল তা প্রত্যেকেই ঠিক বুঝতে পারবে।
সমস্ত কোডারকে এই নিয়মগুলি নির্ভরযোগ্যতার সাথে ব্যাখ্যা করার বিষয়টি নিশ্চিত করুন, অর্থাত আমরা আমাদের নমুনা নমুনা দিয়েছি, উপসেটটি বিশ্লেষণ করেছি এবং তার পরে পরিসংখ্যানগতভাবে গুণগত মূল্যায়নের ক্ষেত্রে আমাদের যুগল পারস্পরিক সম্পর্কগুলি বেশ মিল ছিল।
নির্ভরযোগ্যতা পরীক্ষার ক্ষতি হয়েছে কারণ আমাদের এটি তিন বা চারবার করতে হয়েছিল। -1- অবধি লক করা এবং -2- পর্যন্ত যথেষ্ট পরিমাণে জুটিযুক্ত পারস্পরিক সম্পর্ক দেখা গেছে, সম্পূর্ণ বিশ্লেষণের জন্য আমাদের ফলাফল সন্দেহজনক were এগুলি বৈধ বা অবৈধ প্রদর্শিত হতে পারে। সবচেয়ে বড় কথা, চূড়ান্ত নমুনা সেট তৈরির আগে আমাদের নির্ভরযোগ্যতার পাইলট পরীক্ষা করতে হয়েছিল।
আমার প্রশ্নটি হ'ল: জোয়েলের পরিসংখ্যানগত বিশ্লেষণে একটি পাইলট নির্ভরযোগ্যতা পরীক্ষার ঘাটতি নেই এবং "বন্ধুত্ব" এর কোনও অপারেশনাল সংজ্ঞা স্থাপন করেনি। চূড়ান্ত ডেটা কি তার ফলাফলের পরিসংখ্যানের বৈধতা সম্পর্কে কিছু বলতে যথেষ্ট নির্ভরযোগ্য ছিল?
এক দৃষ্টিকোণের জন্য, আন্তঃ কোডার নির্ভরযোগ্যতা এবং ধারাবাহিক অপারেশনাল সংজ্ঞাগুলির মান সম্পর্কে এই প্রাইমারটি বিবেচনা করুন । একই উত্সের গভীর থেকে আপনি পাইলট নির্ভরযোগ্যতা পরীক্ষা (তালিকার আইটেম 5) সম্পর্কে পড়তে পারেন ।
তার উত্তরে প্রতি অ্যান্ডি ডব্লু। এর পরামর্শ, আমি ডেটাসেটের বিভিন্ন নির্ভরযোগ্যতার পরিসংখ্যান গণনা করার চেষ্টা করছি, যা এখানে পাওয়া যায়, আর- তে এই কমান্ড সিরিজটি ব্যবহার করে (আমি নতুন পরিসংখ্যান গণনা করার সাথে সাথে আপডেট করেছি)।
শতকরা চুক্তি (সহনশীলতার সাথে = 0): 0.0143
শতাংশ চুক্তি (সহনশীলতার সাথে = 1): 11.8
ক্রিপেনডরফের আলফা: 0.1529467
আমি অন্য প্রশ্নে এই ডেটার জন্য একটি আইটেম-প্রতিক্রিয়া মডেল চেষ্টা করেছি ।