সম্প্রতি আমি আপভোটগুলিতে সুনামের প্রভাবগুলির কিছু বিশ্লেষণ করেছি ( ব্লগ-পোস্ট দেখুন ) এবং পরবর্তীকালে আমার সম্ভবত আরও আলোকিতকরণ (বা আরও উপযুক্ত) বিশ্লেষণ এবং গ্রাফিক্স সম্পর্কে কয়েকটি প্রশ্ন ছিল।
সুতরাং কয়েকটি প্রশ্ন (এবং বিশেষত কারও কাছে সাড়া দিতে নির্দ্বিধায় এবং অন্যকে উপেক্ষা করুন):
অবতারের বর্তমানটিতে, আমি পোস্ট নম্বরটি কেন্দ্র করে বোঝাতে চাইছি না। আমি মনে করি এটি যা করে তা স্ক্র্যাপপ্লোটে নেতিবাচক সম্পর্কের মিথ্যা চেহারা দেয়, কারণ পোস্টের গণনার নীচের প্রান্তে আরও পোস্ট রয়েছে (আপনি দেখেন যে জোন স্কিট প্যানেলে এটি ঘটে না, কেবল নশ্বর ব্যবহারকারীদের মধ্যে প্যানেল)। পোস্ট নম্বরটি কেন্দ্রীভূত না করা (যেহেতু আমি ব্যবহারকারীর গড় স্কোরকে কেন্দ্র করে স্কোর কেন্দ্রিক) তার অর্থ কি অপ্রয়োজনীয়?
এটি গ্রাফগুলি থেকে স্পষ্ট হওয়া উচিত যে স্কোরটি খুব সঠিক স্কিউড (এবং কেন্দ্রীকরণের অর্থ এটি কোনও পরিবর্তন হয়নি)। কোনও রিগ্রেশন লাইনের সাথে ফিট করার সময় আমি হুবার-হোয়াইট স্যান্ডউইচ ত্রুটিগুলি ব্যবহার করে লিনিয়ার মডেল এবং একটি মডেল উভয়ই ফিট করি (
rlmMASS আর প্যাকেজের মাধ্যমে ) এবং এটি opeালের অনুমানগুলিতে কোনও পার্থক্য করে না। আমার কি শক্তিশালী রিগ্রেশন পরিবর্তে ডেটাতে রূপান্তর বিবেচনা করা উচিত? নোট করুন যে কোনও রূপান্তরকে 0 এবং নেতিবাচক স্কোরগুলির সম্ভাবনা বিবেচনা করতে হবে। বা ওএলএসের পরিবর্তে আমার কি অন্য কোনও ধরণের মডেল ব্যবহার করা উচিত?আমি বিশ্বাস করি সর্বশেষে দুটি গ্রাফিক্স উন্নত হতে পারে (এবং পাশাপাশি উন্নত মডেলিং কৌশলগুলির সাথে সম্পর্কিত)। আমার (জ্যাকেড) মতামতে, আমি সন্দেহ করব যে খ্যাতির প্রভাবগুলি বাস্তব কিনা সেগুলি পোস্টারের ইতিহাসে খুব তাড়াতাড়ি উপলব্ধি করা সম্ভব হবে (আমি মনে করি যদি এটি সত্য হয় তবে এগুলি পুনর্বিবেচনা করা যেতে পারে "আপনি কিছু চমৎকার উত্তর দিয়েছেন তাই এখন আমি আপনার সকলকে আপগ্রেটেড করব "সম্পূর্ণ স্কোর দ্বারা খ্যাতি" প্রভাবের পরিবর্তে "পোস্টগুলি)। অতিরিক্ত প্লট করার জন্য আমলে নেওয়ার সময় আমি কীভাবে এটি সত্য কিনা তা প্রদর্শনের জন্য একটি গ্রাফিক তৈরি করতে পারি? আমি ভেবেছিলাম সম্ভবত এটির প্রদর্শনের একটি ভাল উপায় হ'ল ফর্মের কোনও মডেল মাপসই করা যায়;
যেখানে হয় (বর্তমান স্ক্রেটারপ্লটগুলিতে যেমন রয়েছে), এক্স 1 হ'ল , এবং জেড 1 ⋯ জেড কে হ'ল পোস্ট সংখ্যার কিছু স্বেচ্ছাসেবী পরিসীমা উপস্থাপনকারী ডামি ভেরিয়েবল (উদাহরণস্বরূপ জেড 1 সমপরিমাণ পোস্টের সংখ্যাটি হলে , জেড পোস্ট সংখ্যা ইত্যাদি হলে 2 সমান )) β 0 এবং ε গ্র্যান্ড পথিমধ্যে এবং ত্রুটি মেয়াদ যথাক্রমে। তারপরে আমি কেবল আনুমানিক γ পরীক্ষা করব γscore - (mean score per user)post number11 through 25126 through 50কোনও পোস্টারের ইতিহাসে খ্যাতি প্রভাবগুলি প্রথম দিকে প্রদর্শিত হয়েছিল কিনা তা নির্ধারণ করার জন্য opালগুলি (বা তাদের চিত্রক্রমে প্রদর্শিত হবে)। এটি কি যুক্তিসঙ্গত (এবং উপযুক্ত) দৃষ্টিভঙ্গি?
এ জাতীয় স্ক্র্যাটারপ্লটগুলিতে কিছু ধরণের নন-প্যারাম্যাট্রিক স্মুথিং লাইনের ফিট করা জনপ্রিয় বলে মনে হয় (যেমন: লাউস বা স্প্লাইজস) তবে স্প্লাইসের সাথে আমার পরীক্ষা-নিরীক্ষণ কিছু আলোকিত করে না (পোস্টার ইতিহাসের প্রথম দিকে প্যাসিভ এফেক্টের কোনও প্রমাণই সামান্য এবং মেজাজী ছিল) আমি অন্তর্ভুক্ত স্প্লাইন সংখ্যা)। যেহেতু আমার একটি অনুমান আছে যে প্রভাবগুলি শুরুতে ঘটে, তাই আমার মডেলিং পদ্ধতির স্প্লিংসের চেয়ে বেশি যুক্তিসঙ্গত?
এছাড়াও নোট করুন যদিও আমি এই সমস্ত ডেটা ড্রেস করেছি, এখনও পরীক্ষা করার জন্য প্রচুর পরিমাণে অন্যান্য সম্প্রদায় রয়েছে (এবং সুপারভাইজার এবং সার্ভারফাল্টের মতো কিছু একই ধরণের বড় নমুনাগুলি থেকে আঁকতে পারে), সুতরাং ভবিষ্যতে এটি পরামর্শ দেওয়া যথেষ্ট যুক্তিসঙ্গত বিশ্লেষণ যে আমি কোনও সম্পর্ক পরীক্ষা করার জন্য হোল্ড-আউট নমুনা ব্যবহার করি।