সম্প্রতি আমি আপভোটগুলিতে সুনামের প্রভাবগুলির কিছু বিশ্লেষণ করেছি ( ব্লগ-পোস্ট দেখুন ) এবং পরবর্তীকালে আমার সম্ভবত আরও আলোকিতকরণ (বা আরও উপযুক্ত) বিশ্লেষণ এবং গ্রাফিক্স সম্পর্কে কয়েকটি প্রশ্ন ছিল।
সুতরাং কয়েকটি প্রশ্ন (এবং বিশেষত কারও কাছে সাড়া দিতে নির্দ্বিধায় এবং অন্যকে উপেক্ষা করুন):
অবতারের বর্তমানটিতে, আমি পোস্ট নম্বরটি কেন্দ্র করে বোঝাতে চাইছি না। আমি মনে করি এটি যা করে তা স্ক্র্যাপপ্লোটে নেতিবাচক সম্পর্কের মিথ্যা চেহারা দেয়, কারণ পোস্টের গণনার নীচের প্রান্তে আরও পোস্ট রয়েছে (আপনি দেখেন যে জোন স্কিট প্যানেলে এটি ঘটে না, কেবল নশ্বর ব্যবহারকারীদের মধ্যে প্যানেল)। পোস্ট নম্বরটি কেন্দ্রীভূত না করা (যেহেতু আমি ব্যবহারকারীর গড় স্কোরকে কেন্দ্র করে স্কোর কেন্দ্রিক) তার অর্থ কি অপ্রয়োজনীয়?
এটি গ্রাফগুলি থেকে স্পষ্ট হওয়া উচিত যে স্কোরটি খুব সঠিক স্কিউড (এবং কেন্দ্রীকরণের অর্থ এটি কোনও পরিবর্তন হয়নি)। কোনও রিগ্রেশন লাইনের সাথে ফিট করার সময় আমি হুবার-হোয়াইট স্যান্ডউইচ ত্রুটিগুলি ব্যবহার করে লিনিয়ার মডেল এবং একটি মডেল উভয়ই ফিট করি (
rlm
MASS আর প্যাকেজের মাধ্যমে ) এবং এটি opeালের অনুমানগুলিতে কোনও পার্থক্য করে না। আমার কি শক্তিশালী রিগ্রেশন পরিবর্তে ডেটাতে রূপান্তর বিবেচনা করা উচিত? নোট করুন যে কোনও রূপান্তরকে 0 এবং নেতিবাচক স্কোরগুলির সম্ভাবনা বিবেচনা করতে হবে। বা ওএলএসের পরিবর্তে আমার কি অন্য কোনও ধরণের মডেল ব্যবহার করা উচিত?আমি বিশ্বাস করি সর্বশেষে দুটি গ্রাফিক্স উন্নত হতে পারে (এবং পাশাপাশি উন্নত মডেলিং কৌশলগুলির সাথে সম্পর্কিত)। আমার (জ্যাকেড) মতামতে, আমি সন্দেহ করব যে খ্যাতির প্রভাবগুলি বাস্তব কিনা সেগুলি পোস্টারের ইতিহাসে খুব তাড়াতাড়ি উপলব্ধি করা সম্ভব হবে (আমি মনে করি যদি এটি সত্য হয় তবে এগুলি পুনর্বিবেচনা করা যেতে পারে "আপনি কিছু চমৎকার উত্তর দিয়েছেন তাই এখন আমি আপনার সকলকে আপগ্রেটেড করব "সম্পূর্ণ স্কোর দ্বারা খ্যাতি" প্রভাবের পরিবর্তে "পোস্টগুলি)। অতিরিক্ত প্লট করার জন্য আমলে নেওয়ার সময় আমি কীভাবে এটি সত্য কিনা তা প্রদর্শনের জন্য একটি গ্রাফিক তৈরি করতে পারি? আমি ভেবেছিলাম সম্ভবত এটির প্রদর্শনের একটি ভাল উপায় হ'ল ফর্মের কোনও মডেল মাপসই করা যায়;
যেখানে হয় (বর্তমান স্ক্রেটারপ্লটগুলিতে যেমন রয়েছে), এক্স 1 হ'ল , এবং জেড 1 ⋯ জেড কে হ'ল পোস্ট সংখ্যার কিছু স্বেচ্ছাসেবী পরিসীমা উপস্থাপনকারী ডামি ভেরিয়েবল (উদাহরণস্বরূপ জেড 1 সমপরিমাণ পোস্টের সংখ্যাটি হলে , জেড পোস্ট সংখ্যা ইত্যাদি হলে 2 সমান )) β 0 এবং ε গ্র্যান্ড পথিমধ্যে এবং ত্রুটি মেয়াদ যথাক্রমে। তারপরে আমি কেবল আনুমানিক γ পরীক্ষা করব γscore - (mean score per user)
post number
1
1 through 25
1
26 through 50
কোনও পোস্টারের ইতিহাসে খ্যাতি প্রভাবগুলি প্রথম দিকে প্রদর্শিত হয়েছিল কিনা তা নির্ধারণ করার জন্য opালগুলি (বা তাদের চিত্রক্রমে প্রদর্শিত হবে)। এটি কি যুক্তিসঙ্গত (এবং উপযুক্ত) দৃষ্টিভঙ্গি?
এ জাতীয় স্ক্র্যাটারপ্লটগুলিতে কিছু ধরণের নন-প্যারাম্যাট্রিক স্মুথিং লাইনের ফিট করা জনপ্রিয় বলে মনে হয় (যেমন: লাউস বা স্প্লাইজস) তবে স্প্লাইসের সাথে আমার পরীক্ষা-নিরীক্ষণ কিছু আলোকিত করে না (পোস্টার ইতিহাসের প্রথম দিকে প্যাসিভ এফেক্টের কোনও প্রমাণই সামান্য এবং মেজাজী ছিল) আমি অন্তর্ভুক্ত স্প্লাইন সংখ্যা)। যেহেতু আমার একটি অনুমান আছে যে প্রভাবগুলি শুরুতে ঘটে, তাই আমার মডেলিং পদ্ধতির স্প্লিংসের চেয়ে বেশি যুক্তিসঙ্গত?
এছাড়াও নোট করুন যদিও আমি এই সমস্ত ডেটা ড্রেস করেছি, এখনও পরীক্ষা করার জন্য প্রচুর পরিমাণে অন্যান্য সম্প্রদায় রয়েছে (এবং সুপারভাইজার এবং সার্ভারফাল্টের মতো কিছু একই ধরণের বড় নমুনাগুলি থেকে আঁকতে পারে), সুতরাং ভবিষ্যতে এটি পরামর্শ দেওয়া যথেষ্ট যুক্তিসঙ্গত বিশ্লেষণ যে আমি কোনও সম্পর্ক পরীক্ষা করার জন্য হোল্ড-আউট নমুনা ব্যবহার করি।