শ্রেণিবদ্ধ তথ্য সংক্ষেপে কিভাবে?


13

আশাকরি সহ আমি নিম্নলিখিত সমস্যার সাথে লড়াই করে যাচ্ছি পরিসংখ্যানবিদদের পক্ষে সহজ একটি বিষয় (আমি পরিসংখ্যানের কিছুটা এক্সপোজার সহ একটি প্রোগ্রামার)।

আমার একটি সমীক্ষার প্রতিক্রিয়াগুলি সংক্ষিপ্ত করা দরকার (পরিচালনার জন্য)। সমীক্ষায় 100+ টি প্রশ্ন রয়েছে, বিভিন্ন এলাকায় দলবদ্ধ করা হয়েছে (প্রতি এলাকাতে প্রায় 5 থেকে 10 টি প্রশ্ন রয়েছে)। সমস্ত উত্তরগুলি শ্রেণিবদ্ধ (একটি সাধারণ স্কেল এ, তারা "মোটেও নয়", "খুব কমই" ... "প্রতিদিন বা আরও ঘন ঘন")।

পরিচালনা প্রতিটি ক্ষেত্রের জন্য একটি সংক্ষিপ্তসার পেতে চাই এবং এটি আমার সমস্যা: সম্পর্কিত প্রশ্নের মধ্যে কীভাবে শ্রেণিবদ্ধ উত্তরগুলি একত্রিত করা যায়? । প্রশ্নগুলি প্রতিটি অঞ্চলের জন্য একটি গ্রাফ বা এমনকি একটি জাল প্লট তৈরি করতে অনেক বেশি। সংখ্যার টেবিলের তুলনায়, যদি সম্ভব হয় তবে আমি ভিজ্যুয়াল পদ্ধতির পক্ষে, যদিও তারা তা পড়বে না favor

আমি কেবল যে বিষয়টি সামনে আসতে পারি তা হ'ল প্রতিটি অঞ্চলে উত্তরগুলির সংখ্যা গণনা করা, তারপরে হিস্টোগ্রামটি প্লট করুন।

শ্রেণিবদ্ধ ডেটার জন্য আরও কিছু পাওয়া যায়?

আমি আর ব্যবহার করি, তবে এটি প্রাসঙ্গিক কিনা তা নিশ্চিত নই, আমি মনে করি এটি একটি সাধারণ পরিসংখ্যানের প্রশ্ন।


পিসিএ / এফএ সম্পর্কে কীভাবে? আপনি পারস্পরিক সম্পর্কযুক্ত ভেরিয়েবলগুলি ফ্যাক্টরগুলিতে সঙ্কুচিত করে সেখান থেকে কাজ করবেন ...
রোমান Luštrik

এটি খুব বেশি হতে পারে, যদি ম্যানেজমেন্ট জিজ্ঞাসা করে 'আপনি সংযুক্ত নম্বরগুলি কীভাবে পেয়েছেন?' তারা একটি সহজ কৌশল চাইবে যাতে তারা (অনুভূত হয়) এটি বুঝতে পারে। হায়রে, আসল বিশ্ব :-( ধন্যবাদ, যদিও।
wishihadabettername

উত্তর:


10

আপনি যে প্রশ্নটির উত্তর দেওয়ার চেষ্টা করছেন তা আসলেই খুঁজে বের করতে হবে - বা কোন প্রশ্নটি ম্যানেজমেন্ট সবচেয়ে বেশি আগ্রহী Then তারপরে আপনি জরিপের প্রশ্নগুলি বেছে নিতে পারেন যা আপনার সমস্যার সাথে সর্বাধিক প্রাসঙ্গিক।

আপনার সমস্যা বা ডেটাসেট সম্পর্কে কিছু না জেনে কিছু সাধারণ সমাধান এখানে দেওয়া হল:

  • উত্তরগুলি ক্লাস্টার হিসাবে দৃশ্যত উপস্থাপন করুন। আমার পছন্দেরটি হয় ডেনড্রোগ্রামগুলি ব্যবহার করে বা কেবল একটি এক্সআই অক্ষের উপর চক্রান্ত করে (গুগল "ক্লাস্টার এনালাইসিস আর" এবং স্টেটমেথডস নেট দ্বারা প্রথম ফলাফলে যান)
  • প্রশ্নগুলি সর্বোচ্চ থেকে কমপক্ষে "দৈনিক বা আরও ঘন ঘন" প্রতিক্রিয়াগুলিতে স্থান দিন। এটি এমন উদাহরণ যা আপনার পক্ষে ঠিক কাজ না করে তবে সম্ভবত এটি আপনাকে অনুপ্রাণিত করবে http://www.programmingr.com/content/building-scoring-and-ranking-systems-r
  • ক্রসস্ট্যাবস: উদাহরণস্বরূপ, আপনার একটি প্রশ্ন আছে "আপনি কাজের জন্য কতটা দেরীতে আসেন?" এবং "আপনি কতবার ফেসবুক ব্যবহার করেন ?," এই দুটি প্রশ্নকে অবিচ্ছিন্ন করে আপনি দু'জনই খুব কমই যে কাজ করেন, বা যারা প্রতিদিন উভয়ই করেন তাদের শতাংশের সন্ধান করতে পারবেন ((গুগল "আর ফ্রিকোয়েন্সি ক্রসস্ট্যাবস" বা উপরোক্ত স্ট্যাটাসেথডথনেটনে যান )
  • Correlograms। এগুলির সাথে আমার কোনও অভিজ্ঞতা নেই তবে আমি এটি স্টেটমেডথনস.নেট ওয়েবসাইটেও দেখেছি। মূলত আপনি সন্ধান করেন যে কোন প্রশ্নের সর্বাধিক পারস্পরিক সম্পর্ক রয়েছে এবং তারপরে একটি সারণী তৈরি করুন। এটি "ব্যস্ত" ধরণের দেখায় তবে আপনি এটি দরকারী খুঁজে পেতে পারেন।

আমি এটিকে উত্তর হিসাবে চিহ্নিত করব; এটিতে বেশ কয়েকটি ভাল পরামর্শ রয়েছে তাই আমি সেগুলি কীভাবে প্রয়োগ করব তা ভাবব।
wishihadabettername

9

মাইকেল ফ্রেন্ডলি দ্বারা ব্যবহৃত ভিজ্যুয়ালাইজেশন কৌশলগুলির জন্য একটি দুর্দান্ত কাগজ রয়েছে:

(আসলে, একই লেখকের কাছে এটি উত্সর্গীকৃত একটি পুরো বই রয়েছে )) আর-এর ভিসিডি প্যাকেজ এই কৌশলগুলির অনেকগুলি প্রয়োগ করে।


কাগজ এবং বইয়ের রেফারেন্সের জন্য
উত্সাহিত

8

স্ট্যান্ডার্ড বিকল্পগুলির মধ্যে রয়েছে:

  • স্কেলের মধ্যে আইটেমগুলির গড় অর্জন (উদাহরণস্বরূপ, স্কেল 1 থেকে 5 হয়, গড়টি 1 থেকে 5 হবে)
  • প্রতিটি আইটেমকে বাইনারি পরিমাপে রূপান্তর করা (উদাহরণস্বরূপ, আইটেম> = 3, তারপরে 1, অন্য 0) এবং তারপরে এই বাইনারি প্রতিক্রিয়ার অর্থ গ্রহণ করা

আপনি সংস্থার আইটেমগুলি এবং লোকের বৃহত নমুনাগুলির উপরে একত্রিত হয়ে যাচ্ছেন, এই উভয় বিকল্প (যেমন, 1 থেকে 5 এর গড় বা একটি পয়েন্টের উপরে শতাংশের গড়) উভয়ই সাংগঠনিক পর্যায়ে নির্ভরযোগ্য হবে ( দেখুন এখানে দেখুন আরও আলোচনা )। সুতরাং, উপরোক্ত বিকল্পগুলির মধ্যে দুটিই মূলত একই তথ্য যোগাযোগ করছে।

আইটেমগুলি শ্রেণিবদ্ধ যে বিষয়ে আমি সাধারণভাবে উদ্বিগ্ন হব না। আপনি যখন আইটেমগুলিকে একত্রিত করে তত্ক্ষণাত আপনার উত্তরদাতাদের নমুনার উপরে একত্রিত করে স্কেল তৈরি করবেন ততক্ষণে স্কেলটি অবিচ্ছিন্ন স্কেলের খুব কাছের কাছাকাছি হবে।

ম্যানেজমেন্ট ব্যাখ্যা করতে একটি মেট্রিক সহজ পেতে পারে। আমি যখন কোয়ালিটি অফ টিচিং স্কোর পেয়েছি (যেমন, 100 শিক্ষার্থী বলার গড় শিক্ষার্থীর সন্তুষ্টি স্কোর) তখন এটি 1 থেকে 5 স্কেলের গড় এবং এটি ঠিক আছে। বছরের পর বছর আমার নিজস্ব স্কোর দেখার পরে এবং বিশ্ববিদ্যালয়ের জন্য কিছু নিয়ম দেখার পরেও আমি বিভিন্ন মূল্যবোধ বলতে কী বোঝায় তার রেফারেন্সের একটি ফ্রেম তৈরি করেছি। যাইহোক, পরিচালনা কখনও কখনও কোনও বিবৃতি সমর্থন করে এমন শতাংশের বিষয়ে বা ইতিবাচক প্রতিক্রিয়াগুলির শতাংশ সম্পর্কে বিবেচনা করতে পছন্দ করে এমনকি যখন এটি অর্থে শতাংশেরও হয়।

মূল চ্যালেঞ্জটি হল স্কোরগুলির জন্য কিছু স্থির ফ্রেমের রেফারেন্স দেওয়া। নম্বরগুলি আসলে কী বোঝায় তা জানতে চাইবে । উদাহরণস্বরূপ, যদি কোনও স্কেলটির গড় প্রতিক্রিয়া 4.2 হয় তবে এর অর্থ কী? এটা কি ভালো? এটা কি খারাপ? এটা ঠিক আছে?

আপনি যদি একাধিক বছর ধরে বা বিভিন্ন সংস্থায় জরিপটি ব্যবহার করেন তবে আপনি কিছু নিয়ম বিকাশ করতে শুরু করতে পারেন। নিয়মগুলি অ্যাক্সেসের একটি কারণ হ'ল সংস্থাগুলি প্রায়শই একটি বাহ্যিক জরিপ সরবরাহকারী পান বা একটি মানক জরিপ ব্যবহার করে।

আইশের আইশের নিয়োগের ক্ষেত্রে যথাযথভাবে ন্যায়সঙ্গত হওয়ার বিষয়টি যাচাই করতে আপনি একটি ফ্যাক্টর বিশ্লেষণও চালাতে চাইতে পারেন।

ভিজ্যুয়াল পদ্ধতির শর্তে, আপনার এক্স-অক্ষের স্কেল টাইপ এবং y- অক্ষের স্কোর সহ একটি সাধারণ লাইন বা বার গ্রাফ থাকতে পারে। আপনার যদি আদর্শিক ডেটা থাকে তবে আপনি এটিও যুক্ত করতে পারেন।


1

হ্যাঁ. আমি বুঝি এবং পরিচালনা উপস্থাপনা উভয়ের জন্য সমীক্ষার ডেটা হ্রাস করার জন্য ডেটা হ্রাসের জন্য ক্লাস্টারিংকে খুব কার্যকর পদ্ধতি বলে মনে হচ্ছে।

প্রচ্ছন্ন শ্রেণীর বিশ্লেষণ (প্রতিক্রিয়ার স্কেলগুলি অর্ডিনাল হিসাবে গণ্য করা) বা কে-অর্থ (তাদেরকে অবিচ্ছিন্ন হিসাবে গণ্য করা) উভয়ই তথ্য সংকোচনের একটি রূপ হিসাবে দেখা যেতে পারে । উত্তরদাতাদের সবচেয়ে সম্ভবত বিভাগে শ্রেণিবদ্ধকরণ সাধারণত প্রতিক্রিয়াগুলির শর্তাবলী যখন প্রোফাইল করা হয় স্বজ্ঞাত ব্যাখ্যা আছে যা একটি শ্রেণিবদ্ধ পরিবর্তনশীল উত্পাদন করে।

তারপরে আপনি বিভাগগুলির নাম রাখতে পারেন এবং সংক্ষিপ্ত স্তর বিশ্লেষণ এবং উপস্থাপনের জন্য সেই পরিবর্তনগুলি ব্যবহার করতে পারেন।

সম্পর্কিত আইটেমের গোষ্ঠীগুলির জন্য একটি ক্লাস্টার ফিট করুন (উদাহরণস্বরূপ নীচে) বা সম্ভবত সমস্ত একসাথে।

Q14cluser <-  Q14(a..m):  Which of the following... Check all that apply
QEcluster <-  QE1..QE30:  Rate your agreement with .. Scale of 1-5

আমি প্রায়শই লেটেন্টগোল্ড ব্যবহার করি তবে এসএএস-তে খুব ভাল ব্যয়বহুল হতে খুব দ্রুত খুঁজে পাই।

এটি করার আগে, আপনি প্রতিটি ব্যক্তির স্কেল তাদের ব্যবহারের জন্য প্রতিক্রিয়াগুলি সামঞ্জস্য করতে (বিতর্কিত তবে বাস্তববাদী) বিবেচনা করতে চাইবেন। কিছু লোক কেবলমাত্র স্কেলের এক প্রান্তে ঝুঁকে থাকে, তা হয় নেতিবাচক বা ধনাত্মককে এড়িয়ে চলে। ক্লাস্টারিং কাঁচা প্রতিক্রিয়া সাধারণত সেই আচরণ দ্বারা লোককে বিভক্ত করে।

প্রতিটি উত্তরদাতাদের নিজস্ব অর্থের জবাবকে মানক করা এবং এতে ক্লাস্টিং করা প্রায়শই ভেরিয়েবলগুলি প্রকাশ করে যা খুব আকর্ষণীয় উপায়ে একসাথে চলে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.