স্কেলিং ডেটা যা প্লট করার জন্য আকারের বিভিন্ন আদেশে থাকে


9

নিম্নলিখিত ডাটাসেটের দিকে তাকানো:

 Date        Visits   Carts      carts       Orders
                      Created   converted    Created
2011-11-11    12277     161        9          36  
2011-11-12    11871     93         5          19    
2011-11-13    13072     107        8          8     
2011-11-14    13594     112        4          34    
2011-11-15    12741     129        8          43    
2011-11-16    15491     261        16         57 
2011-11-17    13418     186        17         42    

তারিখটি এক্স-এক্সিস এবং ওয়াই-অ্যাক্সিসের বাকী ডেটা রয়েছে তা ব্যবহার করে আমাকে কোনও গ্রাফে এটি প্লট করতে বলা হয়েছিল। সমস্যাটি হ'ল ডেটার স্কেল নাটকীয়ভাবে আলাদা। যেখানে ভিজিট কয়েক হাজারে থাকে এবং তৈরি অর্ডারগুলি নিম্ন দশায় থাকে সেখানে কোনও গ্রাফে ডেটা ভালভাবে প্লট হয় না।

আমি ভাবছিলাম এই পরিসংখ্যানটিতে কোনও পরিসংখ্যানবিদ কী করবেন, আমি দর্শনগুলিকে 1000 দ্বারা বিভক্ত করতে পারি এবং তারপরে বর্ণনা (ভিজিট (কে)) দিতে পারি, তবে তারপরে আমি কার্টস তৈরির সাথে একই সমস্যাটি শুরু করি, যেমন তারা আছে শত এবং সমস্ত কিছু স্বল্প দশায় রয়েছে।

এই পরিস্থিতিতে কি ধরণের জিনিস করা হয়?

উত্তর:


14

ওয়াই অক্ষের জন্য বিভিন্ন স্কেল সহ তবে এক্স অক্ষের (তারিখগুলি) সারিবদ্ধভাবে লাইন চার্টগুলি ছোট ছোট গুণকের একটি সিরিজ হিসাবে প্লট করা অযৌক্তিক নয়। এখানে চিত্র বর্ণনা লিখুন

আমি মনে করি এটি একটি ভাল শুরু, কারণ এটি কাঁচা ডেটা পরীক্ষা করার অনুমতি দেয় এবং বিভিন্ন লাইন চার্টের মধ্যে প্রবণতাগুলির তুলনা করার অনুমতি দেয়। আইএমওতে আপনার প্রথমে কাঁচা ডেটা দেখতে হবে, তারপরে রূপান্তরগুলি বা কাঁচা ডেটা পরীক্ষা করার পরে চার্টের তুলনামূলক করার জন্য সাধারণকরণের উপায়গুলি সম্পর্কে ভাবা উচিত।

কিং যেমন ইতিমধ্যে উল্লেখ করেছে, প্রদর্শিত হবে যে আপনার ভেরিয়েবলগুলির নাম এবং সংখ্যাগুলির উপর ভিত্তি করে একটি প্রাকৃতিক ক্রম রয়েছে এবং এটি যথাযথ বলে ধরে নিয়ে আমি প্রতিটি রাজ্যে রূপান্তরিত শতাংশের ভিত্তিতে তিনটি নতুন ভেরিয়েবল তৈরি করেছি। নতুন ভেরিয়েবলগুলি হ'ল;

% Carts Created = Carts_Created/Visits
% Orders Created = Orders_Created/Carts_Created
% Carts Converted = Carts_Converted/Orders_Created

শতাংশ তৈরি করা সিরিজটিকে সাধারণ স্কেলের আরও কাছাকাছি আনার একটি উপায়, তবে তারপরেও সমস্ত লাইনকে একটি চার্টে রাখা (নীচে হিসাবে) এখনও কার্যকরভাবে সিরিজটি কল্পনা করা কঠিন। অর্ডারগুলির তৈরির স্তর এবং প্রকরণটি এবং কার্টগুলি রূপান্তর করে সিরিজটি অন্য সিরিজের প্রান্তকে বামন করে। আপনি এই স্কেলটিতে তৈরি কার্টের কার্টগুলিতে কোনও প্রকারভেদ দেখতে পাচ্ছেন না (এবং আমি সন্দেহ করি যে এটির মধ্যে আপনি সবচেয়ে বেশি আগ্রহী। এখানে চিত্র বর্ণনা লিখুন

সুতরাং আবারও, আইএমও এটি পরীক্ষা করার আরও ভাল উপায় হ'ল বিভিন্ন স্কেল ব্যবহার করা। বিভিন্ন স্কেল ব্যবহার করে শতাংশের চার্ট নীচে রয়েছে।

এখানে চিত্র বর্ণনা লিখুন

এই গ্রাফিকগুলি সহ, আমার কাছে এই সিরিজের মধ্যে আমার কাছে কোনও আসল অর্থবোধক সম্পর্ক রয়েছে বলে মনে হয় না তবে প্রতিটি সিরিজের মধ্যে আপনার কাছে প্রচুর আকর্ষণীয় প্রকরণ রয়েছে (বিশেষত অনুপাতে রূপান্তরিত)। কি হচ্ছে 2011-11-13? আপনার অর্ডার তৈরির পরিমাণ অনেক কম ছিল তবে অর্ডার তৈরির প্রত্যেকটিই একটি রূপান্তরিত কার্ট। আপনার কি এমন কোনও হস্তক্ষেপ ছিল যা সাইটের ভিজিট বা অনুপাত বা শতাংশের তৈরি কার্টের ট্রেন্ডগুলিকে ব্যাখ্যা করতে পারে?

এটি কেবলমাত্র অনুসন্ধানের ডেটা বিশ্লেষণ, এবং আরও কোনও পদক্ষেপ গ্রহণের জন্য আমার তথ্যের আরও অন্তর্দৃষ্টি প্রয়োজন (আমি আশা করি এটি যদিও একটি ভাল শুরু)। আপনি তুলনামূলক স্কেলগুলিতে প্লট করতে সক্ষম হতে অন্যভাবে লাইন চার্টগুলিকে সাধারণ করতে পারেন, তবে এটি একটি কঠিন কাজ, এবং আমি মনে করি কিছু তথ্য নির্বাচনের বিপরীতে তথ্যযুক্ত তথ্য ভিত্তিক স্বেচ্ছাসেবক স্কেলগুলি কার্যকরভাবে বেছে নেওয়া হিসাবে করা যেতে পারে I ডিফল্ট নরমালাইজেশন স্কিম। এক সাথে অনেকগুলি লাইন গ্রাফ দেখার আরও একটি আকর্ষণীয় অ্যাপ্লিকেশন হ'ল দিগন্ত গ্রাফ , তবে এটি একবারে অনেকগুলি লাইন চার্ট দেখার জন্য আরও বেশি ।


আপনার উত্তরের বিশদটির জন্য আপনাকে ধন্যবাদ, মূলত আমার একাধিক চার্ট ছিল। আমার বসের সিদ্ধান্ত নিয়েছে যে তারা গ্রাফের সমস্ত সিরিজ পছন্দ করবে (আমি মনে করি এটি সম্ভবত অনেকগুলি সিরিজ তবে এটি আমার নয় যে এটি দেখবে :)) আমি মনে করি যে আমি ডেটা সাধারণ করার বিষয়টি বিবেচনা করব, সম্ভবত 0 - 1. এ তারা প্রবণতা দেখতে কেবল গ্রাফটি ব্যবহার করতে চায়, টেবিলের ডেটা সাধারণত গ্রাফের নীচে প্রদর্শিত হয়।
মাইক 15

@ মাইক, এটি একটি যুক্তিসঙ্গত অনুরোধ। সিরিজের সাধারণকরণের প্রবণতাটি পরিবর্তন করা উচিত নয় (প্রতিটি সিরিজের মাত্র স্তর এবং প্রকরণ)। আশা করি আপনি কয়েকটি কার্যকর, তবে তবুও অর্থবহ উপায়ে সিরিজটি কীভাবে স্বাভাবিক করবেন সে সম্পর্কে আরও অন্তর্দৃষ্টিপূর্ণ উত্তর পেয়েছেন। সতর্কতার মাত্র একটি শব্দ যদিও, সাধারণত আপনি কেবল একটি চার্টে 3-5 টি লাইন প্লট করতে চান, সেই সমস্ত তুলনা করা আরও অনেক কঠিন (ছোট গুণগুলি যদিও এই সমস্যার পক্ষে কাজ করে)।
অ্যান্ডি ডব্লু

1
@ মাইক হ্যাঁ, এক্ষেত্রে (কেবল সংখ্যা ছাড়াই ডেটা ভিজ্যুয়ালাইজিং করা), আপনি সমান্তরাল ডিসপ্লেতে সম্পন্ন যেমন আপনার ন্যূনতম / সর্বাধিক স্কেলে আপনার ডেটা প্রকাশ করতে পারেন । টেবিলের নীচে সংখ্যাগুলি দেখানোও একটি ভাল ধারণা।
chl

1
কমপক্ষে / সর্বোচ্চ স্কেলকে স্বাভাবিক করার বিষয়ে কেবল আরও একটি নোট যদিও @ সিএল এর পরামর্শ অনুসারে। প্রথমে কাঁচা তথ্যটি দেখতে ভাল, যদি আপনার কাছে আরও কিছু বড় আউটলার থাকে তবে আপনি সাধারণীকরণের প্রক্রিয়াতে সেই মানটি অন্তর্ভুক্ত না করে বিবেচনা করতে চাইতে পারেন (যদিও আপনি যদি সাধারণীকরণের গ্রাফটি করেন তবে এটি স্পষ্ট হওয়া উচিত, উদাহরণস্বরূপ যদি আপনার একটি লাইন গ্রাফ থাকে একটি উচ্চ / নিম্ন মান সহ এবং বাকি সমতল)। আমি মনে করি মাইকেল ফ্রেন্ডলি গ্রাফের নীচে সারণীটি অন্তর্ভুক্ত করার সাথে একমত হবেন।
অ্যান্ডি ডব্লু

2

আপনার কাছে দুটি পৃথক ওয়াই-অক্ষ, ভিজিট (কে) এবং কার্টস একটির মধ্যে তৈরি করা যেতে পারে, অন্যটি অন্যটিতে 2 (বা যে কোনও উপায়ে আপনার উদ্দেশ্য অনুসারে)।

এটি অবশ্যই একটি মার্জিত পদ্ধতি নয়, তবে আমি মনে করি এটি বেশ কয়েক বছর আগে করা যখন আমি কেবল সময়ের সাথে প্রবণতাগুলির তুলনা করতে চেয়েছিলাম।

অথবা

আপনার উদ্দেশ্যটি অনুসারে যদি আপনি কেবল শতাংশের পরিবর্তনটি প্লট করতে পারেন।


2 টি ভিন্ন Y অক্ষের সাথে আপনি উল্লিখিত রুটটি আমি বিবেচনা করেছি, তবে এটি সম্পর্কে আমার কী পছন্দ হয়নি তা হ'ল: যদি একটি নতুন সিরিজ চালু করা হয় যা দুটি ওয়াই-অক্ষের একটিতে ফিট না হয় তবে আমি সম্ভবত আটকে থাকতাম be পরামর্শের জন্য আপনাকে ধন্যবাদ, এবং সম্ভবত অন্য সময় আমি এটি আরও বিবেচনা করব :)
মাইক

শতাংশ ব্যবহার সম্পর্কে দ্বিতীয় পরামর্শ সম্পর্কে কি? যেমন শুরুর তারিখে 100 তে সমস্ত কিছু সূচীকরণ (বা যে কোনও তারিখই আপনার চার্টটিকে সুন্দর করে তোলে)। আপনি যতগুলি নতুন সিরিজ চান যোগ করতে পারেন!
কিং

এটি একটি বিকল্প, আমি বর্তমানে এই ডেটাটিকে কীভাবে সাধারণ করতে হবে এবং যদি এটি কাজ করে তবে কীভাবে তা বের করার চেষ্টা করে এক্সেল এ আছি। ব্যর্থ হচ্ছি যে আমি শতাংশের ধারণাটি যাব :)
মাইক

2

শেষ পর্যন্ত আমি প্রতিটি মানকে সর্বোচ্চ মানের দ্বারা ভাগ করে এবং তারপরে 100 দ্বারা গুণ করে ডেটা সাধারণ করার সিদ্ধান্ত নিয়েছি।

  1. সর্বাধিক মান সন্ধান করুন:

      Date        Visits   Carts      carts       Orders
                          Created   converted    Created
    2011-11-11    12277     161        9          36  
    2011-11-12    11871     93         5          19    
    2011-11-13    13072     107        8          8     
    2011-11-14    13594     112        4          34    
    2011-11-15    12741     129        8          43    
    2011-11-16    15491     261        16         57 
    2011-11-17    13418     186        17         42    
    
    maximum       15491     261        17         57
    
  2. প্রতিটি সংখ্যা সর্বাধিক দ্বারা ভাগ করুন এবং তারপরে 100 দ্বারা গুণ করুন:

      Date        Visits   Carts      carts       Orders
                          Created   converted    Created
    2011-11-11    79.25     61.68      52.94      63.15  
    2011-11-12    76.63     35.63      29.41      33.33    
    2011-11-13    84.38     40.99      47.05      14.03      
    2011-11-14    87.75     42.91      23.52      59.64    
    2011-11-15    82.24     49.42      47.05      75.43    
    2011-11-16    100       100        94.11      100
    2011-11-17    86.61     71.26      100        73.68    
    
  3. আমি তখন এটি গ্রাফে চক্রান্ত করেছি, স্পষ্টতই এটি কেবল প্রবণতা প্রদর্শন করে এবং ব্যবহারকারীর পৃষ্ঠার নীচে ডেটা টেবিল থাকে।


0

এটি আমার পদ্ধতিরও হবে - এক্স দ্বারা বিভাজক করে একই মাত্রায় বিভিন্ন মাত্রা সামঞ্জস্য করার জন্য তবে আমি সর্বোচ্চ বা ন্যূনতম মান নয়, গড় মান ব্যবহার করব। কারণটি হ'ল - সময়ের সাথে সাথে আপনি ডেটা যুক্ত করার সাথে সাথে আপনার সর্বাধিক বা মিনিট সম্ভবত পরিবর্তন হতে পারে এবং তারপরে শেষ চার্টে যা ছিল 100% এই সময়টি অন্য কিছু ছিল - চার্টটি পূর্বের চার্টগুলির মতো সহজেই পুনঃসীমাংসিত নয় - যদি আপনি গড় ব্যবহার করেন তবে পরিবর্তনগুলি ততটা কঠোর নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.