ডেটা মাইনিংয়ে উত্তোলন পরিমাপ


36

ঠিক অনেক লিফট কী করবে তা জানতে আমি অনেক ওয়েবসাইট অনুসন্ধান করেছি? আমি যে ফলাফলগুলি পেয়েছি সেগুলি সেগুলি নিজেই অ্যাপ্লিকেশনগুলিতে ব্যবহার করার বিষয়ে নয়।

আমি সমর্থন এবং আত্মবিশ্বাস ফাংশন সম্পর্কে জানি। ডেটা মাইনিংয়ে উইকিপিডিয়া থেকে, লিফটটি কোনও এলোমেলো পছন্দের মডেলটির পরিমাপ করে কেসগুলির পূর্বাভাস বা শ্রেণিবদ্ধকরণে কোনও মডেলের পারফরম্যান্সের একটি পরিমাপ। কিন্তু কিভাবে? আত্মবিশ্বাস * সমর্থন উত্তোলনের মূল্য আমি অন্য সূত্রগুলিও অনুসন্ধান করেছিলাম তবে আমি বুঝতে পারি না লিফ্ট চার্টগুলি কেন পূর্বাভাসিত মানগুলির যথার্থতার জন্য গুরুত্বপূর্ণ, আমি বোঝাতে চাই যে লিফ্টের পিছনে কী নীতি এবং কারণ রয়েছে?


2
এখানে প্রসঙ্গ দরকার। বিপণনে, এটি এমন একটি চার্ট হবে যা বিভিন্ন বিপণন ক্রিয়াকলাপ থেকে প্রত্যাশিত বিক্রয় বৃদ্ধির ইঙ্গিত দিবে, তবে আপনার মনে সম্ভবত একটি ভিন্ন প্রসঙ্গ রয়েছে।
zbcyclist

উত্তর:


59

"লিফট" কীভাবে কার্যকর তা একটি উদাহরণ দেব ...

কল্পনা করুন আপনি সরাসরি মেইল ​​প্রচার চালাচ্ছেন যেখানে আপনি গ্রাহকদের তারা যে প্রতিক্রিয়ার প্রত্যাশায় একটি অফার মেল করবেন। Dataতিহাসিক তথ্যগুলি দেখায় যে যখন আপনি আপনার গ্রাহক বেসটি এলোমেলোভাবে সম্পূর্ণ মেইল ​​করেন তখন তাদের মধ্যে প্রায় 8% মেলিংয়ের প্রতিক্রিয়া জানায় (অর্থাত্ তারা এসে অফারটি দিয়ে কেনাকাটা করে)। সুতরাং, আপনি যদি 1000 জন গ্রাহককে মেল করেন তবে আপনি 80 জন প্রতিক্রিয়া আশা করতে পারেন।

এখন, আপনি কোনও গ্রাহক কোনও মেইলিংয়ের প্রতিক্রিয়া জানাতে পারে কিনা সে সম্পর্কে ভবিষ্যদ্বাণীপূর্ণ নিদর্শনগুলি খুঁজে পেতে আপনার historicalতিহাসিক ডেটাতে একটি লজিস্টিক রিগ্রেশন মডেল ফিট করার সিদ্ধান্ত নিয়েছেন। লজিস্টিক রিগ্রেশন মডেল ব্যবহার করে প্রতিটি গ্রাহক সাড়া দেওয়ার সম্ভাবনা নির্ধারিত হয় এবং আপনি নির্ভুলতার মূল্যায়ন করতে পারেন কারণ আপনি জানেন যে তারা আসলে প্রতিক্রিয়া জানিয়েছিল কিনা। একবার প্রতিটি গ্রাহককে তাদের সম্ভাব্যতা অর্পণ করা হলে আপনি এগুলি সর্বোচ্চ থেকে সর্বনিম্ন স্কোরিং গ্রাহককে র‌্যাঙ্ক করেন। তারপরে আপনি এর মতো কিছু "লিফ্ট" গ্রাফিক তৈরি করতে পারেন:

এখানে চিত্র বর্ণনা লিখুন

আপাতত শীর্ষ চার্ট উপেক্ষা করুন। নীচের চার্টটি বলছে যে আমরা গ্রাহকদের সাড়া দেওয়ার সম্ভাবনার উপর ভিত্তি করে বাছাই করার পরে (উচ্চ থেকে নিম্ন) এবং তারপরে তাদের দশটি সমান টুকরো টুকরো টুকরো করে ফেলব, বিন # 1 (গ্রাহকদের শীর্ষ 10%) এর প্রতিক্রিয়া হার 29 29/8 = 3.63 এর উত্তোলনের জন্য, র্যান্ডম গ্রাহকদের 8% বনাম 8%। ৪ র্থ বিনে আমরা যখন গ্রাহকদের কাছে পেয়েছি তখন আমরা আগের তিনটি এতগুলি ক্যাপচার করেছি যে প্রতিক্রিয়ার হার আমরা এলোমেলোভাবে মেলিং লোকেদের প্রত্যাশার চেয়ে কম is

শীর্ষস্থানীয় চার্টটি এখনই দেখছেন, এটি যা বলে তা হ'ল আমরা যদি গ্রাহকদের উপর সম্ভাব্যতা স্কোর ব্যবহার করি তবে আমরা মোট প্রতিক্রিয়াশীলদের 60০% পেতে পারি কেবলমাত্র রান প্রাপ্ত গ্রাহকদের শীর্ষস্থানীয় ৩০% মেইল ​​করে আমরা এলোমেলোভাবে মেইলিং করব। অর্থাত, মডেলটি ব্যবহার করে আমরা কেবলমাত্র স্কোর হওয়া শীর্ষস্থানীয় 30% গ্রাহককে মেইল ​​করে 30% মেল খরচের জন্য প্রত্যাশিত মুনাফা পেতে পারি এবং এটি লিফটকে প্রকৃতপক্ষে বোঝায়।


চমৎকার ব্যাখ্যা আপনাকে অনেক ধন্যবাদ। আপনি দয়া করে আমাকে লিফ্ট চার্টে বলুন কেন আমাদের এলোমেলো নমুনার প্রয়োজন? আমি বুঝতে পেরেছি 8% এলোমেলো থেকে এসেছে তবে কেন এলোমেলোভাবে ট্রেস করা দরকার? আমি অন্য একটি চার্ট দেখেছি যা মানগুলির গড় সন্ধান করে এবং গড়ের অস্তিত্বের কারণ আমি জানি না
নিকুল

আমি যে জিনিসটি পেয়েছি তা হ'ল লিফট = 3.63 বলছে যে কলাম 4 অবধি আমাদের 8% এর চেয়ে ভাল প্রতিক্রিয়া হার রয়েছে, তবে আপনি কেবল 1 কলামটি ধরেছেন এবং 29% (আনুমানিক 30%) বিবেচনা করে আপনি কেবল কলাম 1 টি বিবেচনা করেছেন তাহলে কি লিফটটি 3.63 দিয়ে করেছে?
নিকুল

1
হে ভগবান! আমি বুঝতে পেরেছি যে আমার ভুল 30% 29% এর সাথে সম্পর্কিত নয় 30% এর অর্থ 3-10 টি 3 টি প্রথম কলাম! এখন আমি এটি পুরোপুরি বুঝতে পেরেছি: ডিআই খুব খুশি !!!!! আপনাকে ধন্যবাদ>: ডি <
নিকুল

1
@ এনিক: বলুন প্রতিটি গ্রাহককে মেইলে পাঠানোর জন্য কাগজ এবং ডাকের জন্য $$ 1 খরচ হয়। উদ্বেগের সাথে, আমরা ব্যয় করতে পারি 1 = 300 এবং আমরা 48 গ্রাহক আশা করি। এরপরে, আমরা অনুমান করব যে প্রতিটি গ্রাহকের কাছ থেকে কত লাভ হয়। আমাদের ব্যয় হয়েছে- 300-get- গ্রাহক এবং আমরা যেটি চয়ন করি তা প্রতি গ্রাহকের লাভের উপর নির্ভর করে। 1000মিএকটিআমিআমিএনএকটি1000তোমার দর্শন লগ করাগুলিটিমিRগুলিএকটিএনWএক্সপিটি8300)টিএনWএক্সপিটিটিটি601000-টি-80-তোমার দর্শন লগ করাগুলিটিমিRগুলিবনামগুলিএসপিএন-
জোশ হেম্যান

1
@ ব্যবহারকারী ১17০০৮৯০ শীর্ষ চার্টটি প্রায়শই সম্মিলিত লাভের চার্ট হিসাবে লেবেলযুক্ত থাকে, যখন নীচের চার্টটি সংশ্লেষিত লিফ্ট চার্টের সমান হয় না (যেখানে লিফ্টটি কখনই 1 এর চেয়ে কম হয় না) তবে ডেটাটিকে দশটি পৃথক ভাগে বিভক্ত করে।
রবার্টএফ

3

লিফ্ট চার্ট কোনও মডেলের প্রতিক্রিয়া এবং সেই মডেলের অনুপস্থিতির মধ্যে অনুপাতের প্রতিনিধিত্ব করে। সাধারণত, এটি এক্স এর ক্ষেত্রে শতাংশের শতাংশ দ্বারা প্রতিনিধিত্ব করে এবং ওয়াই কুঠারটিতে প্রতিক্রিয়াটি আরও কতবার ভাল হয়। উদাহরণস্বরূপ, 10% পয়েন্টে লিফট = 2 সহ একটি মডেলটির অর্থ:

  • কোনও মডেল ছাড়াই জনসংখ্যার 10% না নিয়ে (কোনও অর্ডার ছাড়াই কোনও মডেল নেই) y = 1 এর অনুপাত y = 1 সহ মোট জনসংখ্যার 10% হবে।

  • মডেলটির সাথে আমরা এই অনুপাতের 2গুণ বেশি পাই, অর্থাত্, আমরা y = 1. সহ মোট জনসংখ্যার 20% পাওয়ার প্রত্যাশা করি char চরের লেবেল এক্স পূর্বাভাস অনুসারে অর্ডার করা ডেটার প্রতিনিধিত্ব করে। আপনার প্রথম 10% শীর্ষ 10% পূর্বাভাস


3

উত্তোলন প্রত্যাশিত আত্মবিশ্বাসের অনুপাত ছাড়া আর কিছুই নয়। অ্যাসোসিয়েশন বিধিগুলির ক্ষেত্রে - "১.০ এর চেয়ে বড় লিফ্টের অনুপাতটি বোঝায় যে দুটি সেট স্বতন্ত্র থাকলে পূর্বসূচী এবং ফলস্বরূপের সম্পর্ক প্রত্যাশার চেয়ে বেশি তাত্পর্যপূর্ণ। লিফ্টের অনুপাত যত বেশি তত বেশি তাত্পর্যপূর্ণ সমিতি significant " উদাহরণ স্বরূপ-

সুপারমার্কেটের ডাটাবেসে যদি 100,000 পয়েন্ট-অফ-বিক্রয় লেনদেন হয়, যার মধ্যে 2,000 আই এবং বি উভয় আইটেমকে অন্তর্ভুক্ত করে, সমিতির বিধি "যদি এ এবং বি ক্রয় করা হয়, তবে সি একই কেনা হবে ট্রিপ, "800 টি লেনদেনের (বিকল্প 0.8% = 800 / 100,000) এবং 40% (= 800 / 2,000) এর একটি আস্থা রয়েছে। সমর্থনের কথা ভাবার একটি উপায় হ'ল এটি সম্ভবত এটি যে সম্ভাবনা হ'ল ডাটাবেস থেকে এলোমেলোভাবে নির্বাচিত লেনদেনে পূর্ববর্তী এবং ফলস্বরূপ সমস্ত আইটেম থাকবে তবে আত্মবিশ্বাস শর্তযুক্ত সম্ভাবনা যে এলোমেলোভাবে নির্বাচিত লেনদেনের সমস্ত আইটেম অন্তর্ভুক্ত থাকবে ফলস্বরূপ, লেনদেনে পূর্বের সমস্ত আইটেম অন্তর্ভুক্ত থাকে given

উপরোক্ত উদাহরণটি ব্যবহার করে, প্রত্যাশিত আত্মবিশ্বাস, এক্ষেত্রে, "আত্মবিশ্বাস, যদি এ এবং বি কেনার ফলে সি কেনার সম্ভাবনা বাড়ায় না means" এটি লেনদেনের সংখ্যার সাথে সাথে লেনদেনের মোট সংখ্যার দ্বারা বিভক্ত ফলাফল অন্তর্ভুক্ত করে। ধরুন সি এর জন্য মোট লেনদেনের সংখ্যা 5 হাজার। সুতরাং প্রত্যাশিত আত্মবিশ্বাস 5,000 / 1,00,000 = 5%। সুপারমার্কেট উদাহরণের জন্য লিফট = আত্মবিশ্বাস / প্রত্যাশিত আত্মবিশ্বাস = 40% / 5% = 8 অতএব, লিফ্ট এমন একটি মান যা আমাদের (পূর্ববর্তী) অংশটি প্রদত্ত তত্কালীন (ফলস্বরূপ) সম্ভাবনার বৃদ্ধি সম্পর্কে তথ্য দেয়। উত্স নিবন্ধটির লিঙ্কটি এখানে


2

লিফটটি নিয়মের গুরুত্ব পরিমাপের জন্য একটি পরিমাপ মাত্র

এই নিয়মটি এলোমেলো সুযোগের দ্বারা তালিকায় রয়েছে কিনা তা আমরা পরীক্ষা করে দেখছি বা আমরা প্রত্যাশা করছি

উত্তোলন = আত্মবিশ্বাস / প্রত্যাশিত আত্মবিশ্বাস


0

বলুন আমরা এমন একটি মুদি দোকানের উদাহরণ ব্যবহার করছি যা পূর্ববর্তী এবং ফলস্বরূপ একটি সমিতির নিয়মের বৈধতা পরীক্ষা করে নিচ্ছে (উদাহরণস্বরূপ: "যদি কোনও গ্রাহক রুটি কিনে থাকেন তবে তারা মাখনও কিনবেন")।

আপনি যদি সমস্ত লেনদেন দেখে থাকেন এবং এলোমেলোভাবে একটি পরীক্ষা করেন তবে সেই লেনদেনের ফলে যে সম্ভাবনা রয়েছে তা হ'ল "প্রত্যাশিত আত্মবিশ্বাস"। আপনি যদি পূর্ববর্তী সমস্ত লেনদেন দেখে থাকেন এবং এগুলি থেকে এলোমেলো লেনদেন নির্বাচন করেন তবে সেই লেনদেনের ফলে যে সম্ভাবনা রয়েছে তা হ'ল "আত্মবিশ্বাস"। "লিফট" মূলত এই দুটির মধ্যে পার্থক্য। উত্তোলনের মাধ্যমে, আমরা দুটি আইটেমের মধ্যে সম্পর্ক যাচাই করতে পারি যা উচ্চ আত্মবিশ্বাস (যদি আত্মবিশ্বাস কম হয় তবে উত্তোলনটি মূলত অপ্রাসঙ্গিক)।

তাদের যদি উচ্চ আত্মবিশ্বাস এবং নিম্ন উত্তোলন থাকে তবে আমরা এখনও জানি যে জিনিসগুলি প্রায়শই একসাথে কেনা হয় তবে আমরা জানি না যে পূর্ববর্তী কারণে পরিণতি ঘটছে বা এটি যদি কেবল একটি কাকতালীয় ঘটনা (সম্ভবত তারা উভয়ই একসাথে প্রায়ই কেনা হয় কারণ তারা উভয়ই খুব জনপ্রিয় পণ্য তবে একে অপরের সাথে কোনও ধরণের সম্পর্ক নেই)।

তবে, যদি আত্মবিশ্বাস এবং উত্তোলন উভয়ই উচ্চ হয়, তবে আমরা যুক্তিসঙ্গতভাবে ধরে নিতে পারি যে পূর্বসূরির কারণে ফলাফলটি ঘটছে । উত্তোলনটি যত বেশি হয়, সম্ভাবনা তত কম যে দুটি আইটেমের মধ্যে সম্পর্কটি কেবল একটি কাকতালীয় ঘটনা। গাণিতিক ভাষায়:

উত্তোলন = আত্মবিশ্বাস / প্রত্যাশিত আত্মবিশ্বাস

আমাদের উদাহরণস্বরূপ, যদি আমাদের নিয়মের আত্মবিশ্বাস বেশি ছিল এবং লিফটটি কম ছিল, এর অর্থ হ'ল প্রচুর গ্রাহক রুটি এবং মাখন কিনছেন, তবে আমরা জানি না এটি রুটি এবং মাখনের মধ্যে কিছু বিশেষ সম্পর্কের কারণে হয়েছে বা যদি রুটি এবং মাখন স্বতন্ত্রভাবে ব্যক্তিগতভাবে জনপ্রিয় আইটেম এবং তারা প্রায়শই মুদি গাড়িতে একসাথে দেখায় তা কেবল একটি কাকতালীয় ঘটনা। যদি আমাদের নিয়ম আস্থা বেশি এবং লিফট উচ্চ, এই পূর্বগামী এবং অনুবর্তী মধ্যে একটি প্রশংসনীয় দৃঢ় পারস্পরিক সম্পর্ক নির্দেশ করে, যার মানে হল আমরা যুক্তিসঙ্গতভাবে অনুমান করতে পারেন গ্রাহকদের মাখন কিনছেন কারণ এটা সত্য যে তারা রুটি কেনার করছে। উত্তোলন যত বেশি হবে আমরা এই সংস্থায় আরও আত্মবিশ্বাসী হতে পারি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.