অনুপাত রূপান্তর সম্পর্কে মূল প্রশ্ন (আমি প্রতীক হিসাবে ব্যবহার করব , একইভাবে তবে আপনার স্বীকৃতিতে অভিন্ন নয়) কিছু সাধারণ মন্তব্যের অনুমতি দেয়।এক্স
এরপরে আমি এটিকে কীভাবে গ্রহণ করি যে অনুগ্রহকারীদের (অনুমানকারী, স্বতন্ত্র ভেরিয়েবল) অনুপাতের রূপান্তর করার মূল উদ্দেশ্যটি হ'ল সম্পর্কের সীমাবদ্ধতার সান্নিধ্যে উন্নতি করা, বা যদি অনুসন্ধানী মোডে চিত্রের প্রকৃতি বা প্রকৃতপক্ষে অস্তিত্বের গ্রাফিকভাবে আরও পরিষ্কার ধারণা পাওয়া যায় কোন সম্পর্ক। কোনও কোভেরিয়াট (উদাঃ) প্রায় সাধারণভাবে বিতরণ করা হয়েছে কিনা তা যথারীতি যেমন গুরুত্বপূর্ণ নয়। (অনুপাতগুলি মানগুলির সাথে সূচক ভেরিয়েবলগুলির খুব দূরের সম্পর্কযুক্ত নয় যা কখনও কখনও সাধারণত বিতরণ করা যায় না এবং অনুপাতগুলিও আবশ্যকভাবে আবদ্ধ হয়))0 , 1
যদি অনুপাতগুলি সঠিক শূন্য বা যথাযথগুলি অর্জন করতে পারে, তবে এই সীমাগুলির জন্য একটি রূপান্তরটি সংজ্ঞায়িত করা অপরিহার্য, যা স্পষ্টভাবে rules এক্সকে নিয়ম করে , যেমন অনির্দিষ্ট। বিয়ন্ড একটি নির্দিষ্ট আকৃতি আদর্শভাবে কিছু বাস্তব (বৈজ্ঞানিক, ব্যবহারিক) আত্মপক্ষ সমর্থন প্রয়োজন, কিন্তু উদাসীন এটি কিছু সহজ বিশ্লেষণের অনুসরণ যে অত্যন্ত মূল্য সংবেদনশীল , আপনি প্রজ্ঞান। লগ 0 লগ ( এক্স + সি ) সিলগএক্সলগ0লগ( এক্স + সি )গ
বেস তে লগারিদমগুলি দেখতে এটি আরও সহজ , সুতরাং অস্থায়ীভাবে যাতে মানচিত্র থেকে ।সি = 10 কে লগ 10 ( এক্স + 10 কে ) x = 0 কে10সি = 10টলগ10( x + 10)ট)x = 0ট
সুতরাং মানচিত্র থেকে এবং থেকে প্রায় , যখন মানচিত্র থেকে এবং কেবল বেশি স্মিডজেনে ।এক্স = 0 0 এক্স = 1 0.301 কে = - 3 , সি = 0.001 এক্স = 0 - 3 এক্স = 1 0কে = 0 , সি = 1x = 00x=10.301k=−3,c=0.001x=0−3x=10
একইভাবে, যাই হোক না কেন অর্থ এই একই সীমাতে ম্যাপ করা হয়েছে, যখন ক্রমবর্ধমান ভাল আনুমানিক তে ম্যাপ করা হয়েছে ।0 এক্স = 1 0k=−6,−9,0x=10
সুতরাং নীচের সীমাটি ছোট এবং আরও সংযুক্ত ধ্রুবক দিয়ে বাইরের দিকে প্রসারিত হয় , যখন উপরের সীমাটি প্রায় একই থাকে। এই ধরণের রূপান্তরগুলি পরিসীমাটির নীচের অংশটিকে প্রসারিত করতে পারে এবং বা এর কাছাকাছি খুব কম মান থেকে আউটলিয়ার তৈরি করতে পারে ।0c0
সহজভাবে, লোকেদের সম্ভবত এটি ধারণা করা যায় যে (আপনার পছন্দ অনুসারে যে কোনও বেসে) ছোট জন্য সাথে খুব অনুরূপ আচরণ করা উচিত , এটি বড় ক্ষেত্রে স্পষ্ট সত্য , তবে মোটেই সত্য নয় । তা না হলে করা, এর steeper এবং steeper ঢাল এর কার্যকারিতা হিসেবে যেমন এখানে দান্ত দিয়া ফুটা করা করতে খুব কঠিন।লগ এক্স সি এক্স এক্স লগ এক্স এক্স x ↓ 0log(x+c)logxcxxlogxxx↓0
নিকটে আরও ধীরে ধীরে পরিবর্তিত রূপান্তরগুলিতে ফোকাস করা ভাল বলে মনে হয় এবং সাথে সম্পর্কিত, তবে সম্পর্কিত, কারণে) এছাড়াও কাছাকাছি ।x = 1x=0x=1
স্কোয়ার শিকড় এবং কিউব শিকড় এবং অন্যান্য শক্তি পুরোপুরি জন্য সংজ্ঞায়িত এবং যখন নিকটে মানগুলি প্রসারিত করার প্রয়োজন হয় তখন প্রায়শই সহায়তা করে । তবে এই রূপান্তরগুলি সুপরিচিত এবং আমি এখানে আরও একটি সম্ভাবনার দিকে ফোকাস করি। এক্স = 0 , 1 0xpx=0,10
ভাঁজ শক্তির পরিবার জেডাব্লু টুকি দ্বারা জনপ্রিয় ( এক্সপ্লোরার ডেটা অ্যানালাইসিস , রিডিং, এমএ: অ্যাডিসন-ওয়েসলি, 1977) এক সম্ভাবনা, এবং এটি হ'ল
। যদিও সরল উদ্দীপনাজনিত নামগুলিকে অনুমতি দেয় এমন ক্ষমতা বাছাই করার কোনও বাধ্যবাধকতা নেই, তবে পছন্দগুলি (ভাঁজ করা রুট) এবং (ভাঁজ ঘনমূল) এই পরিবারের সবচেয়ে কার্যকর সদস্য বলে মনে হয়। পি = 1 / 2 পি = 1 / 3xp−(1−x)pp=1/2p=1/3
পরিবার বর্ণনার অনুরূপ পরিচিত logit রূপান্তর এবং প্রকৃতপক্ষে logit একটি সীমিত ক্ষেত্রে দেখা যায় যেমন থাকে । মূল পার্থক্য হ'ল ভাঁজ করা শক্তিগুলি এবং জন্য সংজ্ঞায়িত করা হয় ।logit x=logx−log(1−x)p0x=0,1p≠0
ভাঁজযুক্ত ক্ষমতাগুলি, এখন লগইট সহ এবং নিকটবর্তী চরম ক্ষেত্রেগুলি স্কিউ-প্রতিসাম্যিকভাবে চিকিত্সা করে এবং প্লটটিকে বিপরীত সিগময়েড বক্ররেখ হিসাবে বিবেচনা করে (নীচে কিছু গ্রাফ) সংযোজক এবং গুণগত আচরণ মিশ্রণ করে, ঘন ঘন গুণগত প্রতিধ্বনিত হয় (যদি শারীরিক, জৈবিক, অর্থনৈতিক না হয়) অন্তর্নিহিত ঘটনাটির জন্য তথ্যগুলি01
থেকে বলার পার্থক্য একটি "বিগ ডিল" হতে পারে (নিশ্চিত, কেবল দ্বারা পরিবর্তিত হয় তবে এটি দ্বিগুণও হয়)0.010.02x0.01
থেকে বলার পার্থক্যটিও "বিগ ডিল" হতে পারে (নিশ্চিত, কেবল দ্বারা পরিবর্তিত হয় তবে "ভগ্নাংশ" ছাড়াই অর্ধেকও হয়ে যায়)0.980.99x0.011−x
থেকে বলার পার্থক্য "কম চুক্তি" হতে পারে (নিশ্চিত, দ্বারা পরিবর্তিত হয় তবে আনুপাতিক পরিবর্তনটি অনেক কম)0.500.51x0.01
কিছু অন্তর্নিহিত গতিশীলতা যখন কল্পনা করা হয় তখন এটি ভাবতে সবচেয়ে সহজ: শিক্ষিত লোকদের ক্রমবর্ধমান ভগ্নাংশের সার্বজনীন সাক্ষরতার অসম্পূর্ণতার কাছে যাওয়ার সাথে সাথে গতি বাড়িয়ে ধীরে ধীরে ধীরে ধীরে ধীরে ধীরে ধীরে ধীরে এগিয়ে যায়। সুতরাং সময়ে বক্ররেখা একটি বর্ধনশীল বা হ্রাসমান লজিস্টিকের অনুরূপ হতে পারে। সত্য যে এবং অনুপাত আরও কাছে বা ধীরে ধীরে আরো স্বাভাবিকভাবেই logit এবং আনুপাতিক প্রতিক্রিয়া জন্য অনুরূপ মডেলের জন্য বিভিন্ন প্রেরণার অন্যতম; যদিও আমরা এখানে আনুপাতিক covariates উপর ফোকাস করছি, সিগময়েডগুলি এখানেও দরকারী হতে পারে।01
ভাঁজযুক্ত রুট বা ঘনক্ষেত্রের মতো ভাঁজযুক্ত শক্তিগুলি লগইটের মতো দৃig়ভাবে সিগময়েড হয় না, তবে এখানে একটি মূল্যবান যোগ্যতা হ'ল জন্য ফজ, ক্লেজ বা নজ ছাড়া সরাসরি এবং সহজে সংজ্ঞায়িত হওয়া ।x=0,1
আপনার জাল কিন্তু আপাতদৃষ্টিতে বাস্তববাদী ডেটাসেটের দিকে ফেরা (যা আমি নিজের পছন্দের সফ্টওয়্যারটিতে আমদানি করেছিলাম তবে বিশ্লেষণটি কোনও শালীন মধ্যে সহজ), দেখা যাচ্ছে যে এই রূপান্তরগুলির কোনওটিই আদৌ সহায়তা করে না। তবে ডেটা গ্রাফিকিং একটি স্পষ্ট সতর্কতা দেয় যে একটি শক্তিশালী শক্তিশালী রূপান্তর, এটি সরাসরি প্লট করেও দেখা যায়।log(x+0.001)
আমি যে দুটি প্রধান পয়েন্টটি তৈরি করতে চাই তা হ'ল তা
log(x+c) প্রায়শই পরামর্শ দেওয়া হয়, এবং প্রায়শই আপাতদৃষ্টিতে নিরীহ হিসাবে বিবেচিত হয়, এটি ক্ষতিকারক রূপান্তর হিসাবে বোঝা যায় এবং প্রায়শই অনুপযুক্ত না হয় যখনই এটি ক্ষুদ্রতর জন্য বিতরণকে প্রসারিত করে না (যদি না এটি সত্যই পছন্দসই আচরণ না হয়)।x
আপনার উদাহরণস্বরূপ ডেটার জন্য, আমি চেষ্টা করেছি এমন কোনও রূপান্তর সাহায্য করার মতো বলে মনে হচ্ছে না।
একই সময়ে, অন্যান্য সম্ভাবনাগুলি ক্লান্ত থেকে দূরে। (উল্লেখযোগ্যভাবে, আমি স্কোয়ার রুট বা কিউব রুট চেষ্টা করিনি, এবং জোর দিয়েছি যে অন্য অনেক সমস্যায় এগুলি সুস্পষ্ট এবং গুরুতর প্রার্থী হতে পারে))
গ্রাফের প্রথম সেটটি সহজেই অনুপাতের জন্য কিছু প্রার্থীর রূপান্তরগুলি দেখায় যা এবং উভয়ই অর্জন করতে পারে । (আমি প্রাকৃতিক লোগারিদম ব্যবহার করেছি, তবে আকারগুলি বেসের উপর নির্ভর করে নির্ভর করে না)।01
গ্রাফের দ্বিতীয় সেট উদাহরণের ডেটাগুলির জন্য কোনও রূপান্তর দেখায় না। (তুলনার জন্য, মূল ডেটার উপর একটি সরল রিগ্রেশন %, আরএমএসই 0.994 দেয় ))R2=3.7=0.994
ছোট ধাঁধা আপনার অনুপাত হিসাবে বলা হয় তবে এর মানগুলি থেকে এর কাছাকাছি ।y610
সম্পাদনা: মূল ডেটা এখানে প্লট করা যেতে পারে কারণ ওপি সংক্ষিপ্তভাবে ডেটা পোস্ট করেছিল তবে পরে সেগুলি মুছে ফেলা হয়েছে।
ভাঁজযুক্ত শক্তি ব্যবহার করে এখানে অন্যান্য থ্রেডের মধ্যে রয়েছে
অনুপাতের ডেটা রূপান্তরকরণ: যখন আরকসিন বর্গমূল যথেষ্ট হয় না
রিগ্রেশন: কম আর স্কোয়ার্ড এবং উচ্চ পি-মান সহ স্ক্যাটারপ্ল্লট
একটি উচ্চ স্কিউ ডেটাসেট প্লট করুন