হিস্টোগ্রাম সহ পারস্পরিক তথ্য (এমআই) নির্ধারণের জন্য বিনয়ের সেরা সংখ্যা নেই। সর্বোত্তম উপায় হ'ল পারলে বৈধতা যাচাইয়ের মাধ্যমে এটি চয়ন করা বা থাম্বের নিয়মের উপর নির্ভর করা। এই কারণেই হিস্টগ্রামের উপর ভিত্তি করে এমআইয়ের আরও অনেক অনুমান প্রস্তাব করা হয়েছে।
বিন সংখ্যা ডাটা পয়েন্টের মোট নম্বরে নির্ভর করবে । দুটি ভেরিয়েবলের মধ্যে যৌথ বিতরণের জন্য অনুমানের ত্রুটিগুলি এড়াতে আপনার অনেকগুলি বিন এড়ানোর চেষ্টা করা উচিত। দুটি ভেরিয়েবলের মধ্যে সম্পর্ক ক্যাপচার করতে আপনার খুব কম বিন্দু এড়ানো উচিত। প্রদত্ত যা উভয়ের জন্য সমান প্রস্থের বিনের সাথে একটি 2 ডি হিস্টগ্রাম তৈরি করে এবং আমি ব্যক্তিগতভাবে বেছে নেব:
এই ক্ষেত্রে গড়ে দুটি সমানভাবে বিতরণ করা এলোমেলো ভেরিয়েবলের জন্য আপনার কমপক্ষে কমপক্ষে পয়েন্ট থাকতে হবে হিস্টোগ্রামের প্রতিটি কক্ষ:
এনnp.histogram2d(x, y, D)
D
x
y
ডি = ⌊এন / 5---√⌋
5এনডিএক্সডিওয়াই≥ 5 ⇒এনডি2≥ 5 ⇒ডি2≤ এন / 5 ⇒ ডি = ⌊এন / 5---√⌋
এটি একটি সম্ভাব্য পছন্দ যা প্রস্তাবিত অভিযোজিত পার্টিশন পদ্ধতির সিমুলেট করে
(সেলুচি, 2005) । জেনেটিক নেটওয়ার্কগুলি অনুমান করতে এমআই অনুমান করার জন্য পরবর্তী পদ্ধতিটি প্রায়শই ব্যবহৃত হয়: যেমন
মিডারে ।
আপনি ডাটা পয়েন্টের প্রচুর থাকে তাহলে এবং কোন অনুপস্থিত মানের আপনি বিন শ্রেষ্ঠ সংখ্যা খুঁজে নেওয়ার বিষয়ে খুব বেশী চিন্তা করা উচিত নয়; উদাহরণস্বরূপ যদি । যদি এটি না হয় তবে আপনি সীমাবদ্ধ নমুনার জন্য এমআই সংশোধন করার কথা বিবেচনা করতে পারেন। (স্টুয়ার এট আল।, ২০০২) জেনেটিক নেটওয়ার্ক ইনফরমেশন কার্যের জন্য এমআইয়ের জন্য কিছু সংশোধন নিয়ে আলোচনা করেছে।এনএন = 100 , 000
হিস্টোগ্রামের জন্য বিনের সংখ্যা নির্ধারণ করা একটি পুরানো সমস্যা। আপনি এই আগ্রহী হতে পারে আলাপ এমআই জন্য বিন সংখ্যা আনুমানিক হিসাব সম্পর্কে Lauritz Dieckman দ্বারা। এই আলাপটি নিউরাল টাইম-সিরিজ সম্পর্কে মাইক এক্স কোহেনের বইয়ের একটি অধ্যায়ের ভিত্তিতে তৈরি ।
আপনি এবং স্বাধীনভাবে বেছে পারেন এবং 1 ডি হিস্টোগ্রামে সংখ্যা নির্ধারণের জন্য ব্যবহৃত থাম্বের নিয়মটি ব্যবহার করতে পারেন।ডিএক্সডিওয়াই
ফ্রিডম্যান-ডায়াকোনিসের নিয়ম (বিতরণ সম্পর্কে কোনও ধারণা নেই):
where হ'ল 75-কোয়ান্টাইল এবং 25-কোয়ান্টাইলের মধ্যে পার্থক্য। এসই সম্পর্কিত এই প্রশ্নটি দেখুন ।
ডিএক্স= ⌈সর্বাধিক এক্স- মিনিট এক্স2 ⋅ আইকিউআর ⋅এন- 1 / 3⌉
IQR
স্কটের নিয়ম (স্বাভাবিকতা অনুমান):
যেখানে স্ট্যান্ডার্ড বিচ্যুতি জন্য ।
ডিএক্স= ⌈সর্বাধিক এক্স- মিনিট এক্স3.5. 3.5 ⋅গুলিএক্স⋅এন- 1 / 3⌉
গুলিএক্সএক্স
স্ট্রাগসের নিয়ম ( সংখ্যাকে অবমূল্যায়ন করতে পারে তবে বড় পক্ষে ভাল ):
এন
ডিএক্স= ⌈ 1 +লগ2এন ⌉
হিস্টোগ্রাম সহ এমআই সঠিকভাবে অনুমান করা কঠিন। তারপরে আপনি অন্য কোনও অনুমানকারী চয়ন করতে পারেন:
- ক্রেস্কোভের এনএন অনুমানক , যা প্যারামিটার পছন্দটি সম্পর্কে কিছুটা সংবেদনশীল: বা নিকটতম প্রতিবেশী প্রায়শই ডিফল্ট হিসাবে ব্যবহৃত হয়। কাগজ: (ক্রস্কভ, 2003)টকে = 4কে = 6
- কার্নেলের সাথে এমআইয়ের অনুমান (মুন, 1995) ।
এমআই অনুমান করার জন্য প্রচুর প্যাকেজ রয়েছে:
- পাইথনের জন্য নন-প্যারামেট্রিক এন্ট্রপি অনুমানের সরঞ্জাম বাক্স। সাইটে ।
- জাভাতে তথ্য-গতিশীলতার সরঞ্জামকিট তবে পাইথনের জন্যও উপলব্ধ। সাইটে ।
- মতলব আইটিই সরঞ্জামবাক্স। সাইটে ।