এসকিউএল সার্ভারের কাছে "মাল্টি-কলামের পরিসংখ্যান" নামে একটি জিনিস রয়েছে তবে এটির অর্থ কী তা মনে হয় তা নয়।
আসুন নীচের নমুনা টেবিলটি একবার দেখুন:
CREATE TABLE BadStatistics
(
IsArchived BIT NOT NULL,
Id INT NOT NULL IDENTITY PRIMARY KEY,
Mystery VARCHAR(200) NOT NULL
);
CREATE NONCLUSTERED INDEX BadIndex
ON BadStatistics (IsArchived, Mystery);
এটির সাথে, আমাদের দুটি সূচকগুলিতে দুটি পরিসংখ্যান তৈরি করা হচ্ছে:
BadIndex এর পরিসংখ্যান:
+--------------+----------------+-------------------------+
| All density | Average Length | Columns |
+--------------+----------------+-------------------------+
| 0.5 | 1 | IsArchived |
+--------------+----------------+-------------------------+
| 4.149378E-06 | 37 | IsArchived, Mystery |
+--------------+----------------+-------------------------+
| 4.149378E-06 | 41 | IsArchived, Mystery, Id |
+--------------+----------------+-------------------------+
+--------------+------------+---------+---------------------+----------------+
| RANGE_HI_KEY | RANGE_ROWS | EQ_ROWS | DISTINCT_RANGE_ROWS | AVG_RANGE_ROWS |
+--------------+------------+---------+---------------------+----------------+
| 0 | 0 | 24398 | 0 | 1 |
+--------------+------------+---------+---------------------+----------------+
| 1 | 0 | 216602 | 0 | 1 |
+--------------+------------+---------+---------------------+----------------+
ক্লাস্টারড ইনডেক্সের পরিসংখ্যান:
+--------------+----------------+---------+
| All density | Average Length | Columns |
+--------------+----------------+---------+
| 4.149378E-06 | 4 | Id |
+--------------+----------------+---------+
+--------------+------------+---------+---------------------+----------------+
| RANGE_HI_KEY | RANGE_ROWS | EQ_ROWS | DISTINCT_RANGE_ROWS | AVG_RANGE_ROWS |
+--------------+------------+---------+---------------------+----------------+
| 1 | 0 | 1 | 0 | 1 |
+--------------+------------+---------+---------------------+----------------+
| 240999 | 240997 | 1 | 240997 | 1 |
+--------------+------------+---------+---------------------+----------------+
| 241000 | 0 | 1 | 0 | 1 |
+--------------+------------+---------+---------------------+----------------+
(আমি এলোমেলোভাবে নমুনা ডেটা সহ টেবিলটি তৈরি করেছি যেখানে প্রায় সারিগুলির দশমাংশ সংরক্ষণাগারভুক্ত থাকে after পরে আমি একটি সম্পূর্ণ স্ক্যান পরিসংখ্যান আপডেট চালিয়েছি))
দ্বি-কলামের পরিসংখ্যানের হিস্টোগ্রামটি কেন কেবল একটি কলাম ব্যবহার করে? আমি জানি যে অনেক মানুষ এটি সম্পর্কে লিখিত আছে না , কিন্তু যুক্তিপূর্ণ কি? এই ক্ষেত্রে এটি পুরো হিস্টোগ্রামকে অনেক কম দরকারী করে তোলে, কারণ প্রথম কলামে কেবলমাত্র দুটি মান থাকে। পরিসংখ্যানগুলি কেন এমনভাবে নির্বিচারে সীমাবদ্ধ থাকবে?
দয়া করে নোট করুন যে এই প্রশ্নটি বহুমাত্রিক হিস্টোগ্রামগুলিকে বোঝায় না, যা সম্পূর্ণ ভিন্ন জন্তু। এটি একক মাত্রিক হিস্টোগ্রামগুলির সাথে একক মাত্রার সাথে সম্পর্কিত, একাধিক কলামগুলিকে ধারণ করে।