টি-ডিস্ট্রিবিউটড স্টোকাস্টিক নেবার এম্বেডিং (টি-এসএনই) মাত্রা হ্রাসের জন্য একটি ( পুরষ্কার-বিজয়ী ) কৌশল যা উচ্চ মাত্রিক ডেটাসেটগুলির ভিজ্যুয়ালাইজেশনের জন্য বিশেষভাবে উপযুক্ত।
সুতরাং এটি বেশ দুর্দান্ত লাগে, কিন্তু এটি লেখক কথা বলছেন।
লেখকের আর একটি উক্তি (পুনরায়: পূর্বোক্ত প্রতিযোগিতা):
আপনি এই প্রতিযোগিতা থেকে কি দূরে সরিয়ে নিয়েছেন?
আপনি ডেটাতে ভবিষ্যদ্বাণীদের প্রশিক্ষণ দেওয়া শুরু করার আগে সর্বদা আপনার ডেটাটিকে প্রথমে ভিজ্যুয়ালাইজ করুন! প্রায়শই, ভিজুয়ালাইজেশন যেমন আমার তৈরি করা ডেটা বিতরণের অন্তর্দৃষ্টি দেয় যা কোন ধরণের পূর্বাভাস মডেলগুলি চেষ্টা করে তা নির্ধারণ করতে আপনাকে সহায়তা করতে পারে।
তথ্য 1 টি হারিয়ে যেতে হবে - এটি পুরোপুরি একটি মাত্রিকতা হ্রাস কৌশল technique তবে ভিজ্যুয়ালাইজ করার সময় এটি যেহেতু ব্যবহারের জন্য একটি ভাল কৌশল, তাই হারিয়ে যাওয়া তথ্য হাইলাইট করা তথ্যের চেয়ে কম মূল্যবান (/ তৈরি করা 2/3 মাত্রার হ্রাসের মাধ্যমে উপলব্ধ / উপলব্ধ)।
সুতরাং আমার প্রশ্নটি হ'ল:
- টিএসএনই কখন কাজের জন্য ভুল সরঞ্জাম?
- কী ধরণের ডেটাসেটগুলি এটি কাজ না করার কারণ করে,
- এটি কি ধরণের প্রশ্নের উত্তর বলে মনে হচ্ছে তবে এটি আসলে তা দিতে পারে না?
- উপরের দ্বিতীয় উদ্ধৃতিতে সর্বদা আপনার ডেটাসেটটি কল্পনা করার পরামর্শ দেওয়া হয়, এই ভিজ্যুয়ালাইজেশনটি কি সবসময় টিএসএনই দিয়ে করা উচিত?
আমি প্রত্যাশা করি যে এই প্রশ্নের উত্তরের কথোপকথনে সবচেয়ে ভাল উত্তর দেওয়া যেতে পারে, যেমন উত্তর দেওয়া: কখন কাজের জন্য টিএসএনই সঠিক সরঞ্জাম?
আমাকে কীভাবে সহজ ডেটা শ্রেণিবদ্ধযোগ্য হবে (ক্লাসে বিভক্ত - একটি বৈষম্যমূলক মডেল) তা বলার জন্য আমাকে টিএসএনইয়ের উপর নির্ভর না করার জন্য সতর্ক করা হয়েছে এটির বিভ্রান্তিকর উদাহরণটি হ'ল, নীচের দুটি চিত্রের জন্য, একটি জেনারেটরি মডেল 2 আরও খারাপ ছিল দ্বিতীয় / ডান (নির্ভুলতা 67.2%) এর সমতুল্য একের চেয়ে প্রথম / বামে (নির্ভুলতা 53.6%) ভিজ্যুয়ালাইজ করা তথ্যের জন্য
1 আমি এই সম্পর্কে ভুল হতে পারি আমি বসে থাকতে পারি এবং পরে কোনও প্রমাণ / পাল্টা উদাহরণ চেষ্টা করতে পারি
2 দ্রষ্টব্য যে জেনারেটরি মডেলটি বৈষম্যমূলক মডেলের মতো নয়, তবে এটি আমার দেওয়া উদাহরণ।