পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
একটি হিস্টোগ্রামের ভিত্তিতে ডেটা আনুমানিক বিতরণ মূল্যায়ন করা
ধরুন আমি দেখতে চাই যে আমার ডেটা হিস্টগ্রামের উপর ভিত্তি করে ক্ষতিকারক কিনা (অর্থাত্ ডান দিকে স্কুঙ্ক হয়েছে)। আমি কীভাবে ডেটা গ্রুপ করব বা বিন করব তার উপর নির্ভর করে আমি বুনোভাবে আলাদা হিস্টোগ্রাম পেতে পারি। হিস্টোগ্রামগুলির একটি সেট মনে হবে যে ডেটাটি এক্সপেনশনাল। অন্য সেটটি দেখে মনে হবে যে …

6
পিসিএ করার আগে কারও কি খুব বেশি সম্পর্কযুক্ত ভেরিয়েবলগুলি অপসারণ করা উচিত?
আমি একটি কাগজ পড়ছি যেখানে লেখক পিসিএ করার আগে অন্যান্য ভেরিয়েবলের সাথে উচ্চ সম্পর্কের কারণে বেশ কয়েকটি ভেরিয়েবল বাতিল করে দেয়। ভেরিয়েবলের মোট সংখ্যা প্রায় 20 টি। এটি কি কোনও সুবিধা দেয়? এটি আমার কাছে ওভারহেডের মতো দেখাচ্ছে কারণ পিসিএ এটি স্বয়ংক্রিয়ভাবে হ্যান্ডেল করা উচিত।
111 correlation  pca 

2
গ্রেডিয়েন্ট বুস্টিং ট্রি বনাম র্যান্ডম ফরেস্ট
ফ্রেডম্যান প্রস্তাবিত গ্রেডিয়েন্ট ট্রি বুস্টিং সিদ্ধান্ত কাঠ গাছগুলি বেস লার্নার হিসাবে ব্যবহার করে। আমি ভাবছি যে বেস ভিত্তি গাছটিকে যতটা সম্ভব জটিল (পুরোপুরি বড় হওয়া) বা সহজতর করা উচিত? পছন্দ জন্য কোন ব্যাখ্যা আছে? বেস লার্নার হিসাবে সিদ্ধান্ত গাছ ব্যবহার করে র্যান্ডম ফরেস্ট হল আরেকটি জাতীয় পদ্ধতি। আমার বোঝার উপর …

8
ফেসিয়াল ইমেজগুলির একটি ডাটাবেসে একটি প্রদত্ত চেহারা সনাক্ত করা
আমি টুইটার ব্যবহারকারীদের তাদের প্রোফাইল ছবিগুলির মাধ্যমে সংযুক্ত একটি ছোট প্রকল্পে কাজ করছি। আমি যে সমস্যার মুখোমুখি হয়েছি তা হ'ল আমি যে চিত্রগুলি পরিষ্কার পোর্ট্রেট ফটোগুলি ব্যতীত অন্য সমস্ত ফিল্টার আউট করার পরে, টুইটার ব্যবহারকারীদের একটি ছোট কিন্তু উল্লেখযোগ্য শতাংশ তাদের জাস্টিন বিবারের ছবিটিকে তাদের প্রোফাইল ছবি হিসাবে ব্যবহার করে। …

3
কি যদি অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয় তবে y হয় না?
আমি একটি অদ্ভুত প্রশ্ন পেয়েছি। ধরে নিন যে আপনার একটি ছোট নমুনা রয়েছে যেখানে আপনি একটি নির্ভরযোগ্য পরিবর্তনশীল যা আপনি একটি সাধারণ রৈখিক মডেল নিয়ে বিশ্লেষণ করতে যাচ্ছেন তা অত্যন্ত বামে। সুতরাং আপনি ধরে নিতে পারেন যে সাধারণত বিতরণ করেন না, কারণ এর ফলে সাধারণত বন্টিত হয় । তবে আপনি …

10
কাচি বিতরণের কোনও অর্থ নেই কেন?
বিতরণ ঘনত্ব ফাংশন থেকে আমরা নীচের গ্রাফের মতো কচী বিতরণের জন্য একটি গড় (= 0) সনাক্ত করতে পারি। তবে কেন আমরা বলি কচী বিতরণের কোনও অর্থ নেই?

6
পারস্পরিক সম্পর্ক এবং সমবায়তার মধ্যে পার্থক্যটি কীভাবে ব্যাখ্যা করবেন?
এই প্রশ্নটি অনুসরণ করে, আপনি কেবল যার অর্থ বোঝেন এমন ব্যক্তির সাথে আপনি কীভাবে অসঙ্গতিটি ব্যাখ্যা করবেন? , যা কোনও সাধারণ ব্যক্তির সাথে সমবায় ব্যাখ্যা করার বিষয়টি সম্বোধন করে, তা আমার মনে একই রকম প্রশ্ন উত্থাপন করেছে। কেউ কীভাবে কোনও পরিসংখ্যানকে বোঝাবেন যেহেতু সমবায় এবং পারস্পরিক সম্পর্কের মধ্যে পার্থক্য রয়েছে …

15
মার্কিন নির্বাচনের ফলাফল 2016: পূর্বাভাস মডেলগুলির মধ্যে কী ভুল হয়েছে?
প্রথমে এটি ছিল ব্রেক্সিট , এখন মার্কিন নির্বাচন। অনেকগুলি মডেল পূর্বাভাস বিস্তৃত ব্যবধানে বন্ধ ছিল এবং এখানে কি পাঠ শিখতে হবে? গতকাল পিএসটি সন্ধ্যা 4 টার দিকে, বাজি বাজারগুলি এখনও হিলারিকে 4 থেকে 1 এর পক্ষে ছিল। আমি এটি গ্রহণ করি যে বাজি বাজারগুলি, লাইনে আসল অর্থ দিয়ে, সেখানে উপলব্ধ …

5
একটি সাপোর্ট ভেক্টর মেশিন (এসভিএম) কীভাবে কাজ করে?
সাপোর্ট ভেক্টর মেশিন (এসভিএম) কীভাবে কাজ করে এবং লিনিয়ার পারসেপ্ট্রন , লিনিয়ার ডিসক্রিমেন্ট্যান্ট অ্যানালাইসিস বা লজিস্টিক রিগ্রেশন এর মতো অন্যান্য রৈখিক শ্রেণিবদ্ধদের থেকে কী আলাদা হয় ? * (* আমি অ্যালগরিদম, অপ্টিমাইজেশান কৌশল, সাধারণীকরণের ক্ষমতা এবং রান-টাইম জটিলতার জন্য অন্তর্নিহিত প্রেরণাগুলি বিবেচনা করছি )

4
বুটস্ট্র্যাপিংয়ে .632+ নিয়মটি কী?
এখানে @ গুং .632+ রুলের উল্লেখ করে। একটি দ্রুত গুগল অনুসন্ধান এই নিয়মের অর্থ কী এবং কী উদ্দেশ্যে এটি ব্যবহার করা হয় তা সহজেই বুঝতে সহজ উত্তর পাওয়া যায় না। কেউ কি .632+ বিধিটি ব্যাখ্যা করতে পারেন?
107 bootstrap 

6
ডেটা ম্যাট্রিক্স জন্য কি
প্রদত্ত ডেটা ম্যাট্রিক্স (কলামে ভেরিয়েবল এবং সারিগুলিতে ডেটা পয়েন্ট সহ) এর জন্য মনে হয় যে পরিসংখ্যানগুলিতে গুরুত্বপূর্ণ ভূমিকা পালন করে। উদাহরণস্বরূপ, এটি সাধারণ ন্যূনতম স্কোয়ারগুলির বিশ্লেষণাত্মক সমাধানের একটি গুরুত্বপূর্ণ অঙ্গ। বা, পিসিএর জন্য, এর আইজেনভেেক্টরগুলি হ'ল ডেটার প্রধান উপাদান।এ টি এএকজনAAএকজনটিএকজনATAA^TA আমি কীভাবে গণনা করব তা বুঝতে পেরেছি , তবে …

5
বৃহত আকারের পরিসংখ্যান বিশ্লেষণগুলি করার জন্য কোন দক্ষতার প্রয়োজন?
অনেক স্ট্যাটিস্টিকাল কাজ বড় আকারের ডেটা নিয়ে অভিজ্ঞতা চায়। পরিসংখ্যানগত এবং গণনা দক্ষতার ধরণের কি কি বড় ডেটা সেট সঙ্গে কাজ করার প্রয়োজন হবে। উদাহরণস্বরূপ, বিল্ডিং রিগ্রেশন মডেলগুলি কীভাবে 10 মিলিয়ন নমুনা সহ একটি ডেটা সেট দেয়?


7
শ্রেণিবদ্ধকরণের মডেলগুলি মূল্যায়নের জন্য নির্ভুলতা কেন সেরা মাপকাঠি নয়?
এটি একটি সাধারণ প্রশ্ন যা এখানে পরোক্ষভাবে একাধিকবার জিজ্ঞাসা করা হয়েছিল, তবে এর একক অনুমোদিত উত্তর নেই। রেফারেন্সটির জন্য এটির বিশদ উত্তরটি পাওয়া ভাল হবে। যথার্থতা , সমস্ত শ্রেণিবদ্ধের মধ্যে সঠিক শ্রেণিবিন্যাসের অনুপাত খুব সহজ এবং খুব "স্বজ্ঞাত" পরিমাপ, তবুও এটি ভারসাম্যহীন ডেটার জন্য একটি দরিদ্র পরিমাপ হতে পারে । …

6
নিউরাল নেটওয়ার্কে 1x1 কনভলিউশনটির অর্থ কী?
আমি বর্তমানে উদাসিটি গভীর শিখার টিউটোরিয়াল করছি। পাঠ 3 এ তারা 1x1 সমাবর্তন সম্পর্কে কথা বলে। এই 1x1 কনভোলশনটি গুগল ইনসেপশন মডিউলটিতে ব্যবহৃত হয়। 1x1 সমঝোতা কী তা বুঝতে আমার সমস্যা হচ্ছে। আমি ইয়ান লেকুনের এই পোস্টটিও দেখেছি। কেউ দয়া করে আমাকে এই ব্যাখ্যা করতে পারেন?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.