পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

26
প্রতিটি পরিসংখ্যানবিদ একক সবচেয়ে প্রভাবশালী বই পড়া উচিত?
আপনি যদি সময় মতো ফিরে যেতে পারেন এবং নিজেকে একজন স্ট্যাটিস্টিশিয়ান হিসাবে ক্যারিয়ারের শুরুতে একটি নির্দিষ্ট বই পড়তে বলতে পারেন তবে এটি কোন বইটি হবে?
77 references 

7
পরিসংখ্যান 'বড় সমস্যা' কি কি?
গণিতে রয়েছে বিখ্যাত সহস্রাব্দের সমস্যা (এবং, historতিহাসিকভাবে হিলবার্টের ২৩ ), এমন প্রশ্ন যা ক্ষেত্রের দিকটি গঠনে সহায়তা করেছিল। আমার কাছে কিছুটা ধারণা নেই, তবে রিমন হাইপোথেসিস এবং পি বনাম এনপি এর পরিসংখ্যানগুলি কী হবে। তাহলে, পরিসংখ্যানগুলিতে অবিচ্ছিন্ন প্রশ্নগুলি কী? যুক্ত করার জন্য সম্পাদিত: আমি যে উত্তরটির সন্ধান করছি তার সাধারণ …
77 history 

9
গণিতবিদ একটি মানের স্ট্যাটাস ডিগ্রির সমতুল্য জ্ঞান চান
আমি মানুষের সদৃশ বন্ধ করতে তাই আমি ভালবাসেন না একটি রেফারেন্স চাওয়ার থেকে শুরু শেখার পরিসংখ্যান (যেমন এখানে )। আমার কাছে গণিতে ডক্টরেট আছে তবে পরিসংখ্যান কখনও শিখিনি। শীর্ষস্থানীয় বিএস পরিসংখ্যান ডিগ্রির সমতুল্য জ্ঞানের সবচেয়ে সংক্ষিপ্ততম পথটি কী এবং আমি যখন এটি অর্জন করেছি তখন কীভাবে পরিমাপ করব। যদি বইগুলির …

6
টি-এসএনইয়ের আউটপুটটিতে ক্লাস্টারিং
আমি একটি অ্যাপ্লিকেশন পেয়েছি যেখানে ক্লাস্টারগুলির মধ্যে উপগোষ্ঠী প্রভাবগুলি সন্ধান করার আগে এটি একটি গোলমাল ডেটাसेट ক্লাস্টার করা সহজ হবে। আমি প্রথমে পিসিএর দিকে নজর দিয়েছি, তবে 90% পরিবর্তনশীলতা পেতে 30 ডলার উপাদান লাগে, সুতরাং পিসির মাত্র দু'একজনকে ক্লাস্টিং করা অনেক তথ্য ফেলে দেয়। আমি তখন টি-এসএনই (প্রথমবারের জন্য) চেষ্টা …


5
পদক্ষেপের প্রতিরোধের আধুনিক, সহজেই ব্যবহৃত বিকল্পগুলি কী কী?
আমার প্রায় 30 টি স্বাধীন ভেরিয়েবল সহ একটি ডেটাসেট রয়েছে এবং তাদের এবং নির্ভরশীল ভেরিয়েবলের মধ্যে সম্পর্কটি অনুসন্ধান করার জন্য একটি জেনারেলাইজড লিনিয়ার মডেল (জিএলএম) তৈরি করতে চাই। আমি সচেতন যে এই পরিস্থিতির জন্য আমাকে যে পদ্ধতিটি শিখানো হয়েছিল, ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে …

14
"সমস্ত মডেলগুলি ভুল, তবে কিছু দরকারী" এর অর্থ কী?
"মূলত, সমস্ত মডেল ভুল, তবে কিছু কার্যকর।" --- বক্স, জর্জ ইপি; নরম্যান আর ড্রাগার (1987)। এমিরিকাল মডেল-বিল্ডিং এবং প্রতিক্রিয়া সারফেস, পি। 424, উইলে আইএসবিএন 0471810339। উপরের বাক্যটির অর্থ কী?
76 modeling 

3
বৈশিষ্ট্য নির্বাচন এবং ক্রস-বৈধতা
আমি সম্প্রতি এই সাইটে (@ অ্যানিকো, @ ডিকরান মার্সুপিয়াল, @ এরিক) এবং অন্য কোথাও ক্রস বৈধকরণের সাথে অতিরিক্ত মানানসই সমস্যা সম্পর্কে অনেক কিছু পড়ছি - (স্মিওলোস্কি এট আল 2010 বায়োইনফরম্যাটিকস, হ্যাস্টি, স্ট্যাটিস্টিকাল লার্নিং এর উপাদান)। পরামর্শটি হ'ল ক্রস বৈধকরণ (বা বুটস্ট্র্যাপিংয়ের মতো অন্যান্য মডেল অনুমানের পদ্ধতি) ব্যবহার করে মডেল পারফরম্যান্স …

1
সহায়তা ভেক্টর মেশিনগুলি বুঝতে আমাকে সহায়তা করুন
একটি সাপোর্ট ভেক্টর মেশিনের লক্ষ্যটি বিভিন্ন ইনপুটকে বিভিন্ন শ্রেণিতে সেট করে শ্রেণীবদ্ধ করার ক্ষেত্রে কীসের মূল বিষয়গুলি আমি তা বুঝতে পারি, তবে যা আমি বুঝতে পারি না সেগুলি হ'ল নিতান্ত-কৌতুকপূর্ণ বিবরণ। প্রারম্ভিকদের জন্য, আমি স্ল্যাক ভেরিয়েবলগুলি ব্যবহার করে কিছুটা বিভ্রান্ত। তাদের উদ্দেশ্য কী? আমি একটি শ্রেণিবিন্যাসের সমস্যাটি করছি যেখানে আমি …

6
মেশিন লার্নিংয়ের ক্রস-বৈধতা সম্পাদন করার সময় "চূড়ান্ত" মডেলের জন্য বৈশিষ্ট্য নির্বাচন
বৈশিষ্ট্য নির্বাচন এবং মেশিন লার্নিং সম্পর্কে আমি কিছুটা বিভ্রান্ত হয়ে পড়ছি এবং আমি ভাবছিলাম যে আপনি আমাকে সাহায্য করতে পারেন কিনা। আমার কাছে একটি মাইক্রোআরে ডেটাসেট রয়েছে যা দুটি গ্রুপে শ্রেণিবদ্ধ করা হয়েছে এবং বৈশিষ্ট্যগুলির সংখ্যা রয়েছে। আমার লক্ষ্য হ'ল একটি স্বাক্ষরে স্বল্প সংখ্যক জিন (আমার বৈশিষ্ট্য) (10-20) পাওয়া যে …

3
লাসো কেন পরিবর্তনীয় নির্বাচন সরবরাহ করে?
আমি পরিসংখ্যানগত শিক্ষার উপাদানগুলি পড়ছি এবং আমি জানতে চাইছি কেন লাসো পরিবর্তনশীল নির্বাচন এবং রিজ রিগ্রেশনটি সরবরাহ করে না। উভয় পদ্ধতি স্কোয়ারের অবশিষ্টাংশকে ছোট করে এবং পরামিতিগুলির সম্ভাব্য মানগুলি একটি সীমাবদ্ধতা রাখে । লাসোর জন্য, প্রতিবন্ধকতা হ'ল , অন্যদিকে কিছুটা জন্য এটি ।ββ\beta||β||1≤t||β||1≤t||\beta||_1 \le t||β||2≤t||β||2≤t||\beta||_2 \le tttt আমি বইটিতে হীরা …

3
কেন লজিস্টিক রিগ্রেশনকে লজিস্টিক শ্রেণিবিন্যাস বলা হয় না?
লজিস্টিক রিগ্রেশন যেহেতু শ্রেণিবদ্ধ নির্ভরশীল ভেরিয়েবলগুলির সাথে সম্পর্কিত একটি পরিসংখ্যানগত শ্রেণিবদ্ধকরণ মডেল , কেন এটি লজিস্টিক শ্রেণিবিন্যাস বলা হয় না ? "রিগ্রেশন" নামটি কি অবিচ্ছিন্ন নির্ভরশীল ভেরিয়েবলগুলির সাথে সম্পর্কিত মডেলগুলিতে সংরক্ষণ করা উচিত নয়?

3
কোনও প্রকাশনায় এলোমেলো বন উপস্থাপনের সেরা উপায়?
আমি আনুষঙ্গিক বৈশিষ্ট্য সহ একটি মাইক্রোরে স্টাডিতে দুটি গ্রুপের শক্তিশালী শ্রেণিবদ্ধ হিসাবে এলোমেলো বন অ্যালগরিদম ব্যবহার করছি using এলোমেলো অরণ্য উপস্থাপনের সর্বোত্তম উপায় কী যাতে কোনও কাগজে পুনরুত্পাদনযোগ্য করার পর্যাপ্ত তথ্য রয়েছে? অল্প সংখ্যক বৈশিষ্ট্য থাকলে, আসলে গাছের চক্রান্ত করার জন্য কি আর কোনও প্লট পদ্ধতি রয়েছে? ত্রুটির হারের ওওবি …

5
অপেক্ষার প্যারাডক্সটি ব্যাখ্যা করুন
কয়েক বছর আগে আমি একটি রেডিয়েশন ডিটেক্টর ডিজাইন করেছি যা ইভেন্টগুলির মধ্যে গণনা না করে তার মধ্যবর্তী ব্যবধান পরিমাপ করে কাজ করে। আমার ধারণাটি ছিল, অ-সংগতিপূর্ণ নমুনাগুলি পরিমাপ করার সময়, আমি প্রকৃত বিরতিতে অর্ধেক পরিমাপ করি। যাইহোক যখন আমি ক্যালিব্রেটেড উত্স দিয়ে সার্কিটটি পরীক্ষা করি তখন পঠন দুটি খুব উচ্চতার …

3
লজিস্টিক রিগ্রেশন জন্য ডায়াগনস্টিকস?
লিনিয়ার রিগ্রেশন এর জন্য, আমরা লিনিয়ার রিগ্রেশন অনুমান লঙ্ঘন করা হয়েছে কিনা তা পরীক্ষা করতে ডায়াগনস্টিক প্লটগুলি (রেসিডুয়াল প্লটস, নরমাল কিউকিউ প্লট ইত্যাদি) পরীক্ষা করতে পারি। লজিস্টিক রিগ্রেশন এর জন্য, আমার এমন সংস্থানগুলি খুঁজে পেতে সমস্যা হচ্ছে যেগুলি লজিস্টিক রিগ্রেশন মডেলকে কীভাবে ফিট করতে পারে তা নির্ধারণ করে। জিএলএমের জন্য …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.