পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

7
টি-টেস্ট বা নন-প্যারামেট্রিক পরীক্ষার মধ্যে কীভাবে চয়ন করবেন, যেমন ছোট নমুনায় উইলকক্সন
কিছু অনুমানের স্টুডেন্টস ব্যবহার পরীক্ষা করা সম্ভব টন -test (হয়তো দুই নমুনা ক্ষেত্রে অসম ভেরিয়ানস জন্য ওয়েলশ এর সংশোধন ব্যবহার করে), অথবা দ্বারা Wilcoxon মত একটি অ-স্থিতিমাপ পরীক্ষা জোড় র্যাঙ্ক পরীক্ষা স্বাক্ষরিত, Wilcoxon-মান-হুইটনি ইউ পরীক্ষা, বা জোড়যুক্ত সাইন পরীক্ষা। কোন পরীক্ষাটি সবচেয়ে উপযুক্ত, বিশেষত যদি নমুনার আকার "ছোট" হয় তবে …

4
কর্নেল কী তা স্বজ্ঞাতভাবে ব্যাখ্যা করবেন?
অনেক মেশিন লার্নিং ক্লাসিফায়ার (যেমন সমর্থন ভেক্টর মেশিনগুলি) কার্নেল নির্দিষ্ট করার অনুমতি দেয়। কর্নেল কী তা বোঝানোর একটি স্বজ্ঞাত উপায় কী হবে? আমি যে দিকটি নিয়ে ভাবছিলাম তা হ'ল লিনিয়ার এবং অ-লিনিয়ার কার্নেলের মধ্যে পার্থক্য। সহজ কথায়, আমি 'লিনিয়ার সিদ্ধান্ত ফাংশন' একটি 'অ-লিনিয়ার সিদ্ধান্ত ফাংশন' বলতে পারি could তবে, আমি …

4
এসভিএমের জন্য কার্নেলটি কীভাবে নির্বাচন করবেন?
এসভিএম ব্যবহার করার সময়, আমাদের একটি কার্নেল নির্বাচন করতে হবে। আমি আশ্চর্য হই যে কীভাবে কার্নেলটি নির্বাচন করতে হয়। কার্নেল নির্বাচনের কোনও মানদণ্ড?

6
ব্যাকপ্রসারণ ছাড়াই কি নিউরাল নেটওয়ার্ক প্রশিক্ষণ দেওয়া সম্ভব?
অনেক নিউরাল নেটওয়ার্ক বই এবং টিউটোরিয়াল ব্যাকপ্রোপেশন অ্যালগরিদমের জন্য প্রচুর সময় ব্যয় করে, যা মূলত গ্রেডিয়েন্টটি গণনা করার একটি সরঞ্জাম। ধরে নেওয়া যাক আমরা ~ 10 কে পরামিতি / ওজন দিয়ে একটি মডেল তৈরি করছি। কিছু গ্রেডিয়েন্ট ফ্রি অপ্টিমাইজেশন অ্যালগরিদম ব্যবহার করে কী অপ্টিমাইজেশন চালানো সম্ভব? আমি মনে করি সংখ্যার …


2
"বুনোতে" পি-হ্যাকিং সম্পর্কে আমরা কতটা জানি?
ফ্রেজ পি -hacking (এছাড়াও: "তথ্য ড্রেজিং" , "গোপনে ভেদ" বা "মাছধরা"), যা কৃত্রিমভাবে পরিসংখ্যানগত ভাবে উল্লেখযোগ্য হয়ে ফলাফল পরিসংখ্যানগত কদাচার বিভিন্ন ধরণের বোঝায়। একটি "আরও উল্লেখযোগ্য" ফলাফল সংগ্রহের অনেকগুলি উপায় রয়েছে, এতে অন্তর্ভুক্ত তবে কোনওভাবেই সীমাবদ্ধ নয়: কেবলমাত্র তথ্যের একটি "আকর্ষণীয়" উপসেট বিশ্লেষণ , যাতে একটি প্যাটার্ন পাওয়া গেছে; একাধিক …

13
মাল্টিভিয়ারেট ডেটাতে আউটলিয়ারদের সনাক্ত করার সর্বোত্তম উপায় কী?
ধরুন আমার কাছে কমপক্ষে তিনটি ভেরিয়েবলের সাথে মাল্টিভারিয়েট ডেটার একটি বিশাল সেট রয়েছে। আমি কীভাবে বিদেশীদের খুঁজে পাব? পেয়ারওয়াই স্ক্যাটারপ্লটগুলি কাজ করবে না কারণ কোনও আউটলারের পক্ষে 3 টি মাত্রার উপস্থিতি সম্ভব যেগুলি 2 মাত্রিক উপ-স্পেসগুলির কোনওরূপে বহিরাগত নয়। আমি কোনও রিগ্রেশন সমস্যার কথা ভাবছি না, তবে সত্যিকারের বহুবিধ ডেটার …

30
অ-পরিসংখ্যানবিদদের জন্য আপনি কোন বইয়ের সুপারিশ করবেন?
পরিসংখ্যানবিদ নয় এমন বিজ্ঞানীদের জন্য আপনি কোন বইয়ের সুপারিশ করবেন? পরিষ্কার বিতরণ সবচেয়ে প্রশংসা করা হয়। পাশাপাশি সাধারণ কাজের জন্য উপযুক্ত কৌশল এবং পদ্ধতির ব্যাখ্যা: সময় সিরিজ বিশ্লেষণ, উপস্থাপনা এবং বড় ডেটা সেটগুলির সমষ্টি।
94 references 

5
পেশাদার / বিঘ্নের সাথে স্নায়ু নেটওয়ার্কগুলিতে অ্যাক্টিভেশন ফাংশনের বিস্তৃত তালিকা
এমন কোনও রেফারেন্স ডকুমেন্ট (গুলি) রয়েছে যা তাদের উপকার / কনস (এবং আদর্শভাবে কিছু প্রকাশনা যেখানে তারা সফল হয়েছিল বা এতো সফল ছিল না) সহ স্নায়বিক নেটওয়ার্কগুলিতে অ্যাক্টিভেশন ফাংশনগুলির একটি বিস্তৃত তালিকা দেয়?

6
প্রয়োজনীয় ডেটা চেকিং পরীক্ষা
আমার কাজের ভূমিকায় আমি প্রায়শই অন্যান্য লোকের ডেটাসেটের সাথে কাজ করি, অ-বিশেষজ্ঞরা আমাকে ক্লিনিকাল ডেটা নিয়ে আসে এবং আমি তাদের এটি সংক্ষিপ্ত করতে এবং পরিসংখ্যান পরীক্ষা করতে সহায়তা করি। আমার যে সমস্যাটি হচ্ছে তা হ'ল আমি যে ডেটাসেটগুলি নিয়ে এসেছি তা প্রায় সবসময় টাইপস, অসঙ্গতি এবং অন্যান্য সমস্ত ধরণের সমস্যার …

3
আপনি কীভাবে নির্ভুলতা গণনা করবেন এবং বিভ্রান্তির ম্যাট্রিক্স ব্যবহার করে মাল্টিক্লাস শ্রেণিবিন্যাসের জন্য পুনরায় কল করবেন?
আমি আশ্চর্য হয়েছি যে কীভাবে নির্ভুলতা গণনা করা যায় এবং একটি বহু-শ্রেণীর শ্রেণিবিন্যাস সমস্যার জন্য কনফিউশন ম্যাট্রিক্স ব্যবহার করে পুনরুদ্ধার করা যায়। বিশেষত, একটি পর্যবেক্ষণ কেবল তার সর্বাধিক সম্ভাব্য শ্রেণি / লেবেলকে দেওয়া যেতে পারে। আমি গণনা করতে চাই: যথার্থতা = টিপি / (টিপি + এফপি) পুনরুদ্ধার = টিপি / …

12
বায়েশিয়ানরা কারা?
যেহেতু কেউ পরিসংখ্যানগুলিতে আগ্রহী হয়ে উঠছে, দ্বিখণ্ডক "ফ্রিকোয়েনসিস্ট" বনাম "বায়সিয়ান" শীঘ্রই সাধারণ হয়ে উঠেছে (এবং যেভাবে ন্যাট সিলভারের দ্য সিগন্যাল এবং নয়েজ পড়েনি ?)। আলোচনা এবং পরিচায়ক কোর্স ইন, দৃষ্টিকোণ সিংহভাগ frequentist (হয় MLE , মান), কিন্তু সময় একটি অতি ক্ষুদ্র ভগ্নাংশ একটি ধারণা উপর বায়েসের সূত্র এবং স্পর্শ তারিফ …

10
কেন একটি সময় সিরিজ স্থির হতে হবে?
আমি বুঝতে পারি যে একটি স্থির সময়ের সিরিজ এমন একটি যার অর্থ এবং সময়ের সাথে সময়ের সাথে ধ্রুবক রয়েছে। কেউ দয়া করে ব্যাখ্যা করতে পারেন যে এটিতে আমরা বিভিন্ন আরিমা বা এআরএম মডেল চালানোর আগে আমাদের কেন ডেটা সেটটি স্থিতিশীল তা নিশ্চিত করতে হবে? এটি স্বাতন্ত্র্যকরণ এবং / অথবা সময় …

2
সরল ভাষায় সমবায় কী?
সরল ভাষায় সমবায় কী এবং কীভাবে এটি পুনরাবৃত্তি-ব্যবস্থাগুলির নকশাগুলির সাথে শর্তাবলী নির্ভরতা , পারস্পরিক সম্পর্ক এবং বৈচিত্র্য-কোভারিয়েন্স কাঠামোর সাথে যুক্ত?

3
মডেল নির্বাচনের জন্য নেস্টেড ক্রস বৈধকরণ
মডেল নির্বাচনের জন্য কেউ কীভাবে নেস্টেড ক্রস বৈধতা ব্যবহার করতে পারে ? আমি অনলাইনে যা পড়েছি তা থেকে নেস্টেড সিভি নীচের মতো কাজ করে: অভ্যন্তরীণ সিভি লুপ রয়েছে, যেখানে আমরা গ্রিড অনুসন্ধান চালাতে পারি (যেমন প্রতিটি উপলভ্য মডেলের জন্য কে-ফোল্ড চালানো, যেমন হাইপারপ্যারামিটার / বৈশিষ্ট্যগুলির সংমিশ্রণ) বাইরের সিভি লুপ রয়েছে, …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.