পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
স্পার কোডিং এবং অটেনকোডার এর মধ্যে পার্থক্য কী?
স্পার্স কোডিং ইনপুট ভেক্টরগুলিকে উপস্থাপন করার জন্য ভিত্তি ভেক্টরগুলির একটি ওভার-সম্পূর্ণ সেট শেখার হিসাবে সংজ্ঞায়িত করা হয় (<- আমরা এটি কেন চাই)। স্পার কোডিং এবং অটেনকোডার এর মধ্যে পার্থক্য কী? আমরা কখন স্পার্স কোডিং এবং অটোরকোডার ব্যবহার করব?

11
মানে নিখুঁত বিচ্যুতি বনাম মানক বিচ্যুতি
গ্রেয়ার (1983) দ্বারা "ও লেভেলের জন্য নতুন কমপ্রেইনসিভ ম্যাথমেটিক্স" পাঠ্য বইয়ে , আমি গড় গণ্যমান্য বিচ্যুতিটি এইভাবে গণ্য করতে দেখি: একক মান এবং গড়ের মধ্যে নিখুঁত পার্থক্য যোগ করুন। তারপরে তার গড় পান। অধ্যায়ের শব্দটির অর্থ হ'ল বিচ্যুতি শব্দটি ব্যবহৃত হয়। তবে আমি সম্প্রতি বেশ কয়েকটি উল্লেখ দেখেছি যা স্ট্যান্ডার্ড …

1
আর-তে tsoutliers প্যাকেজ ব্যবহার করে টাইম সিরিজে আউটলিয়ারগুলি সনাক্তকরণ (এলএস / এও / টিসি) সমীকরণের ফর্ম্যাটে কীভাবে বহিরাগতদের প্রতিনিধিত্ব করবেন?
মন্তব্যসমূহ: প্রথমত আমি নতুন সসটেলিয়ার্স প্যাকেজের লেখককে একটি ধন্যবাদ জানাতে চাই যা চেন এবং লিউর সময় সিরিজের আউটলেট সনাক্তকরণ কার্যকর করে যা ১৯৯৩ সালে ওপেন সোর্স সফ্টওয়্যার আর- তে আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশন জার্নালে প্রকাশিত হয়েছিল ।RRR প্যাকেজটি টাইম সিরিজের ডেটাতে পুনরাবৃত্তভাবে 5 বিভিন্ন ধরণের আউটলিয়ার সনাক্ত করে: অ্যাডিটিভ আউটলেটর (এও) …

1
লজিস্টিক রিগ্রেশন: আনোভা চি-বর্গক্ষেত্র পরীক্ষা বনাম সহগের তাত্পর্য (আনোভা () বনাম সারাংশ () আর)
আমার কাছে 8 টি ভেরিয়েবল সহ একটি লজিস্টিক জিএলএম মডেল রয়েছে। আমি আর-তে একটি চি-স্কোয়ার পরীক্ষা চালিয়েছি anova(glm.model,test='Chisq')এবং পরীক্ষাগুলির শীর্ষে অর্ডার দেওয়ার পরে ভেরিয়েবলগুলির 2 টি ভবিষ্যদ্বাণীপূর্ণ হয়ে উঠেছে এবং নীচে অর্ডার দেওয়ার সময় এতটা নয়। summary(glm.model)দাড়ায় যে তাদের কোফিসিয়েন্টস তুচ্ছ (উচ্চ P-মান) হয়। এক্ষেত্রে মনে হয় যে ভেরিয়েবলগুলি উল্লেখযোগ্য …

3
কীভাবে প্রমাণ করতে হবে যে রেডিয়াল বেস ফাংশনটি কার্নেল?
কীভাবে প্রমাণ করতে হয় যে রেডিয়াল ভিত্তিক ফাংশন k(x,y)=exp(−||x−y||2)2σ2)k(x,y)=exp⁡(−||x−y||2)2σ2)k(x, y) = \exp(-\frac{||x-y||^2)}{2\sigma^2})একটি কর্নেল? আমি যতদূর বুঝতে পেরেছি, এটি প্রমাণ করতে আমাদের নীচের যে কোনও একটি প্রমাণ করতে হবে: কোনও ভেক্টর সংস্থার জন্য । । । , x nx1,x2,...,xnx1,x2,...,xnx_1, x_2, ..., x_n ম্যাট্রিক্স = positive ধনাত্মক অর্ধবৃত্তীয়।K(x1,x2,...,xn)K(x1,x2,...,xn)K(x_1, x_2, ..., x_n)(k(xi,xj))n×n(k(xi,xj))n×n(k(x_i, x_j))_{n …
35 svm  kernel-trick 


3
লিনিয়ার রিগ্রেশনে তাত্পর্যপূর্ণ বৈপরীত্য: একটি গুণফলের জন্য অ-উল্লেখযোগ্য সামগ্রিক এফ-স্ট্যাটিস্টিকের জন্য উল্লেখযোগ্য টি-টেস্ট
আমি 4 টি শ্রেণিবদ্ধ ভেরিয়েবল (প্রতিটি 4 টি স্তর সহ) এবং একটি সংখ্যাসূচক আউটপুটের মধ্যে একাধিক লিনিয়ার রিগ্রেশন মডেল ফিট করছি। আমার ডেটাসেটে 43 টি পর্যবেক্ষণ রয়েছে। রিগ্রেশন আমাকে অনুসরণ দেয় ppp থেকে -values ttt : প্রতিবার ঢাল সহগ জন্য -test .15,.67,.27,.02.15,.67,.27,.02.15, .67, .27, .02 । সুতরাং, 4 র্থ predictor …

5
অত্যন্ত উচ্চ মাত্রিক শ্রেণিবিন্যাসের জন্য নিখরচায় সেট সেট [বন্ধ]
1000 টিরও বেশি বৈশিষ্ট্য (বা নমুনা পয়েন্ট এতে কার্ভগুলি অন্তর্ভুক্ত থাকলে) সহ শ্রেণিবিন্যাসের জন্য অবাধে উপলভ্য ডেটা কী ? ফ্রি ডেটা সেটগুলি সম্পর্কে ইতিমধ্যে একটি সম্প্রদায় উইকি রয়েছে: অবাধে উপলভ্য ডেটা নমুনাগুলি সনাক্ত করা তবে এখানে, আরও বেশি কেন্দ্রীভূত তালিকা থাকা আরও ভাল হবে যা আরও সুবিধে করে ব্যবহার করা …

8
কিউবের কিনারায় এলোমেলো হাঁটা
একটি পিপীলিকা একটি ঘনকের এক কোণে স্থাপন করা হয় এবং চলাচল করতে পারে না। একটি মাকড়সা বিপরীত কোণ থেকে শুরু হয়, এবং সমান সম্ভাবনা সাথে কোনও দিকের কিউবের কিনারা ধরে এগিয়ে যেতে পারে । গড়ে, মাকড়সা পিঁপড়ায় উঠতে কত পদক্ষেপের প্রয়োজন হবে?(x,y,z)(x,y,z)(x,y,z)1/31/31/3 (এটি হোমওয়ার্ক নয়, এটি একটি সাক্ষাত্কারের প্রশ্ন ছিল।)

3
অবশিষ্ট স্ট্যান্ডার্ড ত্রুটি কী?
আরে একাধিক রিগ্রেশন মডেল চালানোর সময়, আউটপুটগুলির মধ্যে একটি হল স্বাধীনতার 95,161 ডিগ্রিতে 0.0589 এর একটি রেসিডুয়াল স্ট্যান্ডার্ড ত্রুটি। আমি জানি যে স্বাধীনতার 95,161 ডিগ্রি আমার নমুনায় পর্যবেক্ষণের সংখ্যা এবং আমার মডেলের ভেরিয়েবলের সংখ্যার মধ্যে পার্থক্য দ্বারা দেওয়া হয়। অবশিষ্ট অবধি ত্রুটি কী?

4
গামা র্যান্ডম ভেরিয়েবলের জেনেরিক যোগফল
আমি পড়েছি যে একই স্কেল প্যারামিটার সহ গামা র্যান্ডম ভেরিয়েবলগুলির যোগফল হ'ল অন্য গামা র্যান্ডম ভেরিয়েবল। আমি মোছোপৌলসের কাগজটিও গামা র্যান্ডম ভেরিয়েবলগুলির একটি সাধারণ সেটের সংমিশ্রনের জন্য একটি পদ্ধতি বর্ণনা করে দেখেছি । আমি মোছোপ্লোস পদ্ধতিটি বাস্তবায়নের চেষ্টা করেছি তবে এখনও সাফল্য পাইনি । গামা র্যান্ডম ভেরিয়েবলগুলির একটি সাধারণ সেটের …

5
যদি আমার লিনিয়ার রিগ্রেশন ডেটাতে বেশ কয়েকটি সহ-মিশ্রিত লিনিয়ার সম্পর্ক থাকে?
ধরা যাক আমি পড়াশোনা করছি কীভাবে ড্যাফোডিলগুলি মাটির বিভিন্ন পরিস্থিতিতে প্রতিক্রিয়া জানায়। আমি ড্যাফোডিলের পরিপক্ক উচ্চতা বনাম মাটির পিএইচ-তে ডেটা সংগ্রহ করেছি। আমি লিনিয়ার সম্পর্কের প্রত্যাশা করছি, তাই আমি লিনিয়ার রিগ্রেশন চালাচ্ছি। যাইহোক, আমি যখন আমার অধ্যয়ন শুরু করি তখন বুঝতে পারিনি যে জনসংখ্যায় আসলে দুটি জাতের ড্যাফোডিল রয়েছে, যার …

3
আর - অবশিষ্ট টার্মিনোলজি নিয়ে বিভ্রান্ত
রুট মানে স্কোয়ার ত্রুটি বর্গাকার অবশিষ্টাংশ অবশিষ্ট স্ট্যান্ডার্ড ত্রুটি স্কোয়ার ত্রুটি মানে পরীক্ষার ত্রুটি আমি ভেবেছিলাম আমি এই পদগুলি বুঝতে পেরেছি তবে পরিসংখ্যানগত সমস্যাগুলি যত বেশি করি আমি নিজেকে আরও বিভ্রান্ত করেছি যেখানে আমি নিজেকে দ্বিতীয় অনুমান করি। আমি কিছু পুনঃ-নিশ্চয়তা এবং একটি দৃ example় উদাহরণ চাই আমি সহজেই অনলাইনে …

4
ক্লাসগুলি ভালভাবে পৃথক করা হলে কেন লজিস্টিক রিগ্রেশন অস্থির হয়ে উঠবে?
ক্লাসগুলি ভালভাবে বিচ্ছিন্ন হয়ে গেলে লজিস্টিক রিগ্রেশন কেন অস্থিতিশীল হয়? ভালভাবে বিচ্ছিন্ন শ্রেণীর অর্থ কী? কেউ যদি উদাহরণ দিয়ে ব্যাখ্যা করতে পারে তবে আমি সত্যিই প্রশংসা করব।

2
নেস্টিংয়ের সাথে মিশ্র ইফেক্টস মডেল
নিম্নলিখিত হিসাবে সংগঠিত একটি পরীক্ষার থেকে আমার কাছে ডেটা সংগ্রহ করা হয়েছে: দুটি সাইট, প্রতিটি 30 টি গাছ রয়েছে। 15 চিকিত্সা করা হয়, 15 প্রতিটি সাইটে নিয়ন্ত্রণ। প্রতিটি গাছ থেকে আমরা কান্ডের তিনটি টুকরো এবং শিকড়ের তিনটি টুকরো নমুনা করি, তাই গাছ প্রতি 6 স্তর 1 নমুনা যা দুটি ফ্যাক্টর …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.