মাত্রার


24

প্রদত্ত ডাটা পয়েন্টগুলি, প্রতিটি বৈশিষ্ট্য সহ হিসাবে লেবেলযুক্ত , অন্য হিসাবে লেবেলযুক্ত । প্রতিটি বৈশিষ্ট্য এলোমেলোভাবে (অভিন্ন বিতরণ) থেকে একটি মান নেয় । হাইপারপ্লেন যে দুটি শ্রেণিকে বিভক্ত করতে পারে তার সম্ভাবনা কী?ডি এন / 2 0 এন / 2 1 [ 0 , 1 ]এনএন/20এন/21[0,1]

আসুন প্রথমে সবচেয়ে সহজ কেস বিবেচনা করা যাক, ।=1


3
এটি একটি সত্যিই আকর্ষণীয় প্রশ্ন। আমি মনে করি যে এটি দুটি শ্রেণির পয়েন্টের উত্তল হালগুলি ছেদ করে কিনা বা না পারার ক্ষেত্রে এটি সংশোধন করতে সক্ষম হতে পারে - যদিও আমি জানি না যে এটি সমস্যাটিকে আরও সোজা করে তোলে কি না।
ডন ওয়ালপোলা

এন=1এন=21লিমএন  জনসংযোগ (রৈখিকভাবে পৃথকযোগ্য)0

হাইপারপ্লেনটি 'ফ্ল্যাট' হওয়া দরকার (অথবা এটি যদি বলা যায়, টাইপ পরিস্থিতিতে একটি প্যারাবোলা হতে পারে) আপনারও স্পষ্ট করতে হবে । আমার কাছে মনে হয় যে প্রশ্নটি দৃ strongly়তার সাথে নিষ্ঠুরতা বোঝায়, তবে সম্ভবত এটি স্পষ্টভাবে বলা উচিত। 2
গুং - মনিকা পুনরায়

4
@ গুং আমি মনে করি "হাইপারপ্লেন" শব্দটি নির্বিঘ্নে "ফ্ল্যাটনেস" বোঝায়, এ কারণেই আমি "রৈখিক বিভাজন" বলতে শিরোনাম সম্পাদনা করেছি। স্পষ্টতই ডুপ্লিকেট ব্যতীত কোনও ডেটাসেট নীতিগতভাবে অলৈখিকভাবে পৃথকযোগ্য can
অ্যামিবা বলেছেন মনিকাকে

1
@ গং আইএমএইচও "ফ্ল্যাট হাইপারপ্লেন" একটি অনুভূতি। যদি আপনি তর্ক করেন যে "হাইপারপ্লেন" বাঁকা যায়, তবে "ফ্ল্যাট" এছাড়াও বাঁকানো যেতে পারে (উপযুক্ত মেট্রিকে)।
অ্যামিবা বলেছেন মনিকাকে

উত্তর:


4

ধরে নিচ্ছি ডেটাতে কোনও নকল নেই exist

যদি এন+ +1 তবে সম্ভাব্যতা হ'ল pr=1

(এন,) এর অন্যান্য সংমিশ্রণের জন্য নীচের প্লটটি দেখুন:

এখানে চিত্র বর্ণনা লিখুন

আমি ওপিতে উল্লিখিত হিসাবে এই প্লটটি সিমুলেটিং ইনপুট এবং আউটপুট ডেটা তৈরি করেছি। লৌকিক বিচ্ছেদকে হজ -ডোনার প্রভাবের কারণে লজিস্টিক রিগ্রেশন মডেলে কনভার্সনের ব্যর্থতা হিসাবে সংজ্ঞায়িত করা হয়েছিল ।

এনএন,পি

পি(এন,)=11+ +-(5,82944-4,58261×এন+ +1,37271×-0.0235785×এন×)

এখানে চিত্র বর্ণনা লিখুন


প্লটের কোড (জুলিয়ায়):

using GLM

ds = 10; #number of dimensions to be investigated
ns = 100 #number of examples to be investigated
niter = 1000; #number of iterations per d per n
P = niter * ones(Int64, ds, ns); #starting the number of successes

for d in 1:ds
    for n in (d+1):ns
        p = 0 #0 hits
        for i in 1:niter
            println("Dimensions: $d; Samples: $n; Iteration: $i;")
            try #we will try to catch errors in the logistic glm, these are due to perfect separability
                X = hcat(rand((n,d)), ones(n)); #sampling from uniform plus intercept
                Y = sample(0:1, n)  #sampling a binary outcome
                glm(X, Y, Binomial(), LogitLink())
            catch
                p = p+1 #if we catch an error, increase the count
            end
        end
        P[d,n] = p
    end
end

using Plots

gui(heatmap(P./niter, xlabel = "Number of Samples", ylabel = "Number of Dimensions", title = "Probability of linear separability"))

(এন,)পি

probs = P./niter
N = transpose(repmat(1:ns, 1, ds))
D = repmat(1:ds, 1, ns)

fit = glm(hcat(log.(N[:]), D[:], N[:].*D[:], ones(ds*ns)), probs[:], Binomial(), LogitLink())
coef(fit)
#4-element Array{Float64,1}:
# -4.58261
#  1.37271
# -0.0235785
#  5.82944

gui(heatmap(reshape(predict(fit), ds, ns), xlabel = "Number of Samples", ylabel = "Number of Dimensions", title = "Fit of probability of linear separability"))

+1 টি। কেন লগ (এন) এবং এন নয়? হলুদ-কালো সীমানাটি শীর্ষ চিত্রটিতে আমার কাছে সরলরেখার মতো দেখায়, তবে দ্বিতীয় চিত্রটিতে বাঁকানো দেখা যায়। এটি লগ (এন) এর কারণে হতে পারে? নিশ্চিত না.
অ্যামিবা বলছে মনিকাকে

পি=1পি=0
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.