কেন কেউ কেন পিএনএসকে ব্যবহারের জন্য ব্যবহার করবে?


26

আমি যা বুঝি সেগুলি থেকে আমরা কেবলমাত্র একটি রিগ্রেশন ফাংশন তৈরি করতে পারি যা প্রশিক্ষণের ডেটার ব্যবধানের মধ্যে থাকে।

উদাহরণস্বরূপ (কেবলমাত্র প্যানেলের একটির প্রয়োজন): এখানে চিত্র বর্ণনা লিখুন

কেএনএন রেজিস্ট্রার ব্যবহার করে কীভাবে আমি ভবিষ্যতে ভবিষ্যদ্বাণী করব? আবার, এটি কেবলমাত্র একটি ফাংশন হিসাবে প্রতীয়মান হয় যা প্রশিক্ষণের ডেটার ব্যবধানের মধ্যে থাকে।

আমার প্রশ্ন: কেএনএন রেজিস্ট্রার ব্যবহারের সুবিধা কী কী? আমি বুঝতে পারি যে এটি শ্রেণিবদ্ধকরণের জন্য একটি খুব শক্তিশালী সরঞ্জাম, তবে মনে হয় এটি কোনও রিগ্রেশন দৃশ্যে খারাপ অভিনয় করবে।


"ভবিষ্যতের ভবিষ্যদ্বাণী" বলতে আপনি কী বোঝাতে চেয়েছেন তা কি আপনি পরিষ্কার করতে পারেন? আপনার কি টাইম-সিরিজ রয়েছে এবং আপনি পূর্বাভাস করতে চান, বা আপনি 2 টি ভেরিয়েবলের মধ্যে একটি সম্পর্ক ফিট করার চেষ্টা করছেন এবং ভবিষ্যতে কোনও ज्ञিত এক্স মান থেকে ওয়াই মান অনুমান করার জন্য এটি ব্যবহার করতে চান?
গুং - মনিকা পুনরায়

1
উদাহরণস্বরূপ, যদি আমি উপরের চিত্রটি থেকে Y এর মতো মান = 15 এর পূর্বাভাস দিতে চাইতাম। একজন কেএনএন-রেজিস্ট্রার সঠিকভাবে এটি কাটবে না?

1
আমি আপনার সাথে একমত হই যে আপনি যদি সাথে কোনও সেটকে প্রশিক্ষণ দিয়ে থাকেন তবে আশা করেছিলেন যে আপনি আপনার ডেটাতে যা আছে তার চেয়ে অনেক বেশি এক্স এর মান দেখতে পাবেন তবে প্যারামিমেটিকবিহীন স্থানীয় পদ্ধতিগুলি আদর্শ নাও হতে পারে। পরিবর্তে আপনি সেই ডোমেন জ্ঞানটি ব্যবহার করতে এবং একটি প্যারাম্যাট্রিক মডেল সংজ্ঞায়িত করতে পারেন যাতে আপনার 'জ্ঞাতহীন' এক্স কীভাবে আচরণ করা উচিত বলে আশা করা যায় includes x[0,5]এক্সএক্স
মেডোয়ালার্ক ব্র্যাশার

1
KNN সাফল্যের জন্য সফলভাবে ব্যবহৃত হচ্ছে এর একটি উদাহরণ হ'ল নেট সিলভারের পেকোটা বেসবলের পূর্বাভাস জিনিস। : আপনি PECOTA উপর আগপাছ Wikipedia নিবন্ধটি থেকে বা এই এক মত সংবাদপত্র নিবন্ধ সম্পর্কে পড়তে পারেন macleans.ca/authors/colby-cosh/...
Flounderer

6
আরও সাধারণ বিষয় তৈরি করার জন্য, আপনি পরিসংখ্যানগুলিতে (বা ডেটা মাইনিং / মেশিন লার্নিং ইত্যাদি) বুদ্ধিমান হয়ে উঠলে আপনি দেখতে পাবেন যে আপনার মতো সাধারণ প্রশ্নের উত্তরগুলি প্রায়শই 'এটি নির্ভর করে' এর একটি প্যারাফ্রেসড সংস্করণ হবে। এটি 'নির্ভর করে' এর উপর এবং কেন জ্ঞান।
মেডোয়ালার্ক ব্র্যাশার

উত্তর:


17

কে-এনএন এর মতো স্থানীয় পদ্ধতিগুলি কিছু পরিস্থিতিতে বোঝায়।

একটি উদাহরণ যা আমি বিদ্যালয়ের কাজে করেছি তা সিমেন্টের উপাদানগুলির বিভিন্ন মিশ্রণের সংবেদনশীল শক্তি সম্পর্কে ভবিষ্যদ্বাণী করে। এই সমস্ত উপাদানগুলি প্রতিক্রিয়া বা একে অপরের প্রতি সম্মানজনকভাবে তুলনামূলকভাবে অস্থিতিশীল ছিল এবং কেএনএন এটির উপর নির্ভরযোগ্য ভবিষ্যদ্বাণী করেছিল। অন্য কথায় স্বতন্ত্র ভেরিয়েবলগুলির কোনওটিরই স্বতন্ত্রভাবে বা সম্ভবত পারস্পরিক মিথস্ক্রিয়া দ্বারা মডেলকে সম্মান জানাতে অস্বাভাবিক আকারে বড় বৈকল্পিক ছিল না।

এটিকে লবণের দানা দিয়ে নিন কারণ আমি এমন কোনও ডেটা তদন্তের কৌশল জানি না যা চূড়ান্তভাবে এটি দেখায় তবে স্বজ্ঞাতভাবে এটি যুক্তিসঙ্গত বলে মনে হয় যে আপনার বৈশিষ্ট্যগুলিতে যদি কিছু পরিমাণের বৈকল্পিক পরিমাণ থাকে তবে আমি জানি না কোন অনুপাত, আপনার কাছে কোনও পরিমাণ থাকতে পারে কেএনএন প্রার্থী। আমি অবশ্যই জানতে চাই যে এই বিষয়ে কিছু গবেষণা এবং ফলস্বরূপ কৌশলগুলি বিকশিত হয়েছিল কিনা।

আপনি যদি সাধারণ ডোমেনের দৃষ্টিকোণ থেকে এটি সম্পর্কে চিন্তা করেন তবে অ্যাপ্লিকেশনগুলির একটি বিস্তৃত শ্রেণি রয়েছে যেখানে অনুরূপ 'রেসিপি' একইরকম ফলাফল দেয়। এটি অবশ্যই মেশানো সিমেন্টের ফলাফল পূর্বাভাস দেওয়ার পরিস্থিতি বর্ণনা করে বলে মনে হয়েছিল। আমি বলব যদি আপনার কাছে এই বিবরণ অনুসারে আচরণ করে এমন ডেটা থাকে এবং আপনার দূরত্ব পরিমাপটি হাতে থাকা ডোমেনের পক্ষেও স্বাভাবিক ছিল এবং শেষ পর্যন্ত আপনার যথেষ্ট পরিমাণে ডেটা ছিল, আমি কল্পনা করব যে আপনাকে কেএনএন বা অন্য কোনও স্থানীয় পদ্ধতি থেকে কার্যকর ফলাফল পাওয়া উচিত should ।

আপনি স্থানীয় পদ্ধতিগুলি ব্যবহার করার সময় আপনি অত্যন্ত কম পক্ষপাতিত্বের সুবিধাও পাচ্ছেন। কখনও কখনও জেনারালাইজড অ্যাডিটিভ মডেল (জিএএম) কেএএনএন ব্যবহার করে প্রতিটি পৃথক ভেরিয়েবলকে ফিট করে ব্যালেন্স বায়াস এবং বৈকল্পিক যেমন:

y^=1(এক্স1)+ +2(এক্স2)+ ++ +এন(এক্সএন)+ +ε

এন(এক্সএন)

আমি এত তাড়াতাড়ি কেএনএন লিখব না। এটির জায়গা আছে।


1
নিটের জন্য স্কেলিং ডেটা সম্পর্কিত এই উত্তরটি আপনাকে "রূপগুলির আনুপাতিক ডিগ্রি" বলতে বোঝাতে সাহায্য করতে পারে। stats.stackexchange.com/questions/287425/…
এরিক_কর্নফিল্ড

5

আমি এটি বলতে পছন্দ করি না তবে সংক্ষিপ্ত উত্তরটি হ'ল, "ভবিষ্যতে ভবিষ্যদ্বাণী করা" কোনও গিঁড় দিয়ে বা বর্তমানে বিদ্যমান কোনও শ্রেণিবদ্ধ বা রেজিস্ট্রারের সাথে সম্ভব নয়।

নিশ্চিত যে আপনি লিনিয়ার রিগ্রেশন বা এসভিএম এর হাইপার প্লেনের লাইনটি এক্সট্রোপোলেট করতে পারেন তবে শেষ পর্যন্ত আপনি জানেন না ভবিষ্যতটি কী হবে, আমরা সবাই জানি, লাইনটি কেবল বক্রতা বাস্তবতার একটি ছোট্ট অংশ হতে পারে। উদাহরণস্বরূপ আপনি গাউসির প্রক্রিয়াগুলির মতো বায়েশিয়ান পদ্ধতিগুলির দিকে তাকালে এটি স্পষ্ট হয়ে যায়, "পরিচিত ইনপুট ডোমেন" ছাড়ার সাথে সাথে আপনি একটি বড় অনিশ্চয়তা লক্ষ্য করবেন।

অবশ্যই আপনি আজ যা ঘটেছিল তা থেকে কালকে যা ঘটেছিল তার থেকে সাধারণ করার চেষ্টা করতে পারেন, যা খুব সহজেই একটি নিট রেজিস্ট্রার দিয়ে করা সম্ভব (যেমন ক্রিসমাসের সময় গত বছরের গ্রাহক সংখ্যা আপনাকে এই বছরের সংখ্যা সম্পর্কে ভাল ইঙ্গিত দিতে পারে)। অবশ্যই অন্যান্য পদ্ধতিগুলি প্রবণতা ইত্যাদির সাথে সংযুক্ত থাকতে পারে তবে শেষ পর্যন্ত আপনি দেখতে পাচ্ছেন যে এটি শেয়ার বাজারে বা দীর্ঘমেয়াদী আবহাওয়ার পূর্বাভাসের ক্ষেত্রে কতটা কার্যকর।


এক্সট্রাপোলেশন বিরুদ্ধে সতর্কতা এবং এক্সপ্লোরেশন যখন KNN (তুলনামূলক রক্ষণশীল) আচরণ আলোচনা করার জন্য +1।
এরিক_কর্নফিল্ড

ওএন দ্বারা উল্লিখিত আচরণের কারণে এক্সপ্লোরপোলটিং করার সময় কেএনএন লিনিয়ার রিগ্রেশনের চেয়ে বেশি রক্ষণশীল: এটি ইতিমধ্যে পর্যবেক্ষণ হওয়া ওয়াই মানগুলির সীমার মধ্যে কেবলমাত্র পূর্বাভাস তৈরি করতে পারে। এটি অনেক পরিস্থিতিতে একটি সুবিধা হতে পারে।
এরিক_কর্নফিল্ড

1

"কেএনএন রেজিস্ট্রার ব্যবহার করে ভবিষ্যতে কীভাবে ভবিষ্যদ্বাণী করব?" এর জন্য প্রথম উদাহরণ।

গুলিতোমার দর্শন লগ করাএনটি+ +1গুলিতোমার দর্শন লগ করাএনটিগুলিতোমার দর্শন লগ করাএনটি-6
গুলিতোমার দর্শন লগ করাএনটি

Wটিগুলিতোমার দর্শন লগ করাএনটিগুলিতোমার দর্শন লগ করাএনটি-6টিমিRRW(Wটি))গুলিতোমার দর্শন লগ করাএনটি+ +1

Wটি
W
টিমিRRW0টিমিRRW9
predict(week)tomorrow0..tomorrow9

টিউন ওজন যেমন দেখতে বিপরীত দূরবর্তী-ভরযুক্ত-idw-ক্ষেপক-সঙ্গে-পাইথন ,
এবং দূরত্ব 7D মধ্যে "নিকটবর্তী প্রতিবেশী" জন্য মেট্রিক।

"কেএনএন রেজিস্ট্রার ব্যবহারের সুবিধা কী?"
অন্যের ভাল মন্তব্যে আমি কোড এবং বোঝার পক্ষে সহজভাবে যুক্ত হয়েছি এবং বড় ডেটা পর্যন্ত স্কেল করে।
অসুবিধাগুলি: ডেটা এবং সুরের সংবেদনশীল, খুব বেশি বোঝার দরকার নেই




XY
Yt=b0Xt+b1Xt1+...
Yt+1
Yt+1=a0Yt+a1Yt1+...

সুতরাং আপনার প্রথম লাইন "আমরা কেবলমাত্র একটি রিগ্রেশন ফাংশন তৈরি করতে পারি যা প্রশিক্ষণের ডেটার ব্যবধানের মধ্যে থাকে" মনে হয় বিভ্রান্তিকর শব্দ "রিগ্রেশন" সম্পর্কে)


1

থেকে পরিসংখ্যানগত শেখার ভূমিকা , বিভাগ 3.5:

সত্যিকারের সম্পর্কের ক্ষেত্রে সত্যিকারের সম্পর্কটি অজানা, কেউ এই সিদ্ধান্তে পৌঁছাতে পারে যে কেএনএনকে লিনিয়ার রিগ্রেশনকে সমর্থন করা উচিত কারণ সত্যিকারের সম্পর্কটি লিনিয়ার হলে লিনিয়ার রিগ্রেশন থেকে এটি সবচেয়ে নিকৃষ্টতর হবে, এবং এটি আরও ভাল দিতে পারে সত্য সম্পর্কটি অ-রৈখিক হলে ফলাফলগুলি

তবে বাধা রয়েছে (পাঠ্যপুস্তক থেকে নয়, আমি যা বলেছিলাম):

  1. ভবিষ্যদ্বাণীকারীর জন্য পর্যাপ্ত সংখ্যক পর্যবেক্ষণ।
  2. ভবিষ্যদ্বাণীকারীদের সংখ্যা খুব বেশি হওয়া উচিত নয়।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.