"লক্ষ্য সর্বাধিক সম্ভাবনা প্রত্যাশা" কী?


15

আমি মার্ক ভ্যান ডার লানের কিছু কাগজপত্র বোঝার চেষ্টা করছি। তিনি বার্কলেতে একজন তাত্ত্বিক পরিসংখ্যানবিদ যিনি মেশিন লার্নিংয়ের সাথে উল্লেখযোগ্যভাবে ওভারল্যাপ সমস্যা নিয়ে কাজ করছেন। আমার (গভীর গণিতের পাশাপাশি) একটি সমস্যা হ'ল তিনি প্রায়শই সম্পূর্ণ ভিন্ন পরিভাষা ব্যবহার করে পরিচিত মেশিন লার্নিং পদ্ধতির বর্ণনা দিয়ে শেষ করেন। তার অন্যতম প্রধান ধারণা "লক্ষ্যবস্তু সর্বাধিক সম্ভাবনা প্রত্যাশা"।

টিএমএলএর নিয়ন্ত্রণহীন পরীক্ষা থেকে সেন্সর করা পর্যবেক্ষণের তথ্য বিশ্লেষণ করতে এমনভাবে ব্যবহার করা হয় যা বিস্মৃতকর কারণগুলির উপস্থিতিতেও প্রভাব অনুমানের অনুমতি দেয়। আমি দৃ strongly়ভাবে সন্দেহ করি যে একই মতবাদের অনেকগুলি অন্যান্য নামে অন্যান্য নামে বিদ্যমান, তবে আমি এখনও এটিকে কোনও কিছুর সাথে সরাসরি মেলে যথেষ্ট বুঝতে পারি না।

"কম্পিউটেশনাল ডেটা অ্যানালাইসিস" -এর ব্যবধানটি সরিয়ে নেওয়ার একটি প্রচেষ্টা এখানে রয়েছে:

ডেটা সায়েন্সের যুগে প্রবেশ করা: টার্গেটেড লার্নিং এবং স্ট্যাটিস্টিটিস এবং কম্পিউটেশনাল ডেটা অ্যানালাইসিসের সংহত

এবং পরিসংখ্যানবিদদের জন্য একটি ভূমিকা এখানে:

লক্ষ্যযুক্ত সর্বাধিক সম্ভাবনা ভিত্তিক কার্যকারিতা: প্রথম খণ্ড Part

দ্বিতীয় থেকে:

এই নিবন্ধে, আমরা একাধিক সময় পয়েন্ট হস্তক্ষেপের কার্যকারণ প্রভাব একটি নির্দিষ্ট লক্ষ্যমাত্রা সর্বাধিক সম্ভাবনা অনুমানকারী বিকাশ। এর মধ্যে জি-গণনা সূত্রের অজানা কারণগুলির প্রাথমিক অনুমানের জন্য ক্ষতি-ভিত্তিক সুপার-লার্নিংয়ের ব্যবহার জড়িত এবং পরবর্তী সময়ে প্রতিটি অনুমান করা ফ্যাক্টরের জন্য টার্গেট-প্যারামিটার নির্দিষ্ট অনুকূল ওঠানামা ফাংশন (কমপক্ষে অনুকূল প্যারামেট্রিক সাব মডেল) প্রয়োগ করা, সর্বাধিক সম্ভাবনা অনুমান সহ ওঠানামা পরামিতি (গুলি) অনুমান করা, এবং একত্রিত হওয়া অবধি প্রাথমিক ফ্যাক্টরের এই আপডেটিং পদক্ষেপটির পুনরাবৃত্তি করা। এই পুনরাবৃত্তিকে লক্ষ্যবস্তু সর্বাধিক সম্ভাবনা আপডেট করার ধাপটি কার্যকারণ প্রভাবের ফলাফলের প্রাক্কলনকারীকে এই অর্থে দ্বিগুণ মজবুত করে তোলে যে প্রাথমিক অনুমানকারী উভয়ই সামঞ্জস্যপূর্ণ হলে এটি সামঞ্জস্যপূর্ণ, বা অনুকূল ওঠানামা ফাংশনের অনুমানকটি সামঞ্জস্যপূর্ণ। কার্যকারণ গ্রাফের নোডগুলির শর্তসাপেক্ষ বিতরণ যদি সঠিকভাবে নির্দিষ্ট হয় তবে অনুকূল ওঠানামা কার্যটি সঠিকভাবে নির্দিষ্ট করা হয়।

তাঁর পরিভাষায়, "সুপার লার্নিং" আ আ তাত্ত্বিকভাবে সাউন্ড অ-নেগেটিভ ওজন স্কিমের সাথে শেখা হয় learning তবে "প্রতিটি অনুমানিত ফ্যাক্টরের জন্য টার্গেট-প্যারামিটার নির্দিষ্ট অনুকূল ওঠানামা ফাংশন (কমপক্ষে অনুকূল প্যারামেট্রিক সাব মডেল) প্রয়োগ করে তিনি কী বোঝাতে চান"?

বা এটিকে তিনটি পৃথক প্রশ্নে বিভক্ত করে মেশিন লার্নিংয়ে কি টিএমএলএর সমান্তরাল রয়েছে, "ন্যূনতম অনুকূল প্যারামেট্রিক সাবমোডেল" কী এবং অন্যান্য ক্ষেত্রে "ওঠানামা কাজ" কী?


1
পরিভাষা অপরিচিত হওয়ার একটি কারণ হ'ল টিএমএলইর লক্ষ্যটি হল গড় চিকিত্সার প্রভাব - কার্যকারিতা অনুমান, অনুমান নয় esti আমি যখন টিএমএলই-র কাগজগুলিতে "সুপার লার্নার" পড়ি, তখন আমি ভেবেছিলাম লেখকরা উপহারের মডেল তৈরির জন্য আর-এর সুপারলাইনার প্যাকেজ থেকে এই শব্দটি ধার করেছিলেন।
রবার্টএফ

উত্তর:


24

আমি সম্মত হই যে ভ্যান ডার লানের ইতিমধ্যে বিদ্যমান ধারণাগুলির জন্য নতুন নাম উদ্ভাবনের প্রবণতা রয়েছে (যেমন সুপার-লার্নার), তবে যতটা আমি জানি টিএমএলই তাদের মধ্যে একটি নয় not এটি আসলে খুব চালাক ধারণা, এবং আমি মেশিন লার্নিং সম্প্রদায়ের কাছ থেকে এমন কিছু দেখিনি যা দেখতে দেখতে অনুরূপ (যদিও আমি কেবল অজ্ঞ হতে পারি)। ধারণাগুলি সেমিপ্রেমেট্রিক-দক্ষ অনুমানের সমীকরণের তত্ত্ব থেকে আসে, যা আমি মনে করি যে পরিসংখ্যানবিদরা এমএল লোকের চেয়ে অনেক বেশি ভাবেন।

P0 Ψ(P0)

iφ(Yiθ)=0,

θ=θ(P)PΨφEPφ(Yθ)=0θP0Ψ(P0)(দ্রষ্টব্য: আমি "দক্ষ" শব্দের সাথে কিছুটা looseিলে beingালা হয়ে যাচ্ছি, যেহেতু আমি কেবল হিউরিস্টিকের বর্ণনা দিচ্ছি।) এই ধরণের সমীকরণের সমীকরণের পেছনের তত্ত্বটি বেশ মার্জিত, এই গ্রন্থটি নীতিগত রেফারেন্স সহ। এখানেই কেউ "ন্যূনতম অনুকূল সাবমোডেলস" এর স্ট্যান্ডার্ড সংজ্ঞা পেতে পারেন; এগুলি ভ্যান ডার লান আবিষ্কারকৃত পদ নয়।

P0P0Ψ(P0)P0P^Ψ(P^)nP0Ψ

p^

p^1,ϵ=p^exp(ϵ φ(Yθ))p^exp(ϵ φ(yθ)) dy

ϵϵϵ=0p^Ψϵ0p^1p^

p^2,ϵp^1,ϵ^exp(ϵ φ(Yθ).

এবং তাই আমরা সীমাতে কিছু না পাওয়া পর্যন্ত, যা দক্ষ অনুমানের সমীকরণকে সন্তুষ্ট করে।


1
"আমি সম্মত হয়েছি যে ভ্যান ডার লানের ইতিমধ্যে বিদ্যমান ধারণাগুলির জন্য নতুন নাম উদ্ভাবনের প্রবণতা রয়েছে" - হ্যাঁ, টিএমএলএর এই ভূমিকাটি দেখুন: বায়োস্ট্যাটস.ব্প্রেসস / বিবিএসটিট / পেপার ২৫২ , যেখানে ভ্যান ডার লান "এলোমেলোভাবে মোটা হওয়ার" অর্থ ব্যবহার করে বিনিময়যোগ্যতা এবং "পরীক্ষামূলক চিকিত্সা অ্যাসাইনমেন্ট (ইটিএ) অনুমান" ইতিবাচকতা বোঝাতে। :-) এটি আমাদের ক্ষেত্রে মারাত্মকভাবে অস্বাভাবিক নয়। ডেটা বিজ্ঞানীরা স্মরণ, নির্ভুলতা এবং এ / বি পরীক্ষার মতো পদ ব্যবহার করে যা আমি সংবেদনশীলতা, ইতিবাচক ভবিষ্যদ্বাণীমূলক মান এবং কলেজে অনুমান পরীক্ষার হিসাবে শিখেছি।
রবার্টএফ

2
@ রবার্টএফ সিএআর হিটজান এবং রুবিনের কারণে এবং এটি এমএআর এর সাধারণীকরণ। রুবিন এমএআর আবিষ্কার করেছিল এবং সম্ভাব্য ফলাফলের কাঠামোকে জনপ্রিয় করে তোলে, তাই অজ্ঞতা / এক্সচেঞ্জিবিলিটি ধরণের অনুমানের জন্য সিএআর-কে ক্যাচ-অল হিসাবে ব্যবহার করা আমার কাছে উপযুক্ত বলে মনে হয়।
লোক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.