বিগত 15 বছরের পরিসংখ্যানের অগ্রগতিগুলি কী কী?


56

ফ্রেডম্যান-হাস্টি-তিবশিরানী বুস্টিংয়ের অ্যানালসস অফ স্ট্যাটিস্টিকস পেপার এবং এখনও অন্য লেখকরা (ফ্রেউন্ড এবং স্কাপায়ার সহ) সেই একই বিষয়ে মন্তব্যগুলি আমার মনে আছে। সেই সময়, সুস্পষ্টভাবে বুস্টিংকে অনেক ক্ষেত্রেই একটি যুগান্তকারী হিসাবে দেখা হত: গণ্যমান্যভাবে সম্ভব, একটি তাত্পর্যপূর্ণ পদ্ধতি, দুর্দান্ত তবুও রহস্যজনক পারফরম্যান্স সহ। একই সময়ে, এসভিএম বয়সে এসেছিল, কঠিন তত্ত্ব দ্বারা প্রচুর পরিমাণে বৈকল্পিক এবং প্রয়োগ সহ একটি কাঠামো সরবরাহ করে।

এটি ছিল দুর্দান্ত 90 এর দশকে। বিগত 15 বছরে, আমার কাছে মনে হচ্ছে প্রচুর পরিসংখ্যান পরিষ্কার এবং বিশদ বিবরণী হয়েছে, তবে কয়েকটি সত্যই নতুন মতামত রয়েছে।

সুতরাং আমি দুটি প্রশ্ন জিজ্ঞাসা করব:

  1. আমি কি কিছু বিপ্লবী / চূড়ান্ত কাগজ মিস করেছি?
  2. যদি তা না হয়, তবে এমন কোনও নতুন পদ্ধতি রয়েছে যা আপনি ভাবেন যে পরিসংখ্যানগত অনুক্রমের দৃষ্টিভঙ্গি বদল করার সম্ভাবনা রয়েছে?

নিয়মাবলী:

  1. প্রতি পোস্টে একটি উত্তর;
  2. তথ্যসূত্র বা লিঙ্ক স্বাগত।

PS: প্রতিশ্রুতিবদ্ধ সাফল্যের জন্য আমার বেশ কয়েকজন প্রার্থী রয়েছেন। সেগুলি পরে পোস্ট করব।


5
অনুরূপ প্রশ্নের জন্য stats.stackexchange.com/q/1883/159 দেখুন (যা বিষয় ও যুক্তিযুক্ত হিসাবে বন্ধ ছিল)।
রব হ্যান্ডম্যান

1
আমি একই থ্রেড আনতে চলেছিলাম। ডুপ্লিকেটের মতো গন্ধ পেয়েছে।
ডার্ক এডেলবুয়েটেল

1
এটি সাবজেক্টিভ, নিশ্চিত, তবে এটি এখনও সিডব্লিউয়ের জন্য ঠিক নয়?
ক্রিস্টোফার অ্যাডেন

1
এটি দীর্ঘ সময় স্কেল ছিল। আমি এটি একটি সদৃশ মনে করি না। যুক্তিযুক্ত হিসাবে, এটি অংশগ্রহণকারীদের উপর নির্ভর করে। আমি এখানে ট্রফি দেওয়ার চেষ্টা করছি না, কেবলমাত্র আমি এবং অন্যান্যরা মিস করতে পেরেছি সেমিনাল কাগজপত্রের সীমাবদ্ধ রাখার জন্য। যেহেতু কোনও সঠিক উত্তর নেই, তাই আমি সবাই সিডব্লিউয়ের জন্য। আমি এটি আকর্ষণীয় মনে করি যে এখনও পর্যন্ত সমস্ত উত্তর বেইশিয়ান উদ্ভাবনের উপর রয়েছে।
gappy

2
এটি এমন একটি পোস্টের মতো মনে হচ্ছে যা পিতামহী হতে পারে। আমি মনে করি এটি উন্মুক্ত থাকতে পারে।
গাং - মনিকা পুনরায়

উত্তর:


43

উত্তরটি এত সহজ যে সিভি তৈরি করতে আমাকে এই সমস্ত জবরদস্তি লিখতে হবে আমাকে পোস্ট করতে: আর


14

আমি নিশ্চিত নই যে আপনি এটিকে "প্রতি যুগান্তকারী" হিসাবে আখ্যায়িত করেছেন , তবে সম্ভাবনা তত্ত্বের প্রকাশনা : অ্যাডউইন জেনেস এবং ল্যারি ব্রেথার্স্ট রচিত লজিক অফ সায়েন্স লক্ষণীয় হতে পারে। তারা এখানে কিছু কাজ করে:

1) কিছু পুনরাবৃত্ত "মৌসুমী সমন্বয়" স্কিম এবং বায়েসিয়ান "উপদ্রব পরামিতি" সংহতকরণের মধ্যে সমতা দেখান।

2) তথাকথিত "প্রান্তিককরণ প্যারাডক্স" সমাধান করেছেন - কারও কারও দ্বারা "বেইসিয়ানিজমের মৃত্যু" এবং অন্যেরা "অনুচিত প্রবক্তাদের মৃত্যু" বলে মনে করেন।

3) ধারণাটি যে সম্ভাবনাটি কোনও প্রস্তাবের সত্য বা মিথ্যা সম্পর্কে জ্ঞানের একটি অবস্থা বর্ণনা করে , যেমন কোনও দৈহিক সম্পত্তির বিবরণ দেয় না

এই বইয়ের প্রথম তিনটি অধ্যায় এখানে নিখরচায় পাওয়া যায় ।


2
দুর্ভাগ্যক্রমে, জেনেসের প্রান্তিককরণের প্যারাডক্সের সমাধানটি ত্রুটিযুক্ত ছিল। কেভিন ভ্যান হর্ন দেখি Jaynes এর প্রান্তিকীকরণ প্যারাডক্স চিকিত্সা নোটগুলি উপলব্ধ এখানে
সায়ান

1
@ সায়ান - নোট করুন যে কিছু ক্ষেত্রে তার রেজোলিউশন ত্রুটিযুক্ত হওয়ার সাথে সাথে তার অন্তর্নিহিত নীতিগুলি এটি সমাধান করেছে। উপযুক্ত বৌদ্ধদের সাধারণ নিয়ম এবং তাদের অভিভাবক সীমা মানে এমপি উত্থাপন করতে পারে না। ত্রুটিটি সম্ভবত বইয়ের বেশিরভাগ অংশের চেয়ে অসম্পূর্ণ হওয়ার কারণে। আমি চাই [এখানে] রেজোলিউশন ( arxiv.org/abs/math/0310006 ) ksvh সংস্করণের তুলনায় ভালো। খাটো এবং আরও সাধারণ।
সম্ভাব্যতাব্লোগিক

14

একজন প্রয়োগকৃত পরিসংখ্যানবিদ এবং মাঝেমধ্যে গৌণ সফ্টওয়্যার লেখক হিসাবে আমি বলব:

WinBUGS (প্রকাশিত 1997)

এটি 15 বছরেরও বেশি আগে (1989) প্রকাশিত বিইউজিএস-এর উপর ভিত্তি করে তৈরি হয়েছিল, তবে এটি উইনবগস যা বাস্তববাদী জটিল মডেলের বাইশিয়ান বিশ্লেষণকে আরও বিস্তৃত ব্যবহারকারীর ভিত্তিতে উপলব্ধ করেছে। উদাহরণস্বরূপ লুন, স্পিজেলহাল্টার, টমাস অ্যান্ড বেস্ট (২০০৯) দেখুন (এবং মেডিসিনের পরিসংখ্যান খণ্ডের ২৮ সংখ্যা 25 এর 25 ) এ সম্পর্কে আলোচনা )।


2
কীভাবে এখন এই পরিবর্তনটি Stanবাহির হয়?
এরি বি ফ্রিডম্যান

13

লারস আমার ভোট পেয়েছে। এটি ভেরিয়েবল নির্বাচনের সাথে লিনিয়ার রিগ্রেশনকে একত্রিত করে। আলগোরিদিম এটা গনা সাধারণত আপনি একটি সংগ্রহ দিতে রৈখিক মডেল, তম যার মধ্যে শুধুমাত্র অশূন্য কোফিসিয়েন্টস হয়েছে regressors, যাতে আপনি সহজেই বিভিন্ন জটিলতা মডেলের এ সন্ধান করতে পারেন।i ikii


আপনি কি কখনও লারস ব্যবহার করেছেন? আমি জিজ্ঞাসা করছি কারণ এর আগে আমি এর আগে কখনও শুনিনি এবং এটি সত্যই আকর্ষণীয় বলে মনে হচ্ছে। অরজিনাল নিবন্ধটি কিছুটা দীর্ঘ (pages৩ পৃষ্ঠাগুলি) তাই এর গভীরতা বয়ে যাওয়ার আগে আমি কিছু মতামত পেতে চাই।
টোমেক তার্কিজেনস্কি

@ টোমেক তারকজেনস্কি: আমি এটি অল্প পরিমাণে ব্যবহার করেছি। মতলবতে একটি প্যাকেজ রয়েছে (আমি নিশ্চিত যে আর তে এক বা একাধিক রয়েছে), যা আমি ব্যবহার করেছি। এটি একটি বিচ্ছিন্ন পিসিএও সরবরাহ করে, এতে আমি বেশি আগ্রহী ছিলাম I আমি স্বীকার করি যে আমি কেবল কাগজটি স্কিমেড করেছি। ;)
shabbychef

11

"তাত্পর্যপূর্ণ তাত্পর্য" ক্ষতি ফাংশন এবং সিদ্ধান্ত তত্ত্বের মধ্যে অন্যান্য "প্যারামিটারাইজেশন মুক্ত" ক্ষতি ফাংশনগুলির প্রবর্তন। এটিতে আরও অনেক "দুর্দান্ত" বৈশিষ্ট্য রয়েছে তবে আমি মনে করি সেরাটি নীচে রয়েছে:

যদি স্বতন্ত্র তাত্পর্য হ্রাস ফাংশনটি ব্যবহার করে সর্বোত্তম অনুমান যদি হয় , তবে কোনও এক থেকে এক ফাংশনের সেরা অনুমান , বলতে কেবল is ।θ θ জি ( θ ) জি ( θ )θθeθg(θ)g(θe)

আমি মনে করি এটি খুব দুর্দান্ত! (যেমন লগ-প্রতিক্রিয়াগুলির সর্বোত্তম অনুমান হ'ল লগ (পি / (1-পি)), তারতম্যের সর্বোত্তম অনুমান স্ট্যান্ডার্ড বিচ্যুতির স্কোয়ার ইত্যাদি etc.)

ক্যাচ? স্বতন্ত্র তাত্পর্য কাজ করা বেশ কঠিন হতে পারে! (এটিতে ন্যূনতম () ফানসিওন, সম্ভাবনা অনুপাত এবং ইন্টিগ্রালগুলি জড়িত!)

"কাউন্টার-ক্যাচ"? আপনি সমস্যাটিকে "পুনঃ-ব্যবস্থা" করতে পারেন যাতে এটি গণনা করা আরও সহজ হয়!

"কাউন্টার-কাউন্টার-ক্যাচ"? কীভাবে সমস্যাটি "পুনঃব্যবস্থা" করা যায় তা নির্ধারণ করা কঠিন হতে পারে!

এখানে আমি জানি এমন কিছু রেফারেন্স যা এই ক্ষতির ফাংশনটি ব্যবহার করে। যদিও আমি এই কাগজপত্র / স্লাইডগুলির "অভ্যন্তরীণ প্রাক্কলন" অংশগুলি খুব পছন্দ করি, তবে "রেফারেন্স পূর্ববর্তী" পদ্ধতির সম্পর্কেও আমার কিছু সংরক্ষণ রয়েছে যা বর্ণনা করা হয়েছে।

বায়েশিয়ান হাইপোথেসিস টেস্টিং: একটি রেফারেন্স অ্যাপ্রোচ

অন্তর্নিহিত অনুমান

সাধারণ মানে তুলনা: একটি পুরানো সমস্যার জন্য নতুন পদ্ধতি

ইন্টিগ্রেটেড অবজেক্টিভ বায়েসিয়ান অনুমান এবং হাইপোথিসিস পরীক্ষা


11

আমি বিশ্বাস করি যে, 15 বছরের উইন্ডোর মধ্যে পড়ে মিথ্যা আবিষ্কারের হার নিয়ন্ত্রণের জন্য অ্যালগরিদম । আমি 'কিউ-মান' পদ্ধতির পছন্দ করি।


1
হুম, বহুলোকনিত বেঞ্জামিন-হচবার্গ জেআরএসএসবি পত্রিকা 1995 সালে প্রকাশিত হয়েছিল, তাই জানালার ঠিক বাইরেই আমি ভীত! jstor.org/stable/2346101 স্টোরির কাগজ যা মূল্যবোধ প্রবর্তন করেছিল 2002 এর ছিল। dx.doi.org/10.1111/1467-9868.00346q
onestop

9

আমার নিজের 5 সেন্ট যুক্ত করে, আমি বিশ্বাস করি গত 15 বছরের সবচেয়ে উল্লেখযোগ্য অগ্রগতিটি সংকুচিত সংবেদন হয়েছে। লারস, লাসো এবং অন্যান্য অ্যালগরিদমগুলির একটি হোস্ট এই ডোমেনটিতে পড়ে, সংকুচিত সেনসিংয়ে ব্যাখ্যা করে যে তারা কেন কাজ করে এবং অন্য ডোমেনগুলিতে তাদের প্রসারিত করে।


1
আমি সংকুচিত সেনসিংয়ের দিকে তাকিয়েছি এবং অ-পরিসংখ্যানবিদ হিসাবে আমি নিজেকে জিজ্ঞাসা করতে থাকি, "এটি কি কেবল বিপরীত র্যান্ডম প্রজেকশন নয়?"। আমি জানি যে "ন্যায়বিচার" চারদিকে ছুঁড়ে ফেলার এক সহজ শব্দ তবে এটি মনে হয় যে মানুষ এলোমেলো প্রজেকশন (প্রায় 2000) এবং সংকোচিত সংবেদনের (প্রায় 2004) মধ্যে সুস্পষ্ট সংযোগের মতো মনে হচ্ছে leaving
ওয়েইন

9

এমন কিছু যা পরিসংখ্যানগুলির সাথে নিজেদের করার খুব কম, তবে এটি ব্যাপকভাবে উপকারী: কম্পিউটারগুলির ক্রমবর্ধমান ফায়ার পাওয়ার, বড় ডেটাসেট এবং আরও জটিল পরিসংখ্যান বিশ্লেষণকে আরও অ্যাক্সেসযোগ্য করে তোলে, বিশেষত প্রয়োগকৃত ক্ষেত্রে।


8

বায়েশিয়ান অনুমানের জন্য প্রত্যাশা-প্রচারের অ্যালগরিদম, বিশেষত গাউসীয় প্রক্রিয়া শ্রেণিবিন্যাসটি তাত্পর্যপূর্ণভাবে একটি গুরুত্বপূর্ণ অগ্রগতি ছিল, কারণ এটি একটি দক্ষ বিশ্লেষণী আনুমানিক পদ্ধতি প্রদান করে যা প্রায় একই সাথে গণ্য ব্যয়বহুল স্যাম্পলিং ভিত্তিক পদ্ধতির (সাধারণ ল্যাপ্লেস আনুমানিকতার বিপরীতে) কাজ করে। ইপি রোডম্যাপে টমাস মিনকা এবং অন্যদের কাজ দেখুন


ইপি দেখতে দুর্দান্ত লাগছে (যদিও এটি এখনও আমার মাথায় ব্যাথা দেয়)। এটি এখনও সাধারণ কনভার্জেন্স গ্যারান্টি অভাব হয়?
কনজুগেটপরিওর

7

2

আমার মতে, আপনাকে বৃহত্তর স্কেলগুলিতে নতুন মডেল চালানোর অনুমতি দেওয়া সবকিছুই একটি যুগান্তকারী। স্কেলেবল স্ট্রাকচার্ড গাউসিয়ান প্রসেসেসের জন্য কার্নেল ইন্টারপোলেশন (কেআইএসএস-জিপি) একজন প্রার্থী হতে পারে (যদিও ধারণাটি নতুন এবং ধারণাটির অনেকগুলি বাস্তবায়ন হয়নি)।


2

যদিও পরিসংখ্যানের তুলনায় কিছুটা বেশি সাধারণ, আমি মনে করি r ই প্রডাক্সিবল রিসার্চ (আরআর) এর পদ্ধতিতে গুরুত্বপূর্ণ অগ্রগতি হয়েছে । উদাহরণস্বরূপ আর এর বিকাশ knittrএবংSweaveপ্যাকেজগুলি এবং "আর মার্কডাউন" নোটবুকগুলি, লায়াক্স এবং লটেক্স উন্নতি ডেটা শেয়ারিং, সহযোগিতা, যাচাইকরণ / যাচাইকরণ এবং এমনকি অতিরিক্ত পরিসংখ্যানগত অগ্রগতিতে গুরুত্বপূর্ণ অবদান রেখেছে। পরিসংখ্যান, চিকিত্সা এবং মহামারী সংক্রান্ত জার্নালগুলিতে রেফার করা কাগজপত্রগুলি খুব সহজেই এই পুনরুত্পাদনযোগ্য গবেষণা পদ্ধতি / প্রযুক্তিগুলির উত্থানের আগে খুব সহজেই ফলাফল পুনরুত্পাদন করার অনুমতি দেয়। এখন, বেশ কয়েকটি জার্নালের পুনরুত্পাদনযোগ্য গবেষণা প্রয়োজন এবং অনেক পরিসংখ্যানবিদরা আরআর এবং পোস্টিং কোড, ওয়েবে তাদের ফলাফল এবং ডেটা উত্স ব্যবহার করছেন। এটি ডেটা বিজ্ঞানের শাখাগুলি জোরদার করতে সহায়তা করেছে এবং পরিসংখ্যানিক শিক্ষাকে আরও অ্যাক্সেসযোগ্য করে তুলেছে।


1

আমার মতে, বিজ্ঞান ম্যাগাজিনে ২০১১ সালে প্রকাশিত পেপার। লেখকরা এলোমেলো ভেরিয়েবলের জুটির মধ্যে খুব আকর্ষণীয় পরিমাপের প্রস্তাব দেয় যা অনেক পরিস্থিতিতে একইভাবে কার্যকর হয় যেখানে একই রকম ব্যবস্থা ব্যর্থ হয় (পিয়ারসন, স্পিয়ারম্যান, কেন্ডাল)। সত্যিই দুর্দান্ত কাগজ। এটা এখানে.


লিঙ্কটি নষ্ট হয়ে গেছে বলে মনে হচ্ছে।
dsaxton

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.