পরিসংখ্যান তত্ত্ব এবং অ্যাপ্লিকেশন থেকে জ্ঞান তৈরি


13

আমি সম্প্রতি পটভূমি হিসাবে ইঞ্জিনিয়ারিং গণিতের সাথে মেডিকেল এবং জৈবিক মডেলিংয়ের উপর স্নাতকোত্তর পেয়েছি with যদিও আমার শিক্ষা প্রোগ্রামে গাণিতিক পরিসংখ্যানের উপর একটি উল্লেখযোগ্য পরিমাণে পাঠ্যক্রম অন্তর্ভুক্ত ছিল (একটি তালিকার নীচে দেখুন), যা আমি বেশ উচ্চ গ্রেড দিয়ে পরিচালনা করেছিলাম, আমি প্রায়শই সম্পূর্ণভাবে হারিয়ে ফেলেছি তত্ত্ব এবং পরিসংখ্যানের প্রয়োগ উভয়কেই হারিয়ে ফেলেছি। আমাকে বলতে হবে, "খাঁটি" গণিতের সাথে তুলনা করলে পরিসংখ্যান আমার কাছে সত্যিই সামান্য বোঝায়। বিশেষত বেশিরভাগ পরিসংখ্যানবিদরা (আমার অতীতের প্রভাষকগণ সহ) ব্যবহার করেছেন এমন স্বরলিপি এবং ভাষা বিরক্তিকরভাবে সংশ্লেষিত এবং আমি এখন পর্যন্ত যে সকল সংস্থান দেখেছি তার মধ্যে কোনওটিরই সহজ উদাহরণ নেই যা একটি সহজেই সম্পর্কিত হতে পারে এবং প্রদত্ত তত্ত্বের সাথে যুক্ত হতে পারে। ..

এটি পটভূমি; আমি তিক্ত বাস্তবতাও উপলব্ধি করেছিলাম যে পরিসংখ্যানের উপর দৃ g় দখল না থাকলে গবেষক / ইঞ্জিনিয়ার হিসাবে আমার ক্যারিয়ার থাকতে পারে না, বিশেষত বায়োইনফরম্যাটিক্সের ক্ষেত্রে।

আমি আশাবাদী যে আমি আরও অভিজ্ঞ পরিসংখ্যানবিদ / গণিতবিদদের কাছ থেকে কিছু টিপস পেতে পারি। আমি উপরে উল্লিখিত এই সমস্যাটি কীভাবে কাটিয়ে উঠতে পারি? আপনি কি কোনও ভাল সংস্থান সম্পর্কে জানেন; যেমন বই, ই-বুকস, ওপেন কোর্স (আইটিউনস বা ওপেনকোর্সওয়্যারের মাধ্যমে প্রাক্তন) ইত্যাদি ..

সম্পাদনা: আমি যেমন উল্লেখ করেছি যে আমি পরিসংখ্যানের সাধারণ শিরোনামে বেশিরভাগ সাহিত্যের প্রতি পক্ষপাতদুষ্ট (নেতিবাচক), এবং যেহেতু আমি পরিসংখ্যানের শাখায় বেশ কয়েকটি বৃহত (এবং ব্যয়বহুল) পাঠ্যপুস্তক কিনতে পারি না, আমার কী প্রয়োজন হবে বইয়ের নিরিখে টিপলার ও মোশক পদার্থবিদ্যার জন্য একই রকম , তবে পরিবর্তে পরিসংখ্যানের জন্য।

যারা টিপলার সম্পর্কে জানেন না তাদের জন্য; এটি একটি বৃহত পাঠ্যপুস্তক যা উচ্চতর অধ্যয়নের সময় মুখোমুখি হতে পারে এমন বিস্তৃত অংশকে কভার করে এবং সেগুলির প্রতিটি মৌলিক পরিচয় থেকে শুরু করে কিছুটা গভীরতরভাবে বিশদভাবে উপস্থাপন করে। মূলত একটি নিখুঁত রেফারেন্স বই, এটি আমার প্রথম বছরে ইউনিতে কিনেছিল, এখনও একবারে একবারে এটি ব্যবহার করুন।


আমি পরিসংখ্যান নেভিগেশন গৃহীত কোর্স:

  • একটি বিশাল ভূমিকা কোর্স,
  • স্থির স্টোকাস্টিক প্রক্রিয়া,
  • মার্কভ প্রক্রিয়া,
  • মন্টি কার্লো পদ্ধতি
  • বেঁচে থাকার বিশ্লেষণ

উত্তর:


4

আপনার পরিস্থিতি আমি পুরোপুরি বুঝতে পারি। যদিও আমি পিএইচডি ছাত্র, তবুও আমি কখনও কখনও সম্পর্কিত তত্ত্ব এবং প্রয়োগের পক্ষে এটি কঠিন মনে করি। আপনি যদি তত্ত্বটি বোঝার জন্য নিজেকে ডুবিয়ে রাখতে ইচ্ছুক হন, আপনি যখন সত্যিকারের বিশ্ব সমস্যাগুলি নিয়ে ভাবেন তখন অবশ্যই তা লাভজনক। তবে প্রক্রিয়াটি হতাশ হতে পারে।

আমি পছন্দ করি এমন অনেকগুলি রেফারেন্সগুলির মধ্যে একটি হ'ল হিয়ারারিকাল / মাল্টিলেভেল মডেলগুলি ব্যবহার করে গেলম্যান এবং হিলের ডেটা অ্যানালাইসিস । তারা তত্ত্ব এড়ায় যেখানে তারা সিমুলেশন ব্যবহার করে অন্তর্নিহিত ধারণাটি প্রকাশ করতে পারে। এমসিএমসি ইত্যাদির যেমন আপনার অভিজ্ঞতা রয়েছে এটি অবশ্যই আপনার পক্ষে উপকৃত হবে আপনি যেমনটি বলেছেন যে আপনি বায়োইনফরম্যাটিকসে কাজ করছেন সম্ভবত হ্যারেলের রেগ্রেশন মডেলিং কৌশলগুলিও একটি দুর্দান্ত রেফারেন্স।

আমি এটিকে একটি সম্প্রদায় উইকি হিসাবে তৈরি করব এবং অন্যকে এতে যুক্ত করতে দেব।


বিষয়টি আপনার মনোযোগের জন্য ধন্যবাদ। এটি দেখে ভাল লাগল যে আমি কেবলই স্টাফগুলির মধ্যে বিভ্রান্ত হচ্ছি না। এটি বলা হচ্ছে, আমি মনে করি আপনি আমার পরিস্থিতিকে গুরুত্ব দিয়ে গেছেন; যদিও আমি বেশ কয়েকটি কোর্স নিয়েছি এবং পরিসংখ্যানগত বিশ্লেষণের বিভিন্ন উপায়ের অস্তিত্বের সাথে পরিচিত; কোর্স পরে তারা কখনও আমার সাথে থাকে না। পরীক্ষার কয়েক মাস পরে আমি নিজেকে ভাবতে থাকি; "আমি এটি কোথাও দেখেছি / শুনেছি, তবে এটি কীভাবে কার্যকর হয়েছিল?" এটি আমার কাছে পরামর্শ দেয় যে আমার এগুলি সমস্ত ছিঁড়ে ফেলতে হবে এবং আরও শক্তিশালী ভিত্তি দিয়ে এটি তৈরি করা উচিত।
পোস্টডেফ

আমি হ্যারেলের (নোট বানান) পাঠ্যের জন্য একটি দুর্দান্ত "সম্মতি" যুক্ত করব। এটির সাথে এটির সাথে আর কোডের দুটি-প্যাকেজ সংমিশ্রণটি দুর্দান্ত। আমি ভেনেবলস এবং রিপলির "মডার্ন অ্যাপ্লাইড স্ট্যাটিস্টিক উইথ এস "ও একটি ভাল অধিগ্রহণের বিষয় বলে মনে করি। আর শেখার জন্য ম্যাস ব্যবহার করার আগে আমার মাস্টার্স স্তরের পটভূমি ছিল (পদার্থবিজ্ঞানের একটি আন্ডারগ্রাড ডিগ্রি সহ) that সেই পাঠ্যে প্রয়োগ-প্রজ্ঞার প্রচুর পরিমাণ আছে।
ডিউইন

গেলম্যান রিগ্রেশন বইটি দুর্দান্ত, তিনি এগুলি খুব ভালভাবে ব্যাখ্যা করেছেন এবং আর কোড সরবরাহ করেছেন যা আপনার উপাদানটি বোঝার জন্য সত্যই কার্যকর।
richiemorrisroe

2

আপনি কি বায়সিয়ান ডেটা বিশ্লেষণ (গেলম্যান, কার্লিন, স্টার্ন এবং রুবিন দ্বারা) এর সাথে পরিচিত? হতে পারে এটি আপনার একটি ডোজ প্রয়োজন।


2

সমস্ত পরিসংখ্যানের সমস্যাগুলি 4 টি পদক্ষেপ অনুসরণ করতে সক্ষম হয় (যা আমি @ প্রশ্নের উত্তর থেকে অন্য প্রশ্নের উত্তর নিয়েছি ):

  1. প্যারামিটারটি অনুমান করুন।

  2. সেই অনুমানের গুণমানটি মূল্যায়ন করুন।

  3. ডেটা অন্বেষণ করুন।

  4. ফিট মূল্যায়ন।

আপনি শব্দ মডেল দিয়ে শব্দ পরামিতি বিনিময় করতে পারেন ।

পরিসংখ্যান বই সাধারণত বিভিন্ন পরিস্থিতিতে প্রথম দুটি পয়েন্ট উপস্থাপন করে। প্রতিটি বাস্তব বিশ্বের অ্যাপ্লিকেশনটির জন্য আলাদা পদ্ধতির প্রয়োজন হয়, তাই বিভিন্ন মডেল, সুতরাং বইগুলির একটি বড় অংশ এই বিভিন্ন মডেলের তালিকাভুক্ত করে। এটি অনাকাঙ্ক্ষিত প্রভাব ফেলেছে যে বিশদগুলিতে নিজেকে হারিয়ে ফেলা এবং বড় চিত্রটি মিস করা সহজ।

আমি যে বড় চিত্রের বইটি আন্তরিকভাবে সুপারিশ করি তা হ'ল Asympotic পরিসংখ্যান । এটি বিষয়টির একটি কঠোর চিকিত্সা দেয় এবং গাণিতিকভাবে "খাঁটি"। যদিও এর শিরোনামে অ্যাসিম্পটোটিক পরিসংখ্যানগুলির উল্লেখ রয়েছে, তবে বৃহত অব্যক্ত রহস্যটি হ'ল সংখ্যাগরিষ্ঠ ধ্রুপদী পরিসংখ্যান পদ্ধতি অ্যাসিপটোটিক ফলাফলের ভিত্তিতে মূলত রয়েছে।


2

আমি মনে করি এখানে সর্বাধিক গুরুত্বপূর্ণ বিষয়টি হ'ল পরিসংখ্যান এবং কিছু সাধারণ পরিসংখ্যান সংক্রান্ত ধারণা সম্পর্কে অন্তর্দৃষ্টি বিকাশ করা। সম্ভবত এটি করার সর্বোত্তম উপায়টি এমন কিছু ডোমেন যা আপনি "মালিকানাধীন" রাখতে পারেন can এটি একটি ইতিবাচক প্রতিক্রিয়া লুপ সরবরাহ করতে পারে যেখানে ডোমেন সম্পর্কে বোঝা আপনাকে অন্তর্নিহিত পরিসংখ্যান সম্পর্কে আরও বুঝতে সহায়তা করে যা আপনাকে ডোমেন ইত্যাদি সম্পর্কে আরও বুঝতে সহায়তা করে etc.

আমার জন্য সেই ডোমেনটি ছিল বেসবলের পরিসংখ্যান। আমি বুঝতে পেরেছি যে একটি ব্যাটার একটি গেমটিতে 4 রানে 3 রানে যায় "সত্য" .750 হিটার নয়। এটি আরও সাধারণ বিষয়টি বুঝতে সহায়তা করে যে স্যাম্পল ডেটা অন্তর্নিহিত বিতরণের মতো নয়। আমি আরও জানি যে তিনি সম্ভবত গড় খেলোয়াড়ের কাছাকাছি একজন 77০ হিটারের কাছাকাছি, সুতরাং এটি প্রতিরোধের মতো ধারণাগুলি বুঝতে সহায়তা করে। সেখান থেকে আমি পূর্ণ বয়েসিয়ান অনুমানে যেতে পারি যেখানে আমার পূর্বের সম্ভাবনা বন্টনটির গড় বেসবল খেলোয়াড়ের গড় ছিল এবং আমার উত্তরোত্তর বন্টন আপডেট করার জন্য আমার কাছে এখন 4 টি নতুন নমুনা রয়েছে।

আপনার জন্য সেই ডোমেনটি কী তা আমি জানি না, তবে আমি অনুমান করব যে এটি কেবল পাঠ্যপুস্তকের চেয়ে বেশি সহায়ক হবে। উদাহরণগুলি তত্ত্বটি বুঝতে সহায়তা করে, যা উদাহরণগুলি বুঝতে সহায়তা করে। উদাহরণ সহ একটি পাঠ্যপুস্তকটি দুর্দান্ত তবে আপনি যদি সেই উদাহরণগুলি "আপনার" না তৈরি করতে পারেন তবে আমি ভাবছি যে এগুলি থেকে আপনি যথেষ্ট পরিমাণে পাবেন।



1

প্রত্যেকে আলাদা আলাদাভাবে শিখেন তবে আমি মনে করি এটি নিরাপদ বলে দেওয়া যায় যে উদাহরণ, উদাহরণ, উদাহরণ পরিসংখ্যানগুলিতে অনেক সহায়তা করে। আমার পরামর্শ হ'ল আর শিখতে হবে (কেবলমাত্র বেসিকগুলি যথেষ্ট সাহায্য করার জন্য যথেষ্ট) এবং তারপরে আপনার চোখের রক্তক্ষরণ না হওয়া পর্যন্ত আপনি যে কোনও এবং প্রতিটি উদাহরণ চেষ্টা করতে পারেন। আপনি এটি বাছাই করতে পারেন, এটি ফিট করতে পারেন, এটি চক্রান্ত করতে পারেন, আপনি নাম দিন। আর, যেহেতু আর পরিসংখ্যানগুলির দিকে মনোনিবেশ করা, আপনি যেমন শিখেন তেমনি আপনি পরিসংখ্যানও শিখবেন। আপনি যে তালিকাভুক্ত তালিকাভুক্ত বইগুলি তখন "আমাকে দেখান" দৃষ্টিকোণ থেকে আক্রমণ করা যেতে পারে।

যেহেতু আর নিখরচায়, এবং প্রচুর উত্সের উপাদান বিনামূল্যে, আপনার বিনিয়োগের জন্য যা দরকার তা হ'ল আপনার সময়।

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

আর-তে অনেকগুলি ভাল বই রয়েছে যা আপনি কিনতে পারেন, এখানে আমি ব্যবহার করেছি:

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

সম্পাদনা করুন ============

আমি কয়েকটি লিঙ্ক যুক্ত করতে ভুলে গেছি। আপনি যদি উইন্ডোজ ব্যবহার করেন, আর ফিড দেওয়ার জন্য একটি ভাল সম্পাদক হ'ল টিন-আর (অন্য কেউ ম্যাক বা লিনাক্সের সম্পাদকদের জন্য লিঙ্ক যুক্ত করতে পারেন)।

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/


লিঙ্কগুলির জন্য ধন্যবাদ, আমি চেষ্টা করব এবং আগামী সপ্তাহগুলিতে আমি যতটা পারি তার মধ্য দিয়ে যাবো ... বেঁচে থাকার বিশ্লেষণ কোর্সে আমি এর আগে একবার আর এর মুখোমুখি হয়েছি, যেখানে আমরা প্রচুর পরিমাণে মাল্টিভারিয়েট রিগ্রেশন করেছি (কক্স এবং অ্যালেন) মডেলগুলি) এবং অন্যান্য সামগ্রীর একগুচ্ছ আমি সত্যিই স্মরণ করতে পারি না। আর ম্যাটল্যাবের প্রতি খুব অভ্যস্ত ব্যক্তি হিসাবে আর সম্পর্কে আমার ধারণাটি বেশ নেতিবাচক ছিল, তবে আমি পুলের গভীর প্রান্তে কমবেশি নিক্ষিপ্ত হয়ে পড়েছিলাম এবং এরপরে শিখতে আশা করি এর সাথে আমার অনেক কিছু করার ছিল আমাদের নিজের উপর সাঁতার কাটা, যা অবশ্যই আমাকে তখন থেকেই সফ্টওয়্যারটি ঘৃণা করতে পরিচালিত করেছিল :) সম্ভবত এটি পরিবর্তনের সময়
২৩ শে

1

আমি ব্যক্তিগতভাবে পছন্দ এই যা তত্ত্ব ও প্রয়োগের সত্যিই একটি ভাল মিশ্রণ (উদাহরণ প্রচুর সঙ্গে) ছিল। এটি আরও তত্ত্ব ভিত্তিক পদ্ধতির জন্য কেসেলা এবং বেরেজারের সাথে একটি ভাল মিল ছিল। এবং একটি ব্রড ব্রাশ ওভারভিউ জন্য এই


উভয় বইয়ের অ্যামাজনের উপর ভাল পর্যালোচনা রয়েছে বলে মনে হয়, কেউ কি এগুলি সম্পর্কে কোনও মতামত (সম্ভবত কিছুটা বিশদভাবে) যুক্ত করতে পারেন? BTW; কেসেলা এবং বেরেরার দ্বারা আপনি "স্ট্যাটিস্টিকাল ইনফারেন্স" বলতে চান?
পোষ্টেফ

হ্যাঁ 'পরিসংখ্যান অনুমান'। আমার জন্য একটি বড় পদক্ষেপটি সম্ভাব্যতা মডেলগুলি বোঝার থেকে বোঝা যাচ্ছে যে কীভাবে মডেলগুলি পরীক্ষার জন্য ডেটা ব্যবহার করতে হবে এবং মডেলগুলির পরামিতি অনুমান করা যায়। বিশেষত ডেভিসন বইটি সত্যই এই বিষয়টিকে কেন্দ্র করে।
অলওয়েসিয়ান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.