কেসেলা এবং বার্জারের পরে কী শিখতে হবে?


22

আমি প্রয়োগিত গণিতে সামান্য ব্যাকগ্রাউন্ড সহ খাঁটি গণিত গ্রেডের শিক্ষার্থী। শেষ পড়ার পর থেকে আমি কেসেলা ও বার্গারের বইতে ক্লাস নিচ্ছি এবং বইটিতে অনুশীলনের সমস্যার শত শত পৃষ্ঠা (230+) শেষ করেছি। এখনই আমি দশম অধ্যায়ে আছি।

তবে, যেহেতু আমি পরিসংখ্যানগুলিতে ব্যয়বহুল হইনি বা একটি পরিসংখ্যানবিদ হওয়ার পরিকল্পনা করেছি, তাই ডেটা বিশ্লেষণ শিখতে আমি নিয়মিত সময় বিনিয়োগ করতে সক্ষম হব বলে মনে করি না। আমার অভিজ্ঞতা এখনও অবধি আমাকে বলছে যে একজন পরিসংখ্যানবিদ হওয়ার জন্য বিভিন্ন বিতরণের সাথে জড়িত প্রচুর ক্লান্তিকর গণনা সহ্য করতে হবে (ওয়েইবুল, কচী, , ...)। আমি খুঁজে পেয়েছি যখন মৌলিক ধারণাগুলি সহজ, বাস্তবায়ন (উদাহরণস্বরূপ অনুমানের পরীক্ষায় এলআরটি) প্রযুক্তিগততার কারণে এখনও কঠিন হতে পারে।টিএফ

আমার বোধগম্যতা কি সঠিক? আমি সম্ভাব্যতা এবং পরিসংখ্যানগুলি শিখতে পারি এমন কোনও উপায় আছে যা কেবলমাত্র আরও উন্নত উপাদানকেই কভার করে না, তবে সত্যিকারের জীবনে ডেটা বিশ্লেষণের প্রয়োজনে সেই ক্ষেত্রেও সহায়তা করতে পারে? আমি ব্যয় করতে হবে আমি করতে ব্যবহৃত এটিতে প্রতি সপ্তাহে 20 ঘন্টা?

যদিও আমি বিশ্বাস করি গণিত শেখার কোনও রাজপথ নেই, তবে আমি প্রায়শই অবাক হয়ে ভাবতে পারি না - বেশিরভাগ সময় আমরা জানি না যে বাস্তব জীবনের ডেটাগুলির জন্য বিতরণ কী, তাই আমাদের বিতরণের বিভিন্ন পরিবারগুলিতে একচেটিয়াভাবে দৃষ্টি নিবদ্ধ করার উদ্দেশ্য কী? ? যদি নমুনার আকার ছোট হয় এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রয়োগ না হয়, তবে বিতরণটি অজানা থাকলে আমরা কীভাবে নমুনা গড় এবং বৈচিত্রের পাশাপাশি ডেটা সঠিকভাবে বিশ্লেষণ করতে পারি?

আমার সেমিস্টার এক মাসের মধ্যে শেষ হবে, এবং আমি আমার পিএইচডি গবেষণায় ফোকাস শুরু করার পরে আমার জ্ঞানটি বাষ্পীভূত হওয়া চাই না। তাই আমি জিজ্ঞাসা করার সিদ্ধান্ত নিয়েছে। আমি আর শিখছি, এবং আমার কিছু প্রোগ্রামিং ব্যাকগ্রাউন্ড রয়েছে তবে আমার স্তরটি একটি কোড বানরের মতোই।

উত্তর:


24

আমি মনে করি না যে ডেটা বিশ্লেষণ শিখতে আমি নিয়মিত সময় বিনিয়োগ করতে সক্ষম হব

আমি মনে করি না Casella & বার্জার অনেক ভাবে ডেটা জানার জন্য একটি জায়গা হয় না তথ্য বিশ্লেষণ । এটি পরিসংখ্যানগত তত্ত্বের কয়েকটি সরঞ্জাম শিখার জায়গা।

আমার অভিজ্ঞতা এখনও অবধি আমাকে একটি পরিসংখ্যানবিদ বলার দরকার রয়েছে বিভিন্ন বিতরণের সাথে জড়িত প্রচুর ক্লান্তিকর গণনা সহ (ওয়েইবুল, কচী, টি, এফ ...)।

আমি পরিসংখ্যানবিদ হিসাবে ডেটা বিশ্লেষণ করে অনেক সময় ব্যয় করেছি। এটি খুব কমই (প্রায় কখনই নয়) আমাকে ক্লান্তিকর গণনা করার সাথে জড়িত। এটি কখনও কখনও সামান্য বীজগণিতের সাথে জড়িত থাকে, তবে সাধারণ সমস্যাগুলি সাধারণত সমাধান হয়ে যায় এবং প্রতিবারের প্রতিরূপ তৈরি করার জন্য আমার কোনও প্রচেষ্টা ব্যয় করার প্রয়োজন নেই।

কম্পিউটার সব ক্লান্তিকর গণনা করে।

যদি আমি এমন পরিস্থিতিতে আছি যেখানে আমি যুক্তিসঙ্গতভাবে স্ট্যান্ডার্ড কেস ধরে নিতে প্রস্তুত নই (যেমন একটি জিএলএম ব্যবহারের জন্য প্রস্তুত নই), সাধারণত আমার কাছে অন্য কোনও বিতরণ অনুমান করার মতো পর্যাপ্ত তথ্য নেই, সুতরাং গণনাগুলির প্রশ্ন এলআরটি সাধারণত মোটা হয় (যখন প্রয়োজন হয় তখন আমি সেগুলি করতে পারি, তারা হয় ইতিমধ্যে সমাধান করা বা খুব কমই সামনে আসে যে এটি একটি আকর্ষণীয় ডাইভার্সন)।

আমি অনেক সিমুলেশন করতে ঝোঁক; আমি প্রায়শই কিছু ফর্মের পাশাপাশি প্যারামেট্রিক অনুমানের জায়গায় পুনরায় মডেলিং ব্যবহার করার চেষ্টা করি।

আমি আগে যা করতাম তা প্রতি সপ্তাহে 20 ঘন্টা + ব্যয় করতে হবে?

এটি আপনি কী করতে সক্ষম হতে চান এবং কত তাড়াতাড়ি আপনি এটিতে ভাল হতে চান তার উপর নির্ভর করে।

ডেটা বিশ্লেষণ একটি দক্ষতা, এবং এটি অনুশীলন এবং জ্ঞানের একটি বিশাল ভিত্তি নেয়। আপনার ইতিমধ্যে কিছু জ্ঞানের প্রয়োজন হবে।

আপনি যদি বিবিধ জিনিসে একজন ভাল প্র্যাকটিশনার হতে চান তবে এটি অনেক সময় নিতে পারে - তবে আমার মনে হয় বীজগণিত এবং কেসেলা এবং বার্গার অনুশীলন করার চেয়ে এটি অনেক বেশি মজাদার।

রিগ্রেশন সমস্যাগুলির বিষয়ে আমি যে দক্ষতাগুলি তৈরি করেছি তার মধ্যে কিছু টাইম সিরিজের ক্ষেত্রে সহায়ক, বলুন - তবে প্রচুর নতুন দক্ষতার প্রয়োজন। সুতরাং অবশিষ্ট প্লট এবং কিউকিউ প্লটগুলি ব্যাখ্যা করা শিখতে সুবিধাজনক, তবে তারা আমাকে বলেন না যে আমি একটি পিএসিএফ প্লটটিতে সামান্য ধাক্কা খাওয়ার জন্য কতটা চিন্তা করা দরকার এবং আমাকে এক-পদক্ষেপের পূর্বে ভবিষ্যদ্বাণী ব্যবহারের মতো সরঞ্জামগুলি দেবেন না ত্রুটি।

সুতরাং উদাহরণস্বরূপ, সাধারণ গামা বা ওয়েইবুল মডেলগুলির জন্য কীভাবে যুক্তিসঙ্গতভাবে এমএল করবেন তা নির্ধারণের জন্য আমার প্রচেষ্টা ব্যয় করার দরকার নেই , কারণ তারা ইতিমধ্যে বেশিরভাগ সুবিধামত আকারে ফেলে আসা সমস্যার সমাধান করার পর্যাপ্ত মানদণ্ড।

আপনি যদি গবেষণা করতে এসে থাকেন তবে ক্যাসেলা এবং বার্জারের মতো জায়গাগুলিতে আপনি যে দক্ষতা অর্জন করেছেন সেগুলির অনেক বেশি প্রয়োজন (তবে এমনকি এই ধরণের দক্ষতার সাথেও আপনার একাধিক বই পড়তে হবে)।


কিছু প্রস্তাবিত জিনিস:

আপনি অন্য কিছু না করলেও আপনার অবশ্যই কিছুটা রিগ্রেশন দক্ষতা তৈরি করা উচিত।

বেশ কয়েকটি বেশ কয়েকটি ভাল বই রয়েছে তবে সম্ভবত ড্রপার অ্যান্ড স্মিথ অ্যাপ্লাইড রিগ্রেশন অ্যানালাইসিস প্লাস ফক্স এবং ওয়েজবার্গ অ্যান আর কম্পায়েন্ট টু অ্যাপ্লাইড রেজগ্রেশন ; আমি হ্যারেলের রেগ্রেশন মডেলিং কৌশলগুলি অনুসরণ করে বিবেচনা করার পরামর্শ দিই

(আপনি ড্রপার এবং স্মিথের জন্য যে কোনও ভাল বইয়ের বিকল্প হিসাবে নিতে পারেন - আপনার উপযুক্ত একটি বা দুটি সন্ধান করুন))

দ্বিতীয় বইটিতে বেশ কয়েকটি অনলাইন অতিরিক্ত অধ্যায় রয়েছে যা পড়ার পক্ষে খুব বেশি মূল্যবান (এবং এর নিজস্ব আর-প্যাকেজ)

-

একটি ভাল দ্বিতীয় পরিবেশন হ'ল ভেনেবলস এবং রিপলির এস এর সাথে আধুনিক প্রয়োগিত পরিসংখ্যান

এটি ধারণাগুলি সম্পর্কে মোটামুটি বিস্তৃত কিছু ভিত্তি।

এটি পরিণত হতে পারে যে কয়েকটি বিষয়ে আপনার আরও কিছু প্রাথমিক উপাদান প্রয়োজন (আমি আপনার পটভূমি জানি না)।

তারপরে আপনার কী পরিসংখ্যানগুলি প্রয়োজন / প্রয়োজন তা নিয়ে আপনাকে ভাবনা শুরু করতে হবে - বায়েশিয়ান পরিসংখ্যান, সময় ধারাবাহিকতা, বহুবিধ বিশ্লেষণ ইত্যাদি


6

আমার পরামর্শ, বিপরীত দৃষ্টিকোণ থেকে আসা (স্ট্যাটাস পিএইচডি শিক্ষার্থী) একটি রিগ্রেশন পাঠ্যপুস্তকের মাধ্যমে কাজ করা। এটি দৃ applied় তাত্ত্বিক ব্যাকগ্রাউন্ডযুক্ত কারও জন্য কোনও প্রয়োগিত অভিজ্ঞতা ছাড়াই প্রাকৃতিক সূচনাপথ বলে মনে হচ্ছে। আমি জানি আমাদের বিভাগের বাইরের অনেক স্নাতক শিক্ষার্থী একটি রিগ্রেশন কোর্স শুরু করে।

স্যানফোর্ড ওয়েজবার্গের প্রয়োগিত লিনিয়ার রিগ্রেশন একটি ভাল । আমি বিশ্বাস করি এটি এর চতুর্থ সংস্করণে রয়েছে। আপনি সম্ভবত তুলনামূলকভাবে সস্তা পুরানো সংস্করণগুলি খুঁজে পেতে পারেন।

http://users.stat.umn.edu/~sandy/alr4ed/

এই পাঠ্যপুস্তকটি সম্পর্কে একটি দুর্দান্ত জিনিস, বিশেষত আর এর সাথে আপনার আপেক্ষিক অনভিজ্ঞতা দেওয়া হল, উপরের লিঙ্কটির মাধ্যমে আর প্রাইমার উপলব্ধ। এটি বইতে সমস্ত কিছু পুনরায় তৈরি করার জন্য পর্যাপ্ত নির্দেশনা সরবরাহ করে। এইভাবে, আপনি আসলে আরগ্রেশন শিখতে পারেন (জিএলএমের কিছু বেসিক ছাড়াও), আপনার আর প্রোগ্রামিংয়ের অভাব ব্যতীত আপনাকে পিছনে ফেলেছে (এবং আপনি সম্ভবত বেশ কয়েকটি আর বেসিকগুলি বেছে নেবেন)।

আপনি যদি আর এর একটি বিস্তৃত ভূমিকা চান তবে আপনাকে ফক্স এবং ওয়েজবার্গের অ্যান আর কম্পায়েন টু অ্যাপ্লাইড রেজিস্ট্রেশনের মাধ্যমে আরও ভালভাবে পরিবেশন করা যেতে পারে তবে মনে হচ্ছে আপনি প্রোগ্রামিংয়ের চেয়ে পরিসংখ্যান শিখবেন (যদি এই দুটি বিষয় আলাদাভাবে ভাবা যায়)।

আপনার সময়ের প্রতিশ্রুতি হিসাবে যতটা উদ্বিগ্ন, আমি সত্যিই ভাবি না যে আপনি এই পাঠ্যপুস্তক বা উপাদানকে অত্যধিক কঠিন বলে খুঁজে পাবেন। ক্যাসেলা-বার্জারের বিপরীতে, প্রমাণ বা ডেরাইভেশনগুলির মতো খুব বেশি কিছু হবে না। এটি সাধারণত বেশ সোজা।

একদিকে যেমন অনলাইনে (বা কোনও সময় ছিল) সমাধানগুলি ভেসে উঠতে পারে বলে মনে হয়, যাতে আপনি সমস্যার চেষ্টা করতে পারেন, সমাধানগুলি পরীক্ষা করতে পারেন এবং বইটির মধ্য দিয়ে এক ধরণের গতি কাজ করতে পারেন।


4

আমি নিজেকে আরও পরিসংখ্যানবিদ হওয়ার জন্য চক্রাকার পথে চেষ্টা করছি, তবে আমি মূলত এমন মনোবিজ্ঞানী যাকে কিছু পরিমাণগত এবং পদ্ধতিগত আগ্রহ থাকে। সাইকোমেট্রিকের কাজটি সঠিকভাবে করার জন্য, আমি উন্নত (মনোবিজ্ঞানীর জন্য) পদ্ধতিগুলি অধ্যয়ন করেছি যা আমি নিজেই গণনা করার স্বপ্ন দেখি না (কীভাবে আমি তা কম জানি)। বিগত দশকে আর প্যাকেজ প্রোগ্রামারগুলির সমস্ত নিবেদিত প্রচেষ্টার মাধ্যমে এই পদ্ধতিগুলি কীভাবে অ্যাক্সেসযোগ্য এবং সুবিধাজনক হয়ে উঠেছে তা নিয়ে আমি অবাক হয়েছি। আমি 20 টিরও বেশি পদ্ধতিতে ব্যবহার করতে শিখেছি এমন নতুন পদ্ধতির সাথে বাস্তব জীবনের বিশ্লেষণ করছি ... আমি প্রকাশের জন্য প্রস্তুত হওয়ার সময় পর্যন্ত আমি একটি নতুন পদ্ধতিতে এতটা সময় ব্যয় করতে পারি ফলাফলটি ব্যবহার করে, তবে আমার মতো অগ্রগতি অর্জনের জন্য অবশ্যই অধ্যয়নের একটি খণ্ডকালীন কাজ করার দরকার নেই। আপনি এটির জন্য সময় খুঁজে পাওয়ার সাথে সাথে যা করতে পারেন তা করুন; আপনার যদি এটির প্রয়োজন না হয় তবে এটি সর্বসাধারণ বা কিছুই অনুসরণ নয়।

আমি অবশ্যই কোনও বিষয়ে একচেটিয়াভাবে মনোনিবেশ করিনি, বিতরণ পরিবারগুলিকে ছেড়ে দিন; আমি সন্দেহ করি যে কোনও সৎ-থেকে-সদর্থক পরিসংখ্যানবিদ এতটা সংকীর্ণভাবে পড়াশোনা করতে পারে। আমি গত সপ্তাহে কয়েকটি উপলক্ষে প্রতিদিন এক ঘন্টার জন্য তাত্ত্বিক বিতরণে ছড়িয়ে পড়েছি; বাস্তব তথ্য অ্যাপ্লিকেশনগুলিতে দরকারী প্রমাণ করার জন্য এটি প্রচুর ছিল। আমি যতদূর বলতে পারি, ধারণাটি বিতরণকে কঠোরভাবে শ্রেণিবদ্ধ করার মতো নয়; এটি তত্ত্বগুলির অনুরূপ ডিস্ট্রিবিউশন আকারগুলি সনাক্ত করতে এবং যথাযথ বিশ্লেষণগুলি নির্ধারণ করতে এবং মৌলিক গতিবিদ্যা বুঝতে সহায়তা করতে তাদের ব্যবহার করে। আমি আমার সাম্প্রতিক জবাবটিতে একই মতামত ভাগ করেছি "" তত্ত্ব, ফিট বা অন্য কোনও কিছুর উপর ভিত্তি করে বিতরণগুলি নির্বাচন করা কি ভাল? "

আপনার অনুমানের সবচেয়ে খারাপ পরিস্থিতি বলে আমি মনে করি আপনি কী বিশ্লেষণ করতে চান তা আপনি বলেননি , তবে নমুনা ত্রুটির ক্ষেত্রে কোনও বিশ্লেষণের সংবেদনশীলতা অধ্যয়ন করার উপায় রয়েছে। যদি সিএলটি আবেদন না করে তবে এখনও বেশ কয়েকটি পরিসংখ্যানমূলক প্রশ্ন রয়েছে যা আপনি কীভাবে জানেন তা জিজ্ঞাসা করতে পারেন। ননপ্যারমেট্রিক পদ্ধতিগুলি সাধারণত বিতরণ সম্পর্কে খুব সীমিত অনুমান করে, সুতরাং জনসংখ্যার বন্টনের আকার সম্পর্কে পূর্ববর্তী জ্ঞান অগত্যা কোনও বড় সমস্যা নয়।

জ্ঞান সাধারণভাবে তাড়াতাড়ি বা সম্পূর্ণরূপে বাষ্পীভূত হয় না, তবে আপনি যদি এটি ব্যবহার না করেন তবে অবাধে স্মরণ করা আপনার পক্ষে আরও কঠিন er আপনি অনেক দিন ধরে একটি স্বীকৃতি সুবিধা বজায় রাখতে পারবেন, যা বেশ কয়েক বছর আগে পড়াশুনা করা বিষয়গুলি পড়াশুনার জন্য যদি আপনার প্রয়োজন হয় তবে এখনও কার্যকর হতে পারে ... তবে আপনি যা শিখেছেন তাতে সাবলীল থাকতে চান, এটি ব্যবহার চালিয়ে যান , এবং শেখা চালিয়ে যান! আপনার যে কোনও অতিরিক্ত অধ্যয়নের সময় বিনিয়োগের জন্য অবশ্যই স্পষ্টতই একটি ভাল জায়গা। এটি আপনার খাঁটি গণিতেও সহায়তা করবে: " পাওয়ারপয়েন্টের সাথে ব্যবহারের জন্য সেরা ওপেন সোর্স ডেটা ভিজ্যুয়ালাইজেশন সফ্টওয়্যার " এর জন্য আমার সাম্প্রতিক উত্তরগুলি দেখুন ।


3

আমি 2019 এ এটিকে হোঁচট খেয়েছি My আমার দুটি সেন্ট।

আমি বিভিন্ন ধরণের ডেটা বিশ্লেষণ করার প্রবণতা সহ একটি পরিসংখ্যান অধ্যাপক (সে কারণেই আমি পরিসংখ্যানটি বেছে নিই!)। কিছু ব্যবহারিক জ্ঞান বাছাই করার জন্য, আমি জেমস, উইটেন, হাস্টি এবং তিবশিরানি "স্ট্যাটিস্টিকাল লার্নিংয়ের একটি ভূমিকা" প্রস্তাব দিই। এমনকি তাদের ভিত্তিতে একটি এমওওসি রয়েছে have বইটিতে প্রচুর "বাস্তব তথ্য" উদাহরণ ব্যবহার করা হয়েছে এবং এটি আর-ভিত্তিক।


"পরিসংখ্যানগত শিক্ষার উপাদানগুলি" এর বাইরে পরামর্শ দেওয়ার মতো আপনার কি কিছু আছে? আমি মনে করি আমি এখন বইটির (মূল বিষয়গুলির) সাথে পরিচিত।
বোম্বিক্স মোরি

2

এই প্রশ্নে পরে আসা অন্যদের জন্য উত্তর দেওয়া হচ্ছে ...


বাস্তব জীবনের ডেটা বিশ্লেষণ

ডেটাবেস (এসকিউএল), ডিপি্লায়ার / প্যান্ডাস, ইউনিক্স সরঞ্জাম (সেড, গ্রেপ), স্ক্র্যাপিং, স্ক্রিপ্টিং, ডেটা সাফাই এবং সফ্টওয়্যার পরীক্ষা শিখুন। বিভিন্ন বিশেষায়িত বিতরণের শিল্পে খুব কম মূল্য রয়েছে।

অ্যাংজিস্ট অ্যান্ড পিস্কে, ফারাওয়ে বা ওয়েইসবার্গের মতো প্রয়োগ করা রিগ্রেশন বইটি আরও ব্যবহারিক ধরণের তত্ত্ব হতে পারে।

বেশিরভাগ সময় আমরা জানি না যে বাস্তব জীবনের ডেটাগুলির জন্য বিতরণটি কী, তাই আমাদের বিতরণের বিভিন্ন পরিবারগুলিতে একচেটিয়াভাবে মনোনিবেশ করার উদ্দেশ্য কী?

অতএব ননপ্যারমেট্রিক পরিসংখ্যানগুলিতে আগ্রহ। কিন্তু একই সাথে কোনও অনুমান সহ ননপ্যারমেট্রিক খুব আলগা। আপনার প্রশ্নের উত্তর দেওয়ার জন্য, বিশেষত পরিবারগুলিকে এমন সাধারণ প্রশ্নের উত্তর হিসাবে ভাবা যেতে পারে যা আপনি সম্ভবত আসতে পারেন। উদাহরণস্বরূপ আমি কোনও গাউসিকে "মসৃণ" পয়েন্ট-অনুমান হিসাবে মনে করি। পোইসন আরও একটি সহজ প্রশ্নের উত্তর দেয়। লোকেরা যখন গাণিতিক মডেলগুলি তৈরি করেন এই বিশেষগুলি কার্যকর ফুলক্রাম পয়েন্ট হতে পারে। (তবে শিক্ষাবিদরা প্রায়শই মাস্টার বিতরণকে ভুল উপায়ে সন্ধান করেন))

ওপি: আশা করি আপনি আপনার পিএইচডি গবেষণাটি উপভোগ করেছেন!

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.