পরিসংখ্যান অন্তর্নিহিত / ডেটা বোধ


20

আমি দ্বিতীয় বর্ষের স্নাতক শিক্ষার্থী, গণিত অধ্যয়ন করছি এবং আমি আমার এক অধ্যাপকের সাথে গাণিতিক দক্ষতা এবং পরিসংখ্যানগত দক্ষতার মধ্যে পার্থক্য সম্পর্কে ভাল পরিমাণে কথা বলছি। তিনি যে মূল পার্থক্য নিয়ে এসেছিলেন তার মধ্যে একটি হ'ল "ডেটা সেন্স" যা তিনি প্রযুক্তিগত দক্ষতার সংমিশ্রণ হিসাবে ব্যাখ্যা করেছিলেন যা আমি অনানুষ্ঠানিকভাবে "সাধারণ জ্ঞান প্রতিরোধ" বলব যার অর্থ সমস্যার মাঝে বাস্তবতা হারাবেন না তার সেটগুলির মধ্যে কাজ করার সময়। তত্ত্ব অনেক। এটি আমি যে বিষয়ে কথা বলছিলাম তার একটি উদাহরণ যা গওয়ার্সের ব্লগে প্রকাশিত হয়েছিল:

যুক্তরাজ্যের বেশ কয়েকটি অংশে পুলিশ যেখানে সড়ক দুর্ঘটনা ঘটেছিল, দুর্ঘটনার কবরের চিহ্নিত করেছিল, সেখানে স্পিড ক্যামেরা রেখেছিল এবং আরও পরিসংখ্যান সংগ্রহ করেছিল তার পরিসংখ্যান সংগ্রহ করেছিল। স্পষ্ট ক্যামেরা বসানোর পরে এই কৃষ্ণাঙ্গগুলিতে দুর্ঘটনার সংখ্যা কমে যাওয়ার জন্য একটি নির্দিষ্ট প্রবণতা ছিল। এটি কি শেষ পর্যন্ত দেখায় যে স্পিড ক্যামেরাগুলি রাস্তার সুরক্ষা উন্নত করে?

আলোচনার খেলায় এলোমেলো কৌশলের জন্য যে যুক্তি দিয়েছিল একই ব্যক্তি ইতিমধ্যে ইতিমধ্যে এই প্রশ্নের উত্তর জানতেন। তিনি বলেছিলেন না, যেহেতু আপনি যদি চরম মামলাগুলি বেছে নেন তবে আপনি যদি আবার পরীক্ষা চালান তবে আপনি সেগুলি কম চূড়ান্ত হওয়ার প্রত্যাশা করবেন। অনেক কিছুই বলার অপেক্ষা রাখে না বলে আমি এই প্রশ্নটি থেকে দ্রুত এগিয়ে যাওয়ার সিদ্ধান্ত নিয়েছি। তবে আমি লোকদের আমার একটি পরিকল্পনা সম্পর্কে বলেছিলাম, যা ছিল একটি বোগাস টেলিপ্যাথি পরীক্ষা করা। আমি তাদের 20 টি কয়েন টসসের ফলাফল অনুমান করার জন্য পেয়ে যাব, যা আমি তাদের কাছে টেলিপ্যাথিকভাবে বিম করার চেষ্টা করব। আমি তখন তিনটি সেরা পারফর্মার এবং তিনটি সবচেয়ে খারাপকে বেছে নেব এবং আবার কয়েনগুলি টস করব, এবার সবচেয়ে ভাল লোককে আমার কাছে সবচেয়ে খারাপের উত্তরগুলিকে বীম করতে সহায়তা করতে বলুন। লোকেরা সহজেই দেখতে পেল যে পারফরম্যান্সের উন্নতি হবে বলে আশা করা হবে এবং টেলিপ্যাথির সাথে এটির কোনও সম্পর্ক নেই।

আমি যা জিজ্ঞাসা করছি তা হল এই "ডেটা সেন্স" সম্পর্কে কীভাবে এই বিষয়ে কোনও প্রকাশনা, যদি তা বিদ্যমান থাকে বা অন্য ব্যবহারকারীরা কীভাবে এই দক্ষতা বিকাশে সহায়ক বলে মনে করেছেন তার মাধ্যমে আরও কীভাবে শিখবেন । আমি দুঃখিত যদি এই প্রশ্নের ব্যাখ্যা দেওয়ার প্রয়োজন হয়; যদি তা হয় তবে আপনার প্রশ্ন পোস্ট করুন! ধন্যবাদ।


পরিসংখ্যানের সাথে কীভাবে মিথ্যা বলা যায় তা শুরু করার দুর্দান্ত জায়গা।
MTnsT

ড্রোনকার্ডস ওয়াক একটি অ্যাক্সেসযোগ্য, কমনসেন্স কাঠামোতে পরিসংখ্যানও রাখে।
মার্কাস মরিসেই

উত্তর:


10

আমি প্রথমে বলব আমাদের সামান্য গণিত করা উচিত নয়। এটি পরিসংখ্যানগত তত্ত্বের বিকাশের একটি গুরুত্বপূর্ণ হাতিয়ার এবং পরিসংখ্যানগত পদ্ধতিগুলি তত্ত্ব দ্বারা ন্যায়সঙ্গত হয়। থিওরি আপনাকে এও বলে দেয় যে কোনটি ভুল এবং কোনটি প্রযুক্তিবিদ ভাল হতে পারে (যেমন আরও দক্ষ)) সুতরাং আমি মনে করি একটি ভাল পরিসংখ্যানবিদ হওয়ার জন্য গাণিতিক জ্ঞান এবং চিন্তাভাবনা গুরুত্বপূর্ণ (প্রায় প্রয়োজনীয়)। তবে এটি অবশ্যই যথেষ্ট নয়। আমি মনে করি মন্তব্যে উল্লিখিত বইগুলি ভাল। আমাকে অন্য কিছু দিতে দিন।

ডেটা সেন্স তৈরি করা: অনুসন্ধান ডেটা বিশ্লেষণ এবং ডেটা মাইনিংয়ের একটি ব্যবহারিক গাইড

ডেটা সেন্স তৈরি করা II: ডেটা ভিজ্যুয়ালাইজেশন, উন্নত ডেটা মাইনিং পদ্ধতি এবং অ্যাপ্লিকেশনগুলির ব্যবহারিক গাইড

পরিসংখ্যানগত চিন্তাভাবনা: ব্যবসায়ের পারফরম্যান্স উন্নত করা

ব্যবসা এবং শিল্পের পরিসংখ্যানের ভূমিকা

পরিসংখ্যানে একটি কেরিয়ার: সংখ্যা ছাড়িয়ে

হান এবং স্নির বইগুলি বিশেষত মূল্যবান এবং আকর্ষণীয় কারণ এগুলি গাণিতিক দক্ষতা এবং ব্যবহারিক অভিজ্ঞতার সাথে বিখ্যাত শিল্প পরিসংখ্যানবিদ।


7
লিঙ্ক এবং ভাষ্য জন্য ধন্যবাদ। আমি মনে করি যে [manuscript title](uri) লিংক মার্কডাউন ব্যবহার করে উত্তরগুলি আরও উন্নত করা যায় । দীর্ঘ দিন পরে, আমি দেখতে পেলাম যে দীর্ঘ হাইপারলিংকের সাথে উত্তরগুলি অবচেতনভাবে জারিত হতে পারে এবং দুর্ভাগ্যক্রমে কোনও পাঠককে অন্যথায় ভাল উত্তরের বিরুদ্ধে পক্ষপাতদুষ্ট করতে পারে।
jthetzel

@jthetzel আমি দেখতে পাচ্ছি কেন একটি লিঙ্কে url প্রতিস্থাপনের নাম রাখা ভাল। যখন আমার সময় হবে আমি এটি করতে শিখব। আমি জানি এটা সহজ। তবে আমি তিন-চারটি লিঙ্ক দিয়েছি। লিঙ্কটি ক্লিক করতে এবং এটি কী তা দেখতে প্রায় সময় লাগে না। সুতরাং কেন এত জন সম্প্রদায়ের সদস্যরা এটির জন্য একটি বড় চুক্তি করে তা আমি সত্যিই বুঝতে পারি না।
মাইকেল আর চেরনিক

6

উদাহরণস্বরূপ, আপনি উল্লেখ করেছেন যে মূল সমস্যাটি কার্যকারণ সূচক। কার্যকারণ অনুমানের জন্য শুরু করার জন্য একটি ভাল জায়গা হ'ল অ্যান্ড্রু গ্যালম্যানের এই ট্রিপল-বই-পর্যালোচনা এবং এতে বইগুলি পর্যালোচনা করা হয়েছে। কার্যকারণ অনুমান সম্পর্কে শিখার পাশাপাশি, আপনার অনুসন্ধানের ডেটা বিশ্লেষণ, বর্ণনা এবং পূর্বাভাসের মান সম্পর্কেও শিখতে হবে।

সামাজিক বিজ্ঞানীরা প্রকাশিত কাজ, ব্লগ , সেমিনার এবং ব্যক্তিগত কথোপকথনে একে অপরের গবেষণার সমালোচনা শুনে অবিশ্বাস্য পরিমাণ শিখেছি - শেখার অনেক উপায় রয়েছে are এই সাইটটি এবং অ্যান্ড্রু গেলম্যানের ব্লগ অনুসরণ করুন।

অবশ্যই, যদি আপনি ডেটা-বোধ করতে চান তবে আপনার বাস্তব ডেটা নিয়ে কাজ করার অনুশীলন করা দরকার। সাধারণ তথ্য-বোধের দক্ষতা রয়েছে তবে ডেটা-ইন্দ্রিয়ও রয়েছে যা কোনও সমস্যা ক্ষেত্রের সাথে সুনির্দিষ্ট, বা আরও সুনির্দিষ্টভাবে, কোনও নির্দিষ্ট ডেটাসেটের জন্য নির্দিষ্ট ডেটা-ইন্দ্রিয়।


5

একটি দুর্দান্ত, বিনামূল্যে সংস্থান হ'ল চান্স নিউজ উইকি । লোকেরা কীভাবে ডেটা এবং পরিসংখ্যানকে ব্যাখ্যা করে তাতে ভাল এবং খারাপ পয়েন্টগুলির আলোচনার সাথে এটির বাস্তব উদাহরণগুলি থেকে টানা অনেক উদাহরণ রয়েছে। প্রায়শই আলোচনার প্রশ্নও রয়েছে (দৃষ্টির প্রেরণার অংশটি হল পরিসংখ্যানের শিক্ষকদের শিক্ষার্থীদের সাথে আলোচনার জন্য উদাহরণ দেওয়া)।


5

একটি দুর্দান্ত প্রশ্নের জন্য +1! (এবং এখনও পর্যন্ত সমস্ত উত্তরদাতাদের কাছে +1 করুন)

আমি মনে করি ডেটা বোধের মতো বিষয় রয়েছে, তবে এর মধ্যে রহস্যময় কিছু আছে বলে আমি মনে করি না। আমি যে উপমাটি ব্যবহার করব তা হ'ল গাড়ি চালানো। আপনি যখন রাস্তায় গাড়ি চালাচ্ছেন, তখন অন্য গাড়িগুলির সাথে কী চলছে তা আপনি কেবল জানেন । উদাহরণস্বরূপ, আপনি জানেন যে পাশের দিকের লোকটি রাস্তার সাইনটি সন্ধান করছে যেখানে সে তার টার্ন-সিগন্যালটি ব্যবহার করছে না, তবুও তার মোড় নেওয়ার কথা রয়েছে's আপনি স্বয়ংক্রিয়ভাবে ধীর, অতিরিক্ত সতর্ক ড্রাইভারটি সনাক্ত করুন এবং তারা বিভিন্ন পরিস্থিতিতে কীভাবে প্রতিক্রিয়া করবেন তা অনুমান করে। আপনি কিশোরটিকে স্পষ্ট করতে পারেন যিনি কেবল তার চেয়ে দ্রুত গতিতে রেস করতে চান। সমস্ত গাড়ি কী করে তা আপনার একটি স্বীকৃতি-ভিত্তিক ধারণা রয়েছে। এটি ডেটা সেন্সের মতোই। এটি অভিজ্ঞতা থেকে আসে, প্রচুরঅভিজ্ঞতার। আপনি যদি তত্ত্বটির যথেষ্ট পরিমাণ জানেন তবে আপনাকে কেবল আসল ডেটাসেটের সাথে খেলতে শুরু করতে হবে। আপনি DASL এর মতো কোনও সাইট অন্বেষণে আগ্রহী হতে পারেন । তবে একটি শর্ত হ'ল আপনি কেবলমাত্র একটি ডেটাসেট লোড, পরীক্ষা চালানো এবং পি-মান পাওয়ার ক্ষেত্রে অভিজ্ঞতা অর্জন করা উচিত নয়। আপনাকে ডেটা অন্বেষণ করতে হবে, সম্ভবত এটি বিভিন্ন উপায়ে প্লট করতে হবে, কিছু মডেল ফিট করতে হবে এবং কী চলছে তা নিয়ে ভাবতে হবে। (লক্ষ্য করুন যে ইডিএ এখানে একটি সাধারণ থ্রেড হয়ে গেছে))

এই প্রক্রিয়া সম্পর্কে সম্ভবত একটি স্পষ্টত সত্য, ডেটা সেন্সটি প্রদত্ত সাময়িক অঞ্চলে স্থানীয়করণ করা যায়। উদাহরণস্বরূপ, আপনি পরীক্ষামূলক ডেটা এবং আনোভা'র সাথে কাজ করার জন্য প্রচুর অভিজ্ঞতা অর্জন করতে পারেন তবে সময়-সিরিজের ডেটা বা বেঁচে থাকার ডেটা যখন দেখেন তখন কী হচ্ছে তা নিয়ে অগত্যা একটি ভাল অনুভব করার দরকার নেই।

আমাকে আরও একটি কৌশল যুক্ত করতে দাও যা আমি প্রচুর সহায়ক বলে মনে করেছি: আমার মনে হয় আপনার সামান্য (পরিসংখ্যান) প্রোগ্রামিং শেখার পক্ষে সময়টি উপযুক্ত। আপনাকে এতে ভয়ঙ্করভাবে ভাল হতে হবে না (আমি "কমিকালি অদক্ষ" কোড লেখার জন্য পরিচিত)। যাইহোক, একবার আপনি কিছু বেসিক প্রসেসালাল কোড লিখতে পারেন (বলুন R), আপনি অনুকরণ করতে পারেন । এমনকি খুব সাধারণ সিমুলেশন পরিচালনা করতে সক্ষম হওয়া কতটুকু সাহায্য করতে পারে তা বিবেচনা করা আমার পক্ষে শক্ত হবে। আপনি এটির জন্য যে জিনিসটি ব্যবহার করতে পারেন তা হ'ল, আপনার অধ্যয়নের সময় আপনি কোনও সম্পত্তি সম্পর্কে এটি পড়তে পারেন। উদাহরণস্বরূপ, আপনি যদি (বিমূর্তভাবে) জানেন যে ডেটাসেটের জন্য কোনও লগইট বা প্রবিট মডেল আরও ভাল কিনা তা অনুমিতভাবে নির্ধারণ করা কঠিন, আপনি এর সহজ সিমুলেশনগুলি কোড করতে পারেনএবং ধারণাটি আরও সম্পূর্ণরূপে বুঝতে তাদের সাথে খেলুন। এটি আপনাকে অভিজ্ঞতা প্রদান করবে তবে কিছুটা আলাদা ধরণের এবং এটি আপনাকে আপনার ডেটা বোধের বিকাশে সহায়তা করবে।


অনুকরণগুলি থেকে শেখার মানকে জোর দেওয়ার জন্য +1।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.