টুকি কর্তৃক এক্সপ্লোরার ডেটা বিশ্লেষণের আধুনিক উত্তরসূরি?


52

আমি টুকির বই "এক্সপ্লোরার ডেটা অ্যানালাইসিস" পড়ছি। 1977 সালে লিখিত হওয়ার কারণে বইটি কাগজ / পেন্সিল পদ্ধতিগুলিতে জোর দেয়। এমন আরও কোনও 'আধুনিক' উত্তরসূরি রয়েছে যা অ্যাকাউন্টে নেয় যা আমরা এখন তাত্ক্ষণিকভাবে বড় ডেটা সেটগুলি প্লট করতে পারি?


এই সম্প্রদায় উইকি করা উচিত?
richiemorrisroe

এটি সিডব্লিউ হওয়া উচিত কিনা তা আমার কাছে পরিষ্কার নয়। কোনও ভাল উত্তর হতে পারে; এর একটি স্পষ্ট অসামান্য উত্তর থাকতে পারে; আমরা কার্যকর উত্তরগুলির একটি দীর্ঘ তালিকা তৈরি করতে পারি। চল দেখি কি ঘটেছে.
whuber

4
এটি একটি ভাল প্রশ্ন, বায়োফ্রিজার। আমি কেবল মন্তব্য করতে চেয়েছিলাম যে কাজের অন্যান্য পদ্ধতির সাথে ঘনিষ্ঠ সাদৃশ্য রয়েছে। আমার প্রিয়টি হ'ল পেন এবং পেপার ইডিএ আধুনিক পরিসংখ্যানগুলির কাছে হ্যান্ড সরঞ্জামগুলি আধুনিক কাঠের কাজগুলিতে। ("আধুনিক" কাঠের কাঠামো অনেকগুলি বিদ্যুতের সরঞ্জাম যেমন টেবিলগুলি এবং রাউটারগুলি নিয়োগ করে যা এমনকি নতুনদেরকে খুব কম সময়ে গ্রহণযোগ্য ফলাফলগুলি সক্রিয় করতে সক্ষম করে However তবে, এই সরঞ্জামগুলি প্রতিবছর হাজার হাজার অনুপস্থিত অঙ্ক এবং অঙ্গগুলির জন্যও অ্যাকাউন্ট করে People লোকরা যারা হাত সরঞ্জাম ব্যবহার করতে শেখে সাধারণত তারা বিদ্যুতের সরঞ্জামগুলি নিয়োগ করার পরেও আরও ভাল এবং আরও দক্ষতার সাথে কাজ করতে শিখুন))
শুশ

4
হ্যাঁ, কাঠের কাজটি একটি দুর্দান্ত উপমা (অনুপস্থিত অঙ্কগুলি, অনুপস্থিত অঙ্কগুলি)। সফ্টওয়্যার- carpentry.org দেখুন ।
ডেনিস

উত্তর:


19

নিকটতম জিনিসটি হল ক্লিভল্যান্ডের ভিজ্যুয়ালাইজিং ডেটা । এটি এক্সপ্লোরার ডেটা বিশ্লেষণ সম্পর্কিত, এটি কম্পিউটার-উত্পাদিত ভিজ্যুয়ালাইজেশন সম্পর্কে, এটি গভীর, এটি একটি সর্বোত্তম।


2
এটি একই লেখকের দ্য উপাদানগুলির গ্রাফিং ডেটা বইয়ের ক্ষেত্রেও প্রযোজ্য । দুটোই কিনে নিন; তারা উভয়ই দুর্দান্ত।
কার্ল ওভে হাফথামার

9

ঠিক আছে, এটি কোনও সঠিক প্রতিরূপ নয়, তবে আমি রিগ্রেশন এবং মাল্টিলেভেল / হায়ারার্কিকাল মডেলগুলি ব্যবহার করে গেলম্যান এবং হিলের ডেটা অ্যানালাইসিসে প্রচুর দরকারী প্লট পরামর্শ (এবং আর কোড) পেয়েছি I

এছাড়াও, তার ব্লগটি প্রায়শই দরকারী গ্রাফিক্স পরামর্শে পূর্ণ থাকে advice


7

ডেটা বিশ্লেষণের জন্য ইন্টারেক্টিভ গ্রাফিক্স: নীতিমালা এবং উদাহরণগুলি আমার পছন্দ মতো; বইয়ের বিবরণে বলা হয়েছে যে এটি "অনুসন্ধানের তথ্য বিশ্লেষণ (ইডিএ) এবং কীভাবে ইন্টারেক্টিভ গ্রাফিকাল পদ্ধতিগুলি অন্তর্দৃষ্টি অর্জনের পাশাপাশি ডেটাসেটগুলি থেকে নতুন প্রশ্ন এবং অনুমানগুলি তৈরি করতে সহায়তা করতে পারে তা নিয়ে আলোচনা করেছে।"



4

ইঞ্জিনিয়ারিং, সায়েন্সেস এবং মেডিসিন ইন রোনাল্ড পিয়ারসনের এক্সপ্লোরার ডেটা এখানে উল্লেখযোগ্য। এর প্রধান টার্গেট পাঠকদের মনে হয় বিজ্ঞানীরা অল্প গণিতকে ভয় পান না যারা ইচ্ছুক যে তারা আরও পরিসংখ্যান জানতেন। এটি বেশ বড় গ্রুপ এবং এখানে একটি ভাল প্রতিনিধিত্ব করে। এটি সামান্য কৌতূহলপূর্ণ এবং অফবিট তবে এটি প্রচুর পরিমাণে জড়িত এবং এতে অনেক বুদ্ধিমান পরামর্শও রয়েছে। এটি টুকি পুনর্বিবেচিত নয় এই অর্থে যে এটি অনেকগুলি নতুন ধারণা দেয় তবে এটি অধ্যয়ন করার জন্য ফলপ্রসূ হতে পারে, এমনকি আপনি যখন মনে করেন এটি একটু ভুল-মাথা রয়েছে।

এই বইটি খুব কম বিজ্ঞপ্তি আকৃষ্ট করেছে বলে মনে হচ্ছে, সম্ভবত এটি খুব ব্যয়বহুল, কোর্সের পাঠ্য হিসাবে স্পষ্টতই উপযুক্ত নয় এবং এখনও কেবল হার্ডব্যাকে উপলভ্য। তবে এটি বুদ্ধিমান এবং পাঠযোগ্য এবং আধুনিক প্রবর্তক পাঠ্যপুস্তকের আবর্জনা থেকে মুক্ত (প্রাথমিক অনুশীলনের পৃষ্ঠাগুলি এবং পৃষ্ঠাগুলি, মূর্খ আইকন, সুখী তরুণদের কৃত্রিম ছবি, বাক্সগুলির সাথে ফিক্স লেআউট, যাই হোক না কেন)।


3

এছাড়াও ডেটা বিশ্লেষণ জন্য ইন্টারেক্টিভ এবং ডায়নামিক গ্রাফিক্স: সঙ্গে উদাহরণ ব্যবহার R ও GGobi, কুক এবং Swayne

এটিতে ওয়েবে সর্বজনীনভাবে উপলভ্য দুটি অধ্যায় রয়েছে যা তথ্য বিশ্লেষণের প্রক্রিয়া এবং হারিয়ে যাওয়া মানগুলি পরিচালনা করে describe অ্যান্টনি আনউইনের শিগগিরই একটি নতুন বই প্রকাশিত হবে।


0

আরও দু'টি ভাল বই পড়ার জন্য হ'ল বিউটিফুল ভিজ্যুয়ালাইজেশন এবং সুন্দর ডেটা। এগুলি সম্পাদিত বই, প্লটগুলির সাথে ডেটা অন্বেষণ করার জন্য আশ্চর্যরকম ভাল উদাহরণ রয়েছে এবং কিছু একেবারে ভয়াবহ অধ্যায় রয়েছে।

Ggplot2 ব্যবহারের কয়েকটি ভাল উদাহরণ রয়েছে এমন আরও একটি বই উইনস্টন চ্যাংয়ের একটি নতুন বই


1
আমি মাত্র দ্বিগুণ-পরীক্ষা করতে চাই, ডি, যদি কোনও সূক্ষ্ম টাইপ ক্রপ হয় তবে: আপনি সম্ভবত "ভীতু" হওয়ার পরিবর্তে "আবেদনকারী" লিখতে চেয়েছিলেন? যদিও উভয়ই এই প্রসঙ্গে অর্থবোধ করে, তবুও পরবর্তী ব্যাখ্যা - কোনও ব্যাখ্যা ছাড়াই - বরং আশ্চর্য!
whuber

2
ভয়াবহতা সঠিক ছিল - এটি একটি মিশ্র ব্যাগ - সম্পাদিত খণ্ডগুলি প্রায়শই হয়
ডায়ান্ন কুক

আমি এই সুপারিশে অবাক। আমি দুটি বইই বেশিরভাগই হতাশাবোধক (গ্রাফিক্সের উপর দীর্ঘ) দুর্ভাগ্যক্রমে ও'রিলি, যা আমি প্রথমে দর্শনীয়ভাবে ভাল ইউনিক্স বইয়ের প্রকাশকের মুখোমুখি হয়েছিলাম, মনে হয় দূরবর্তী পরিসংখ্যান সম্পর্কিত যে কোনও কিছুর জন্য খুব অসম মানের নিয়ন্ত্রণ রয়েছে।
নিক কক্স

আমি দুটি বই পছন্দ করি এবং সত্যই অনুভব করি যে এগুলি যথেষ্ট অবদান। জিপিপ্লট 2 দিয়ে প্লট করার বিষয়ে উইনস্টন চ্যাংয়ের অনেকগুলি মৌলিক বিবরণ রয়েছে। এটি একটি ভাল নতুন রেফারেন্স। আপনি কেন এই প্লট তৈরি করবেন সে সম্পর্কে এটি আপনাকে খুব বেশি কিছু দেয় না, তবে বেশিরভাগই আমি যে টুকরো পড়েছি তা থেকে উদ্দেশ্যটির জন্য ভাল ধারণা দেয়। উইকিপিডিয়া, বিশাল ডেটা, অনেক জটিলতা যেমন জটিল সমস্যাগুলি মোকাবেলায় দ্য বিউটিউজিয়াল ভিজ্যুয়ালাইজেশনের কয়েকটি খুব চিত্তাকর্ষক অধ্যায় রয়েছে এবং প্লটগুলি তৈরির জন্য চিন্তাভাবনা প্রক্রিয়া / সিদ্ধান্ত নেওয়া হয়।
ডায়ান্ন কুক

আমার মন্তব্যটি অস্পষ্ট হলেই আমি "সুন্দর" বইয়ের কথা উল্লেখ করছিলাম। উইনস্টন চ্যাংয়ের বইটি দুর্দান্ত এবং সহায়ক।
নিক কক্স

0

আমি ইডিএর প্রযুক্তিগত অনুসরণ হিসাবে ডেটা টেবিল এবং আকারগুলি অন্বেষণে সহযোগী ভলিউম হোয়াগলিন, মোস্টেলার এবং টুকি দ্বারা দৃust় এবং অনুসন্ধান বিশ্লেষণ বোঝার কথা ভাবি। আমি ডেটা বিশ্লেষণ এবং রিগ্রেশনও দেখতে পাই, ইডিএর ফলো-আপ হিসাবে মোস্টেলার ও টুকির পরিসংখ্যানের দ্বিতীয় কোর্স। উপরে বর্ণিত বিভিন্ন ক্লিভল্যান্ড বইগুলি হ'ল ধনসম্পদ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.