হ্যাডলির কাছ থেকে যেমন প্রত্যাশা করা যায়, তার নিবন্ধটি পরিপাটি তথ্যের একটি ভাল সংজ্ঞা রয়েছে এবং আমি তার নিবন্ধের প্রায় সবকিছুর সাথে একমত এবং বিশ্বাস করি এটি কেবল "ডেটা পেশাদারদের" পক্ষে বৈধ নয়। তবে, তিনি কিছু পয়েন্টগুলি তুলনামূলকভাবে সহজ করতে পারেন (যেমন, তিনি রচিত প্যাকেজ সহ) যদি আরও কিছু মৌলিক সমস্যা এড়ানো হয়। এই সমস্যাগুলির বেশিরভাগটি এক্সেলের বিস্তৃত ব্যবহারের ফলাফল। এক্সেল একটি মূল্যবান সরঞ্জাম এবং এর গুণাগুণ রয়েছে তবে এর কিছু সুবিধার ফলে ডেটা বিশ্লেষকরা সমস্যা তৈরি করে।
কিছু বিষয় (আমার অভিজ্ঞতা থেকে):
- কিছু লোক রঙিন স্প্রেডশিট পছন্দ করে এবং বিন্যাস বিকল্পগুলির প্রচুর ব্যবহার করে। যদি এটি তাদের ডেটাগুলি সংগঠিত করতে এবং উপস্থাপনের জন্য সারণী প্রস্তুত করতে সহায়তা করে তবে এটি সমস্ত ঠিক আছে। যাইহোক, এটি কোনও বিপজ্জনক যদি কোনও সেল রঙ প্রকৃতপক্ষে ডেটা এনকোড করে। এই ডেটাটি হারাতে সহজ এবং পরিসংখ্যান সংক্রান্ত সফ্টওয়্যারগুলিতে এই জাতীয় ডেটা আমদানি করা খুব কঠিন (উদাহরণস্বরূপ, স্ট্যাক ওভারফ্লোতে এই প্রশ্নটি দেখুন )।
- কখনও কখনও আমি কিছু সুন্দর বিন্যাসিত ডেটা পাই (আমি লোকেরা এটি কীভাবে প্রস্তুত করতে হয় তা বলার পরে), তবে তাদের কাছে কোনও মূল্যবান কলামে কোনও মন্তব্য করার সিদ্ধান্ত নেওয়ার বিষয়ে মন্তব্য করার জন্য একটি উত্সর্গীকৃত কলাম বা পৃথক ফাইল ব্যবহার করতে বলার পরেও। ডেটা আমদানি করার সময় আমাকে কেবল এই কলামটিই একটি বিশেষ উপায়ে মোকাবেলা করার দরকার নেই, তবে মূল সমস্যাটি হ'ল এই জাতীয় মন্তব্যগুলি দেখার জন্য আমাকে সমস্ত টেবিলের মাধ্যমে স্ক্রোল করতে হবে (যা আমি সাধারণত করতাম না)। যদি তারা এক্সেলের মন্তব্য করার সুবিধা ব্যবহার করে তবে এটি আরও খারাপ হয়।
- এগুলির কয়েকটি সারণী সহ স্প্রেডশিট, একাধিক শিরোনাম লাইন বা সংযুক্ত কক্ষগুলির পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার আমদানির জন্য তাদের প্রস্তুত করার জন্য ম্যানুয়াল কাজ করে। ভাল ডেটা বিশ্লেষকরা সাধারণত এই ধরণের ম্যানুয়াল কাজ উপভোগ করেন না।
- কখনই নয়, কখনই এক্সেলে কলামগুলি গোপন করুন। যদি তাদের প্রয়োজন না হয় তবে সেগুলি মুছুন। যদি তাদের প্রয়োজন হয়, তাদের দেখান।
- xls এবং এর বংশধররা অন্যের সাথে ডেটা বিনিময় বা সংরক্ষণাগার জন্য উপযুক্ত ফাইল ফর্ম্যাট নয়। ফাইলটি খোলার সময় সূত্রগুলি আপডেট হয় এবং বিভিন্ন এক্সেল সংস্করণগুলি ফাইলগুলি আলাদাভাবে পরিচালনা করতে পারে। আমি পরিবর্তে একটি সাধারণ সিএসভি ফাইলের প্রস্তাব দিচ্ছি, যেহেতু প্রায় সমস্ত ডেটা-সম্পর্কিত সফ্টওয়্যার এটি (এমনকি এক্সেল) আমদানি করতে পারে এবং আশা করা যায় যে শীঘ্রই এটি পরিবর্তন হবে না। তবে, সচেতন থাকুন যে কোনও সিএসভিতে সাশ্রয় করার সময় এক্সেল দৃশ্যমান অঙ্কগুলিতে ঘোরাফেরা করে (এরপরে নির্ভুলতা ছাড়ছে)।
- আপনি যদি অন্যের জন্য জীবন সহজ করতে চান তবে হ্যাডলির নিবন্ধে প্রদত্ত নীতিগুলি মেনে চলুন। প্রতিটি ভেরিয়েবল এবং স্তরের সংজ্ঞা নির্ধারণকারী ফ্যাক্টর কলামগুলির জন্য একটি মান কলাম রয়েছে।
সম্ভবত বেশ কয়েকটি অতিরিক্ত পয়েন্ট রয়েছে যা আমার মনে আসে নি।