আমি ইতিমধ্যে প্রদত্ত সমস্ত উত্তরকে আন্ডারলাইন করেছি, তবে আসুন একটি বিড়ালকে একটি বিড়াল বলি: অনেকগুলি কার্যক্ষেত্রে পরিচালনকে বোঝানো খুব কমই অসম্ভব যে "বহিরাগত" সফ্টওয়্যার টুলে বিনিয়োগ করা (তাদের কাছে বহিরাগত) এটি প্রয়োজনীয়, এমন কাউকে নিয়োগ দেওয়া যাক সেটাকে স্থায়ী করে দিন এটি আপ এবং এটি বজায় রাখুন। আমি বেশ কয়েকটি ক্লায়েন্টকে বলেছি যে তারা সফটওয়্যার এবং ডাটাবেসগুলিতে পুরোপুরি পটভূমির সাথে একটি পরিসংখ্যানবিদ নিয়োগ করে প্রচুর উপকৃত হবে, তবে "কিছুই করতে পারে না" হ'ল সাধারণ প্রতিক্রিয়া।
যতক্ষণ না এটি ঘটবে না, এক্সেলের সাথে আপনি করতে পারেন এমন কিছু সাধারণ জিনিস যা জীবনকে আরও সহজ করে তুলবে। এবং এর প্রথমটি সন্দেহ ছাড়াই সংস্করণ নিয়ন্ত্রণ। এক্সেলের সাথে সংস্করণ নিয়ন্ত্রণ সম্পর্কিত আরও তথ্য এখানে পাওয়া যাবে ।
এক্সেল ব্যবহার সম্পর্কে কিছু জিনিস
EXCEL ব্যবহার করা লোকেরা প্রায়শই EXCEL এর সূত্র বৈশিষ্ট্য পছন্দ করে। তবুও, এটি এক্সেল শিটের মধ্যে ত্রুটিগুলির সবচেয়ে গুরুত্বপূর্ণ উত্স এবং আমার অভিজ্ঞতা যতদূর যায় এক্সেল ফাইলগুলিতে পড়ার চেষ্টা করার সময় সমস্যাগুলির। আমি সূত্রযুক্ত শীট নিয়ে কাজ করতে অস্বীকার করি।
আমি যাদের সাথে কাজ করি তাদের প্রত্যেককে এক্সেল শিটগুলি একটি সরল বিন্যাসে সরবরাহ করতে বাধ্য করি, যার অর্থ:
- প্রথম সারিতে বিভিন্ন ভেরিয়েবলের নাম রয়েছে
- স্প্রেডশিটটি কক্ষ এ 1 এ শুরু হয়
- সমস্ত ডেটা কলামে, কোনও বাধা ছাড়াই এবং বিন্যাস ছাড়াই রাখা হয়।
- সম্ভব হলে ডেটা .csv ফর্ম্যাটেও সংরক্ষণ করা হয়। কোনও ভিবিএ স্ক্রিপ্ট লিখতে অসুবিধা নেই যা ডেটা উত্তোলন করবে, পুনরায় ফর্ম্যাট করবে এবং এটি একটি .csv ফাইলে রাখবে। এটি আরও ভাল সংস্করণ নিয়ন্ত্রণের অনুমতি দেয়, কারণ আপনি প্রতিদিন ডেটা .csv ডাম্প তৈরি করতে পারেন।
যদি ডেটা সর্বদা একটি সাধারণ কাঠামো থাকে তবে ডেটা যুক্ত করতে এবং বিশ্লেষণের জন্য ডেটাসেট তৈরি করতে অন্তর্নিহিত ভিবি ম্যাক্রোগুলি সহ একটি টেম্পলেট বিকাশ করা ভাল। এটি সাধারণভাবে এড়াতে পারবেন যে প্রতিটি কর্মচারী তার নিজস্ব "প্রতিভা" ডেটা সঞ্চয় করার পদ্ধতি নিয়ে আসে এবং এটি আপনাকে এই কোডটি আপনার কোডটি লেখার অনুমতি দেয় allows
এটি বলেছে, আপনি যদি সবাইকে এসকিউএল (এবং ডেটা প্রবেশের জন্য একটি প্রথম প্রান্ত) ব্যবহার করতে রাজি করতে পারেন তবে আপনি আর এর সাথে সরাসরি লিঙ্ক করতে পারেন। এটি কর্মক্ষমতা ব্যাপকভাবে বৃদ্ধি করবে।
তথ্য কাঠামো এবং পরিচালনা
একটি সাধারণ নিয়ম হিসাবে, ডাটাবেসগুলিতে সঞ্চিত ডেটা (বা যদি তারা জোর দেয় তবে এক্সেল শিট) অবশ্যই সর্বনিম্ন হওয়া উচিত, যার অর্থ কোনও অন্যান্য ভেরিয়েবল থেকে গণনা করা যায় এমন কোনও ভেরিয়েবল ডাটাবেসে থাকা উচিত নয়। মনে রাখবেন, কখনও কখনও সেইগুলি উত্পন্ন বা রূপান্তরিত ভেরিয়েবলগুলি সংরক্ষণ করা উপকারী হতে পারে, যদি গণনাগুলি ক্লান্তিকর হয় এবং দীর্ঘ সময় নেয়। তবে এগুলি একটি পৃথক ডাটাবেসে সংরক্ষণ করা উচিত, যদি প্রয়োজন হয় তবে এটির সাথে মূল লিঙ্কটি রয়েছে।
এক কেস হিসাবে বিবেচনা করা হয় (এবং তাই এক সারি) হিসাবে চিন্তাও দেওয়া উচিত। উদাহরণ হিসাবে, লোকেরা প্রতিটি সময় পয়েন্টের জন্য একটি নতুন ভেরিয়েবল তৈরি করে সময় সিরিজ উত্পাদন করে। যদিও এটি একটি এক্সেলটিতে অর্থবোধ করে, এই ডেটাগুলিতে পড়া ডেটা ম্যাট্রিক্সের চারপাশে বেশ কিছুটা উল্টানো দাবি করে। গোষ্ঠীগুলির তুলনা করার জন্য একই: প্রতিটি গ্রুপের জন্য একটি প্রতিক্রিয়ার ভেরিয়েবল নয়, একটি গ্রুপ সূচক এবং একটি প্রতিক্রিয়া ভেরিয়েবল থাকা উচিত। এইভাবে ডেটা স্ট্রাকচারগুলি পাশাপাশি মানক করা যায়।
একটি সর্বশেষ জিনিস যা আমি প্রায়শই চালাচ্ছি তা হ'ল বিভিন্ন মেট্রিকের ব্যবহার। দৈর্ঘ্য মিটার বা সেন্টিমিটারে দেওয়া হয়, সেলসিয়াস, কেলভিন বা ফারেনহাইটের তাপমাত্রা, ... একটিকে কোনও সামনের প্রান্তে বা কোনও টেমপ্লেটে নির্দেশ করা উচিত যে ইউনিটটি কী যেখানে ভেরিয়েবলটি পরিমাপ করা হয়।
এবং এই সমস্ত কিছুর পরেও, আপনি এখনও বিশ্লেষণটি শুরু করার আগে একটি ডেটা নিয়ন্ত্রণ পদক্ষেপ নিতে চান। আবার এটি এমন কোনও স্ক্রিপ্ট হতে পারে যা প্রতিদিন নতুন (যেমন রাতারাতি) নতুন এন্ট্রিগুলিতে চালিত হয় এবং তত্ক্ষণাত্ ফ্ল্যাগগুলি সমস্যা হয় (সীমার বাইরে, ভুল ধরণের, অনুপস্থিত ক্ষেত্রগুলি ...) যাতে তাদের যত তাড়াতাড়ি সম্ভব সংশোধন করা যায়। কী ভুল এবং কেন তা খুঁজে পেতে যদি আপনার 2 মাস আগে তৈরি একটি এন্ট্রিটিতে ফিরে আসতে হয় তবে আপনি এটির সংশোধন করার জন্য আরও কিছু ভাল "শার্লক-দক্ষতা" পেতে পারেন।
আমার 2 সেন্ট