ডেটা বিজ্ঞানীরা কি এক্সেল ব্যবহার করেন?


37

আমি নিজেকে একজন ভ্রমণকারী ডেটা বিজ্ঞানী হিসাবে বিবেচনা করব। বেশিরভাগের মতো (আমি মনে করি), আমি আমার প্রথম চার্ট তৈরি করেছিলাম এবং এক্সেল ব্যবহার করে হাই স্কুল এবং কলেজে আমার প্রথম সমষ্টিগুলি করেছি। আমি যখন কলেজ, গ্রেড স্কুল এবং ~ বছরের কাজের অভিজ্ঞতার মধ্য দিয়ে যাচ্ছিলাম তখন এসকিউএল, আর, পাইথন, হ্যাডোপ, ল্যাটেক্স ইত্যাদির মতো আমি আরও উন্নত সরঞ্জাম হিসাবে বিবেচনা করি তা দ্রুত গ্রহণ করেছি

আমরা একটি ডেটা বিজ্ঞানীর অবস্থানের জন্য সাক্ষাত্কার নিচ্ছি এবং একজন প্রার্থী 15+ বছরের অভিজ্ঞতার সাথে নিজেকে একজন "সিনিয়র ডেটা সায়েন্টিস্ট" (এই দিনগুলিতে খুব বোজি শব্দ) হিসাবে বিজ্ঞাপন দেয়। তাঁর পছন্দের টুলসেটটি কী জানতে চাইলে তিনি প্রতিক্রিয়া জানালেন যে এটি এক্সেল।

আমি এটিকে প্রমাণ হিসাবে গ্রহণ করেছি যে তাঁর জীবনবৃত্তান্ত দাবি করবে এমন অভিজ্ঞ তিনি ছিলেন না, তবে নিশ্চিত ছিলেন না। সর্বোপরি, কারণ এটি আমার পছন্দসই সরঞ্জাম নয়, এর অর্থ এটি অন্য মানুষের নয়। অভিজ্ঞ ডাটা বিজ্ঞানীরা কি এক্সেল ব্যবহার করেন? আপনি কি প্রাথমিকভাবে এক্সেল ব্যবহার করেন এমন কারও কাছ থেকে অভিজ্ঞতার অভাব অনুমান করতে পারেন?


বেশিরভাগ ডেটা সায়েন্স কাজের বিজ্ঞাপনগুলি নির্দিষ্ট দক্ষতা, যেমন আর, হ্যাডোপ, যা-ই হোক না কেন জিজ্ঞাসা করে। আপনি কি আপনার বিজ্ঞাপনে এটি উল্লেখ করতে অবহেলা করেছেন? আপনার নতুন ডেটা সায়েন্টিস্ট যদি কোনও বুদ্বুদে কাজ না করে তবে তাকে বা তার সাথে দলের সাথে কাজ করতে হবে এবং সম্ভবত স্ট্যান্ডার্ড টিম সফ্টওয়্যার নিয়ে কাজ করা দরকার ...
স্পেসডম্যান

1
ভাল যদি তারা ব্যবহার না করে \LaTeX{}তবে আমি তাদের নিয়োগ করতাম না। খালি মজা করছি ...
এয়ার নট অটো

1
@ স্পিডম্যান: আমি গল্পটি উপস্থাপিত প্রসঙ্গে দিয়েছি তবে আমি টিপস ভাড়া নেওয়ার চেয়ে এক্সেল সম্পর্কে লোকের দৃষ্টিভঙ্গিতে সত্যই আগ্রহী। আমাদের দলটি আমাদের যা পছন্দসই সরঞ্জামগুলি ব্যবহার করতে মুক্ত।
JHowIX

1
হ্যাঁ, এখানে দেখুন । কৌতুক প্রতিবন্ধীদের জন্য, এখানেও দেখুন ।
ডার্ক এডেলবুয়েটেল

1
নির্ধারিত বছর নির্বিশেষে, আমি ডেটা বিজ্ঞানীর কাছ থেকে কমপক্ষে তিনটি সরঞ্জামের প্রো / কন তালিকাটি আশা করব। তাদের তদন্ত করার ক্ষমতা, ওজন বিকল্প এবং সমাধানগুলি যোগাযোগ করার ক্ষমতা দেখাতে হবে। এমনকি, বা বিশেষত, একটি সাক্ষাত্কারে, আমি বাস্তব ব্যস্ততা এবং সম্ভাব্য দুর্দান্ত, তবে বর্তমানে অনুপস্থিত, সাক্ষাত্কারের প্রশ্নটির অতীতের সম্প্রসারণের ক্ষমতা দেখতে আশা করব।
ডেভ

উত্তর:


28

বেশিরভাগ অ-প্রযুক্তিগত লোকেরা প্রায়শই ডেটাবেস প্রতিস্থাপন হিসাবে এক্সেল ব্যবহার করেন। আমি মনে করি এটি ভুল তবে সহনীয়। যাইহোক, যে কেউ ডেটা বিশ্লেষণে অভিজ্ঞ বলে মনে করেন তিনি কেবল এক্সেলকে তার প্রধান সরঞ্জাম হিসাবে ব্যবহার করতে পারবেন না (প্রথমবারের জন্য ডেটা দেখার স্পষ্ট কাজ বাদ দিয়ে)। এর কারণ, এক্সেল কখনই সেই ধরণের বিশ্লেষণের উদ্দেশ্যে তৈরি করা হয়নি এবং এর ফলস্বরূপ, এক্সেলের ভুল করা অবিশ্বাস্যরকম সহজ (এটি অন্যথায় বলা যায় না যে অন্যান্য সরঞ্জামগুলি ব্যবহার করার সময় অন্য ধরণের ভুল করা অবিশ্বাস্যরকম সহজ নয়, তবে এক্সেল পরিস্থিতি আরও আরও বাড়িয়ে তোলে))

এক্সেলের কী নেই এবং সংক্ষিপ্ত বিবরণে যে কোনও বিশ্লেষণের জন্য এটি আবশ্যক:

  1. Reproducibility। একটি ডেটা বিশ্লেষণ প্রজননযোগ্য হতে হবে।
  2. ভর্সন নিয্ন্ত্র্ন. সহযোগিতার জন্য ভাল এবং পুনরুত্পাদনযোগ্যতার জন্যও ভাল। এক্সএলএস ব্যবহারের পরিবর্তে, সিএসভি ব্যবহার করুন (এখনও খুব জটিল এবং প্রান্তের অনেকগুলি ক্ষেত্রে রয়েছে, তবে সিএসভি পার্সারগুলি আজকাল মোটামুটি ভাল)
  3. পরীক্ষামূলক. আপনার যদি পরীক্ষা না করে থাকে তবে আপনার কোডটি নষ্ট হয়ে গেছে। যদি আপনার কোডটি নষ্ট হয়ে যায় তবে আপনার বিশ্লেষণ অকেজো থেকে খারাপ।
  4. Maintainability।
  5. সঠিকতা. অন্যান্যগুলির মধ্যে সংখ্যাগত নির্ভুলতা, সঠিক তারিখ বিশ্লেষণের সত্যই এক্সেলের অভাব রয়েছে।

আরও সংস্থানসমূহ:

ইউরোপীয় স্প্রেডশিট ঝুঁকিপূর্ণ আগ্রহী গ্রুপ - হরর স্টোরিজ

গুরুত্বপূর্ণ কাজের জন্য আপনার কোনও স্প্রেডশিট ব্যবহার করা উচিত নয় (আমি এটি বোঝাতে চাইছি)

মাইক্রোসফ্টের এক্সেল হতে পারে গ্রহের সবচেয়ে বিপজ্জনক সফ্টওয়্যার

এই এক অদ্ভুত কৌশল দ্বারা এক্সেল ব্যবহার করে আপনার ডেটা ধ্বংস করুন!

এক্সেল স্প্রেডশিটগুলি সঠিকভাবে পাওয়া শক্ত


ডেটা দেখার জন্য এবং এটির দ্রুত বিশ্লেষণের জন্য, কোনও উপকরণ কি তুলনায় তুলনীয় তবে এক্সেলের চেয়ে ভাল হিসাবে পেশাদারদের দ্বারা ব্যাপকভাবে গৃহীত রয়েছে? আমি একজন নবাগত তথ্য বিজ্ঞানী, এবং আমি বেশিরভাগই (পোস্টগ্রি) এসকিউএল ব্যবহার করি, তবে এক্সেলের মতো কিছু কাজ করার জন্য দ্রুত কাজ করতে পারে যদি আপনি কেবল কিছু চেষ্টা করে দেখেন।
sudo

1
এছাড়াও, আমাকে অভিযোগ করতে হবে যে সিএসভি কোনও মান নয়। আপনাকে সত্যই নিশ্চিত করতে হবে যে এটি যা খুলছে তা যা যা উত্পাদিত তাতেই তার সাথে একমত। ওপেনঅফিস এটি ঠিক করে দেয় এবং ফর্ম্যাট সম্পর্কে কিছু না ধরে আপনি লোড করার সময় আপনাকে অনেকগুলি সিএসভি বিকল্প চয়ন করতে দেয়।
sudo

@ সুডো সরঞ্জামগুলি আপনার পছন্দসই প্রোগ্রামিং ভাষার উপর নির্ভর করে যা বেশিরভাগ ব্যক্তিগত পছন্দ। কয়েকটি উদাহরণ দেওয়ার জন্য, আর historতিহাসিকভাবে একটি ভাল পছন্দ হয়েছে, সাম্প্রতিক বছরগুলিতে পাইথন ডেটা বিশ্লেষণের জন্য জনপ্রিয়তা অর্জন করেছে, জুলিয়া ক্ষেত্রের ক্ষেত্রে একটি খুব আশাব্যঞ্জক নবাগত। বেশিরভাগ প্রোগ্রামিং ল্যাঙ্গুয়েজ পরিপক্ক লাইব্রেরি সরবরাহ করে যা আপনাকে স্ট্রাকচার দেয় (যেমন ডেটাফ্রেমগুলি) ডেটা বিশ্লেষণের জন্য বিশেষত উপযোগী এবং সেগুলি সবই এক্সেলের চেয়ে ভাল। সিএসভি মানক করা হয়েছে তবে বিভিন্নভাবে বাস্তবায়িত হওয়া বিশদ রয়েছে তবে এটি আপনার দৈনন্দিন কাজকর্মে কোনও বিশাল সমস্যা হওয়া উচিত নয়।
রবার্ট স্মিথ

আমি হালকা প্রসেসিংয়ের জন্য পাইথন ব্যবহার করি তবে এটি এক্সেলের উদ্দেশ্যগুলিতে সত্যিই কার্যকর হয় না। উদাহরণস্বরূপ, এক্সেলে আপনি অটোফিল্টার এবং ইন্টারেক্টিভ চার্টের মতো সরঞ্জাম ব্যবহার করতে পারেন। এক্সেল বা অন্য কিছু দেখার জন্য আমি সাধারণত আমার ডেটা সিএসভিতে আউটপুট করি।
সুডো

@ সুডো তাহলে আপনি পান্ডাস চান want পান্ডাস আপনার ডেটা ম্যানিপুলেট করার জন্য প্রচুর পদ্ধতি সরবরাহ করে। এর মধ্যে সূচি, কলাম বা শর্তের ভিত্তিতে সাবসেটিং অন্তর্ভুক্ত রয়েছে যা স্বতঃ ফিল্টারের চেয়ে আরও নমনীয় এবং শক্তিশালী। তারপরে আপনি ফলাফলটি প্লট করতে পারেন ( df.plot()) এবং আপনার আউটপুট সিএসভি ( df.to_csv('output.csv')) এ রফতানি করতে পারেন । মনে রাখবেন যে ডেটা বিশ্লেষণে সাধারণত ফিল্টারিং এবং প্লট করা থেকে অনেক বেশি প্রয়োজন। অতএব, মনোযোগ সঠিকতার দিকে হওয়া উচিত, সুতরাং আপনাকে বিশ্লেষণ থেকে উপস্থাপনাটি ডিকুয়াল করা উচিত। পাইথন (বা অন্য ভাষা) এ আপনার বিশ্লেষণ সম্পাদন করুন, সিএসভিতে আপনার আউটপুট ভাগ করুন যদি আপনি চান তবে এটি।
রবার্ট স্মিথ

15

অভিজ্ঞ ডাটা বিজ্ঞানীরা কি এক্সেল ব্যবহার করেন?

আমি কিছু অভিজ্ঞ তথ্য বিজ্ঞানী দেখেছি, যারা এক্সেল ব্যবহার করেন - তাদের পছন্দের কারণে, বা তাদের কর্মক্ষেত্রের ব্যবসায় এবং আইটি পরিবেশগত সুনির্দিষ্টতার কারণে (উদাহরণস্বরূপ, অনেক আর্থিক প্রতিষ্ঠান মডেলিংয়ের জন্য এক্সেলকে তাদের প্রধান সরঞ্জাম হিসাবে ব্যবহার করে)। তবে আমি মনে করি যে বেশিরভাগ অভিজ্ঞ ডেটা বিজ্ঞানীরা এমন সরঞ্জামগুলি ব্যবহারের প্রয়োজনীয়তাকে স্বীকৃতি দিয়েছেন যা নির্দিষ্ট কাজের জন্য অনুকূল এবং এই পদ্ধতির সাথে সম্মতি রাখে।

আপনি কি প্রাথমিকভাবে এক্সেল ব্যবহার করেন এমন কারও কাছ থেকে অভিজ্ঞতার অভাব অনুমান করতে পারেন?

না তুমি পারবে না. এটি আমার উপরে উল্লিখিত চিন্তাভাবনা থেকে বাস্তব। ডেটা সায়েন্স স্বয়ংক্রিয়ভাবে বড় ডেটা বোঝায় না - প্রচুর পরিমাণে ডেটা বিজ্ঞানের কাজ রয়েছে যা এক্সেল বেশ ভালভাবে পরিচালনা করতে পারে। এই বলে যে, যদি কোনও ডেটা সায়েন্টিস্ট (এমনকি অভিজ্ঞ একজনও) যদি বড় ডেটা-ফোকাসযুক্ত আধুনিক সরঞ্জামগুলি সহ আধুনিক ডেটা বিজ্ঞান সরঞ্জামগুলির জ্ঞান (কমপক্ষে, বেসিক) না রাখেন তবে কিছুটা বিড়বিড় করে তোলে। এটি কারণ অনুসন্ধান গবেষণামূলক ডেটা বিশ্লেষণ একটি অপরিহার্য এবং এমনকি এটির একটি গুরুত্বপূর্ণ অঙ্গ হওয়ায় তথ্য বিজ্ঞানের প্রকৃতিতে গভীরভাবে আবদ্ধ। অতএব, কোনও ব্যক্তি, যার ডোমেনের মধ্যে অন্যান্য সরঞ্জামগুলি অন্বেষণ করার তাগিদ নেই, তিনি একটি ডেটা সায়েন্স পজিশনের জন্য সামগ্রিকভাবে উপযুক্ত প্রার্থীদের মধ্যে নীচে অবস্থান করতে পারেন (অবশ্যই এটি বেশ অস্পষ্ট, কারণ কিছু লোক শেখার ক্ষেত্রে খুব দ্রুত নতুন উপাদান, প্লাস,

অতএব, উপসংহারে, আমি মনে করি যে কোনও অভিজ্ঞ তথ্য বিজ্ঞানী তাদের পছন্দের সরঞ্জামটি সম্পর্কে একটি প্রশ্নের জবাব দিতে পারে তার সেরা উত্তরটি হ'ল: আমার পছন্দের সরঞ্জামটি সর্বোত্তম একটি, এটি হ'ল টাস্কটি সবচেয়ে ভাল ফিট করে।


5
হাডোপকে না জানার জন্য আমি কখনও কাউকে দোষ দেব না তবে ছোট ডেটা পরিস্থিতিতেও আমি মনে করি যেন আর উচ্চতর। আর এর সাথে আপনি করতে পারেন এমন একটি মিরিয়াদ রয়েছে যা আপনি এক্সেলের সাথে করতে পারবেন না। এটি আমার সম্পর্কে উদ্বেগ প্রকাশ করেছে যে এই ব্যক্তি তার 15+ বছরের মধ্যে "আবিষ্কার" করেন নি
JHowIX

@ জেওআইএক্স: "যথেষ্ট ভাল" শব্দটির সাথে আপনার পরিচিত? আমি আর এরও একটি বড় অনুরাগী এবং এটি কোনও সরঞ্জাম, এক্সেল অন্তর্ভুক্ত, অনেক সরঞ্জামে পছন্দ করবে। তবে, আর যে আরও বেশি কিছু করতে পারে তা বোঝায় না যে এক্সেল (বা কোনও কাজের জন্য উপযুক্ত অন্য কোনও সরঞ্জাম) একটি নির্দিষ্ট কাজের প্রসঙ্গে নিম্নমানের। সুতরাং, আপনার উদ্বেগ বৈধ হওয়ার পরেও ("বিড়বিড়কারী" শব্দটি ব্যবহার করে আমি এটি উল্লেখ করি), এটি হতে পারে যে ব্যক্তিটির এটি করার কোনও সুযোগ / প্রয়োজন নেই। মনে রাখবেন যে আপনি সময়ের কথা বলছিলেন, যখন আর বিদ্যমান ছিল, তবে বেশিরভাগই একাডেমিয়া এবং ডেটা সায়েন্সে (জনপ্রিয় তথ্যের বিশ্লেষণ বা এরকম) জনপ্রিয় ছিল আজকের মতো গরম ছিল না।
আলেকসান্দ্র ব্লেক

13

আমি মনে করি বেশিরভাগ লোকেরা এক্সেল সম্পর্কে ভাল জ্ঞান না করেই উত্তর দিচ্ছেন। এক্সেল (২০১০ সাল থেকে) এর মধ্যে একটি মেমরি কলামার [বহু সারণী] ডাটাবেস রয়েছে, তাকে পাওয়ার পাইভট বলা হয় (যা সিএসভি / ডাটাবেস ইত্যাদির মাধ্যমে ইনপুট দেয়) এটি কয়েক মিলিয়ন সারি সংরক্ষণ করতে দেয় (এটি কোনও স্প্রেডশিটে লোড করতে হবে না) । এটিতে পাওয়ার কোয়েরি নামে একটি ইটিএল সরঞ্জাম রয়েছে যা আপনাকে বিভিন্ন উত্স (হ্যাডোপ সহ) থেকে ডেটা পড়তে দেয়। এবং এটিতে একটি ভিজ্যুয়ালাইজেশন সরঞ্জাম রয়েছে (পাওয়ার ভিউ এবং পাওয়ার মানচিত্র)। প্রচুর ডেটা সায়েন্স একীকরণ এবং শীর্ষ-এন বিশ্লেষণ করছে যা পাওয়ার পাইভট ছাড়িয়ে যায়। এগুলিতে এই সরঞ্জামগুলির ইন্টারেক্টিভ প্রকৃতি যুক্ত করুন - যে কোনও ব্যবহারকারী সহজেই এমন একটি মাত্রা টানতে এবং নামাতে পারেন যার উপর ফলাফলগুলি ভেঙে দিতে পারে আশা করি আপনি সুবিধাগুলি দেখতে পাচ্ছেন। সুতরাং হ্যাঁ আপনি মেশিন লার্নিং করতে পারবেন না,


মজাদার. আমি এক্সেল 1998-2008 হ'ল ধীর এবং বগী জিনিসগুলিতে অভ্যস্ত। নতুনদের চেষ্টা করে দেখতে হবে।
sudo

আমি আশা করি আমি Seanv507 এর উত্তরটি এক মিলিয়ন বার অনুমোদন করতে পারতাম। এখানে বেশিরভাগ উত্তর দেখায় যে এক্সেলের আরও সাম্প্রতিক সংস্করণগুলি কতটা শক্তিশালী তা সম্পর্কে অনেক লোকই জানেন না। এবং দয়া করে নোট করুন যে আপনি যখন নতুন ডেটা অ্যানালিটিকাল সরঞ্জামগুলি ব্যবহার করেন (যেমন পাওয়ার পাওয়ার ক্যোয়ারী, পাওয়ার পিভট, ডএএক্স) আপনি আর 1, 048, 576 সারি ডেটা এবং এই সরঞ্জামগুলি ব্যতীত অন্যান্য সীমাবদ্ধতার হোস্টে সীমাবদ্ধ
নন

ব্যবসায়ের পটভূমি ছাড়া লোকেরা এক্সেল ব্যবহার করে না। সময়কাল। এবং ব্যবসায় স্নাতকদের সাধারণত ডেটা সায়েন্সে যেতে না ভেবে আপনি অজ্ঞতা বুঝতে পারবেন।
NoName

5

জন ফোরম্যান তাঁর ডেটা স্মার্ট বইতে এক্সেল ব্যবহার করে সাধারণ তথ্য বিজ্ঞানের সমস্যাগুলি (ক্লাস্টারিং, সাদাসিধা উপাখ্যানগুলি, নকশার পদ্ধতিগুলি ...) সমাধান করে। সত্যই পাইথন বা আর সম্পর্কে কিছুটা জ্ঞান থাকা বরাবরই ভাল তবে আমার ধারণা এক্সেল এখনও বেশিরভাগ কাজ সম্পন্ন করতে পারে!


2
আসলে, আপনি যখন এক্সেল দিয়ে এত কিছু করতে পারেন বইটি পড়ে আমি নিজেকে বেশ অবাক করেছিলাম। এবং এটি অন্তর্নির্মিত বিবর্তনমূলক এবং অন্যান্য অ-রৈখিক solvers ছিল! এক্সেলের একটি দুর্দান্ত সুবিধা হ'ল আপনার কাজটি, বিশেষত যদি আপনি পুনরায় উত্পাদনযোগ্য কোডের মধ্যে থাকেন তবে আর বা পাইথন কোডের চেয়ে বেশি লোকের কাছে অ্যাক্সেসযোগ্য।
ভিক্টর মা

5

আমি আশ্চর্য হয়েছি যে কত লোক প্রকৃত কাজটি করার চেয়ে পেশার শীতলতার সাথে জড়িত। এক্সেল দুর্দান্ত সরঞ্জাম, ফ্রি পাওয়ারপিভট, পাওয়ারকোয়ারি সহ এটি অনেক কিছু করতে পারে। (এগুলি ওএস এক্সে উপলভ্য নয়)। এবং আপনি যদি ভিবিএ জানেন তবে আপনি কিছু সুন্দর জিনিস করতে পারেন। এবং তারপরে যদি আপনি পাইথনের সেই জ্ঞানের শীর্ষে যুক্ত করেন তবে আপনি অজগরটির সাথে ডেটা এক্সট্রাকশন এবং ম্যানিপুলেশনের প্রথম ধাপগুলি একত্রিত করতে পারেন এবং তারপরে এক্সেল ব্যবহার করতে পারেন, বিশেষত যদি আপনি কোনও চাক্ষুষ ব্যক্তি হন। এক্সেল দিয়ে আপনি পরবর্তী কোনও প্রক্রিয়াতে ভিজ্যুয়ালাইজেশনের আগে খাওয়ানোর আগে সত্যিকারভাবে একত্রিত ডেটা পরীক্ষা করতে পারবেন can এটি একটি সরঞ্জাম অবশ্যই।


4

এক্সেল কেবলমাত্র খুব অল্প ডেটা মঞ্জুরি দেয় এবং মেশিন লার্নিংয়ের জন্য এমনকি কেবল প্লট করার জন্য এমন যথেষ্ট পরিমাণে দরকারী এবং নমনীয় doesn't আমি এক্সেল-এ যা যা করবো, তা চোখের সামনে দৃশ্যমান কোনও কিছুই মিস করব না তা নিশ্চিত করার জন্য মানগুলিকে প্রথম নজরে দেখার জন্য উপাত্তের একটি উপসেট দেখছি।

সুতরাং, যদি তার প্রিয় সরঞ্জামটি এক্সেল হয় তবে এটি সম্ভবত পরামর্শ দিতে পারে যে তিনি মেশিন লার্নিং, পরিসংখ্যান, বৃহত্তর ডেটার আকার বা কোনও উন্নত চক্রান্তের ক্ষেত্রে খুব কমই আচরণ করেন। এরকম কাউকে আমি ডেটা সায়েন্টিস্ট বলব না। অবশ্যই শিরোনামগুলি কোনও বিষয় নয় এবং এটি আপনার প্রয়োজনীয়তার উপর অনেক বেশি নির্ভর করে।

যে কোনও ক্ষেত্রে, অভিজ্ঞতা বা সিভি-র বিবৃতি দিয়ে রায় করবেন না। আমি সিভি দেখেছি এবং এর পেছনের লোকদেরও জানি।

ধরে নেই। তাকে পরীক্ষা! আপনি একটি পরীক্ষা সেট আপ যথেষ্ট ভাল হওয়া উচিত। এটি প্রদর্শিত হয়েছে যে দক্ষতা নির্ধারণের জন্য একা সাক্ষাত্কারগুলি অকেজো কাছাকাছি (তারা কেবল ব্যক্তিত্ব দেখায়)। একটি খুব সাধারণ তদারকি শেখার পরীক্ষা সেট আপ করুন এবং তাকে তার পছন্দসই কোনও সরঞ্জাম ব্যবহার করতে দিন।

এবং যদি আপনি প্রথমে কোনও সাক্ষাত্কারে লোকদের স্ক্রিন করতে চান, তবে তাকে পরিসংখ্যান বা মেশিন লার্নিং সম্পর্কে খুব মৌলিক তবে গুরুত্বপূর্ণ অন্তর্দৃষ্টি সম্পর্কে জিজ্ঞাসা করুন। আপনার বর্তমান কর্মীদের প্রত্যেকটিই জানেন single


2

আমাকে প্রথমে স্পষ্ট করে বলি যে আমি একটি প্রোগ্রামার এবং ডাটাবেস বিকাশকারী অবস্থান থেকে ডেটা সায়েন্সে আমার যাত্রা শুরু করছি। আমি 10 বছরের ডেটা বিজ্ঞান বিশেষজ্ঞ বা কোনও পরিসংখ্যান godশ্বর নই। তবে আমি বিশ্বব্যাপী বৃহত্তর ক্লায়েন্টদের সাথে কাজ করে এমন একটি সংস্থার জন্য ডেটা বিজ্ঞানী এবং বড় ডেটাসেটগুলি করি do

আমার অভিজ্ঞতা থেকে, ডেটা বিজ্ঞানী তাদের কাজটি সম্পন্ন করার জন্য প্রয়োজনীয় সমস্ত সরঞ্জাম ব্যবহার করে। এক্সেল, আর, এসএএস, পাইথন এবং আরও অনেকগুলি ভাল ডেটা বিজ্ঞানীর জন্য একটি সরঞ্জাম বাক্সে রয়েছে। ডেটা বিশ্লেষণ করতে এবং ক্রাচ করতে সর্বোত্তম বিভিন্ন ধরণের সরঞ্জাম ব্যবহার করতে পারে।

অতএব, যদি আপনি নিজেকে পাইথনের সাথে আর এর তুলনা করে দেখেন, তবে আপনি সম্ভবত ডেটা বিজ্ঞানের জগতে এটি সমস্ত ভুল করছেন। একে অপরকে ব্যবহার করা যখন বোধগম্য হয় তখন ভাল ডেটা বিজ্ঞানী উভয়ই ব্যবহার করেন। এটি এক্সেলের ক্ষেত্রেও প্রযোজ্য।

আমি মনে করি যে সবকিছুতে দুর্দান্ত থাকাকালীন এমন অনেকগুলি সরঞ্জাম এবং ভাষায় অভিজ্ঞতা থাকতে পারে এমন কাউকে খুঁজে পাওয়া বরং বরং কঠিন। আমি আরও মনে করি যে এটি বিশেষত ডেটা বিজ্ঞানীকে খুঁজে পাওয়া শক্ত হবে যা কেবল জটিল অ্যালগরিদমগুলিই প্রোগ্রাম করতে পারে না তবে এটি কীভাবে একটি পরিসংখ্যানগত দিক থেকেও ব্যবহার করতে হয় তাও জানেন।

আমি যে ডেটা বিজ্ঞানী নিয়ে কাজ করেছি তার বেশিরভাগই প্রায় ২ টি স্বাদ নিয়ে আসেন। যাঁরা প্রোগ্রাম করতে পারেন এবং যা তারা পারেন না। আমি ডেটা সায়েন্টিস্টের সাথে খুব কমই কাজ করি যা পাইথনে ডেটা টানতে পারে, পান্ডার মতো কিছু দিয়ে এটিকে চালিত করতে পারে, আর এর ডেটাতে একটি মডেল ফিট করে এবং তারপরে সপ্তাহের শেষে এটি পরিচালনায় উপস্থাপন করতে পারে।

মানে, আমি জানি তাদের অস্তিত্ব আছে। আমি ওয়েব স্ক্র্যাপার বিকাশকারী ছেলেদের কাছ থেকে অনেকগুলি ডেটা সায়েন্স ব্লগ পড়েছি, এটি হ্যাডোপের দিকে ঠেলে দিয়ে, পাইথনে এটি আবার টেনে আছি, জটিল জিনিসগুলিকে প্রোগ্রামিং করেছি এবং আর এর মাধ্যমে বুটে চালিয়ে যাচ্ছি। তারা আছে. তারা বাইরে আছে। আমি খুব বেশি দৌড়ে যাইনি যে এই সমস্ত কিছুই করতে পারে। এটি সম্ভবত আমার এলাকা যদিও?

সুতরাং, তার মানে কি কেবলমাত্র একটি জিনিসকেই খারাপ বিশেষায়িত করা? না। আমার প্রচুর বন্ধুরা কেবল একটি মূল ভাষায় বিশেষজ্ঞ এবং এটিকে হত্যা করে। আমি প্রচুর ডেটা ছেলেরা জানি যারা কেবল আর জানেন এবং এটি মেরে ফেলেন। আমি প্রচুর লোককেও জানি যারা ডেটা বিশ্লেষণের জন্য কেবল এক্সেল ব্যবহার করেন কারণ বেশিরভাগ নন-ডেটা বিজ্ঞানী বিজ্ঞানী খুলতে এবং ব্যবহার করতে পারেন (বিশেষত বি 2 বি সংস্থাগুলিতে)। আপনার সত্যিই যে প্রশ্নের উত্তর দিতে হবে তা হল যদি এই একটি জিনিসই এই অবস্থানের জন্য আপনার প্রয়োজন হয় তবে? এবং সবচেয়ে বড় কথা, তারা কি নতুন জিনিস শিখতে পারে?

দ্রষ্টব্য

ডেটা সায়েন্স কেবলমাত্র "বিগ ডেটা" বা নোএসকিউএল-তে সীমাবদ্ধ নয়।


হাই গ্লেন, আপনার মন্তব্যের জন্য ধন্যবাদ। নীচের লিঙ্কটি একবার দেখুন। এটি আইবিএম-এ ওয়াটসন দলের নেতৃত্বদানকারী স্বামী চন্দ্রশেকরনের, সুতরাং আমার মতে একজন অভিজ্ঞ অভিজ্ঞ ডেটা বিজ্ঞানী। "ফান্ডামেন্টালস" এবং পরিসংখ্যানের পিছনে কোনও ডেটা বিজ্ঞানীর জানা দরকার তৃতীয় জিনিস হিসাবে তাঁর প্রোগ্রামিং রয়েছে। তার রোডম্যাপ অনুসারে, একবার আপনি কীভাবে প্রোগ্রাম করবেন তা জানার পরে আপনি একজন ডেটা বিজ্ঞানী হওয়ার 15% উপায় are এর উপর ভিত্তি করে, আমি সম্ভবত এই বিবৃতিটির সাথে কিছুটা দ্বিমত পোষণ করতে পারি যে সত্য তথ্য বিজ্ঞানীরা "নন-প্রোগ্রামিং" স্বাদে আসেন। nirvacana.com/mittedts/becoming-a-data-scientist
JHowIX

ঠিক আছে, আমি কেবল এটি অভিজ্ঞতার ভিত্তিতে বলি। বেশিরভাগ পরিসংখ্যান এবং ডেটা সায়েন্স কোর্স এমনকি জনপ্রিয় পরিসংখ্যান প্রোগ্রামগুলির জন্য আপনার প্রয়োজনীয়তার বাইরে প্রোগ্রামিংও কভার করে না। সেই কারণে, আমি পরিসংখ্যান জগতের বেশিরভাগ ছেলেদের প্রোগ্রামিংয়ে ভাল না। এগুলি সত্যিকারের চিন্তার মতো যখন তারা আসল বিশ্বে প্রবেশ করে এবং বুঝতে পারে যে এটি সাহায্য করে।
গ্লেন সোয়ান

1

এক্সেল অনুসন্ধানের তথ্য বিশ্লেষণের জন্য একটি দুর্দান্ত সরঞ্জাম হতে পারে এটি সত্যই আপনার প্রয়োজনের উপর নির্ভর করে এবং অবশ্যই এটির কোনও সরঞ্জামের মতোই এর সীমাবদ্ধতা রয়েছে তবে এক্সেল অবশ্যই ডেটা সায়েন্স হলের খ্যাতির স্থানের জন্য উপযুক্ত।

মনে রাখবেন যে অনুশীলনে বেশিরভাগ ব্যবহারকারীরা যে কোনও উপায়ে একটি ভারী হ্রাসযুক্ত ডেটা সেট অনুসন্ধান করবেন (কোনও এসকিউএল কোয়েরি থেকে তৈরি)।

পিভট টেবিলের সাথে আপনি যখন "টেবিল" অবজেক্টটি ব্যবহার করেন তখন এক্সেল ডেটা অন্বেষণের জন্য শক্তিশালী, ভিজ্যুয়ালাইজিং সমস্ত 1-2 ক্লিক সর্বাধিক এবং পাওয়ারপয়েন্টে প্রচুর এক্সেল চার্ট দুর্দান্ত দেখায়, যদি না আপনার দৃষ্টি আকর্ষণীয় কিছু তৈরি করে যেমন উদাহরণস্বরূপ বৈজ্ঞানিক কম্পিউটিং প্রসঙ্গ। ইন্টারেক্টিভ প্রকৃতির অর্থ আপনি দ্রুত অন্বেষণ করতে পারবেন।

"টেবিল" অবজেক্টের সুবিধাগুলি হ'ল আপনি যখন এক্সপ্লোরেশনে ডেটাটিকে আরও রূপান্তর করেন তখন আপনাকে পাইভট টেবিলগুলি নতুন ডিস্ট্রিবিউশনগুলি অন্বেষণ করতে সক্ষম করতে ভেরিয়েবলটি সমস্ত মনে থাকে।

এক্সেল দুর্বল হ'ল সূত্রের তালিকাটি তর্কযুক্তভাবে সীমাবদ্ধ করা হচ্ছে, উদাহরণস্বরূপ একটি এসকিউএল কেস স্টেটমেন্ট বা পাইথন স্ট্যাটমেন্টটি যদি ফাংশনগুলির একটি অন্তহীন চেইনের চেয়ে আরও নমনীয়।

এটি সত্যই আপনার প্রয়োজনের উপর নির্ভর করে তবে এক্সেল অবশ্যই ডেটা সায়েন্স হলের খ্যাতির একটি স্থানের জন্য উপযুক্ত।

আকর্ষণীয় উপাখ্যান, ফেসবুক নিউজফিড অ্যালগরিদমে যে দলটি কাজ করে তাদের সবাইকে নিয়মিতভাবে এক্সেল এবং প্রচুর স্প্রেডশিট নিয়ে খেলতে দেখা যায়।


0

আমি একটি বিজনেস অ্যানালিটিক্স কোর্স শিখি যার মধ্যে এসকিউএল এবং এক্সেল রয়েছে। আমি একটি ব্যবসায়িক স্কুলে পড়ি তাই আমার ছাত্ররা সবচেয়ে প্রযুক্তিগতভাবে সক্ষম নয়, এজন্য আমি আর, প্যান্ডাস বা ওয়েকার মতো কিছু ব্যবহার করিনি। বলা হচ্ছে, এক্সেল একটি ডেটা বিশ্লেষণের জন্য যথেষ্ট শক্তিশালী সরঞ্জাম। এটি ডেটা মাইনিং অ্যাড-ইন ব্যবহার করে এসকিউএল সার্ভার বিশ্লেষণ পরিষেবাদির (ডেটা বিশ্লেষণের জন্য এসকিউএল সার্ভারের একটি উপাদান) সম্মুখ প্রান্ত হিসাবে কাজ করার ক্ষমতা থেকে এই শক্তিটির বেশিরভাগ অংশটি পায়।

এসএসএএস আপনাকে সিদ্ধান্ত গাছগুলি তৈরি করতে, লিনিয়ার এবং লজিস্টিক রিগ্রেশনগুলি সম্পাদন করতে, এবং এমনকি বেয়েসিয়ান বা নিউরাল নেটওয়ার্ক তৈরি করতে দেয়। আমি খুঁজে পেয়েছি যে এক্সেলকে ফ্রন্ট-এন্ড হিসাবে ব্যবহার করা এই ধরণের বিশ্লেষণগুলি করার পক্ষে হুমকীজনক দৃষ্টিভঙ্গি হওয়ায় তারা সকলেই এর আগে এক্সেল ব্যবহার করেছে। এক্সেল ছাড়াই এসএসএএস ব্যবহারের উপায়টি ভিজ্যুয়াল স্টুডিওর একটি বিশেষ সংস্করণের মাধ্যমে এবং এটি সেখানে সবচেয়ে ব্যবহারকারী বান্ধব সরঞ্জাম নয়। আপনি যখন এটিকে কয়েকটি অন্যান্য এক্সেল সরঞ্জামগুলির সাথে পাওয়ার ক্যোয়ারী এবং পাওয়ার পাইভোটের সাথে একত্রিত করেন, আপনি তথ্যের কিছুটা পরিশীলিত বিশ্লেষণ করতে সক্ষম হবেন।

সম্পূর্ণ প্রকাশ, আমি পরের বছর কোর্সের নতুন সংস্করণটি পড়ানোর সময় আমি সম্ভবত এটি আবার ব্যবহার করতে যাচ্ছি না (আমরা এটি দুটি কোর্সে বিভক্ত করছি যাতে কেউ ডেটা বিশ্লেষণে আরও বেশি মনোযোগ দিতে পারে)। তবে এটি কেবল কারণ অ্যালটারেক্সের জন্য বিশ্ববিদ্যালয় পর্যাপ্ত লাইসেন্স পেতে সক্ষম হয়েছিল যা ব্যবহার করা আরও সহজ এবং আরও শক্তিশালী তবে আপনি যদি কোনওভাবে নিখরচায় না পান তবে এটি-4-85 কে / ব্যবহারকারী / বছর। এক্সেল সম্পর্কে আপনি কী চাইবেন বলুন, তবে এটি সেই দাম পয়েন্টকে পরাজিত করবে।


0

এক্সেল একটি দুর্দান্ত সরঞ্জাম হতে পারে। অবশ্যই, আপনি যা করছেন তার উপর নির্ভর করে এটি বিলের সাথে মানানসই হতে পারে তবে যদি তা হয় তবে এটি বরখাস্ত করা প্রায় বোকামি। আপনার পাইপলাইনটি স্থাপন করতে কিছুটা সময় সময় লাগার সময়, এক্সেলের মাধ্যমে আপনি বেশ কয়েকটি চলমান স্থলটিকে আঘাত করতে পারেন: বিল্ট ইন ইন ইউআই, এমনকি পাইথনের মাধ্যমে ভিবিএর মাধ্যমে সহজ প্রসারিতকরণ (যেমন https://www.xlwings.org )। সংস্করণ নিয়ন্ত্রণের মতো জিনিসগুলির ক্ষেত্রে এটি আদর্শ নাও হতে পারে তবে গিট দিয়ে এটিকে কাজ করার উপায় রয়েছে (উদাঃ https://www.xltrail.com/blog/auto-export-vba-commit-hook )।


-2

এই স্বতন্ত্রটি 'বিগ ডেটা' নিয়ে কাজ করে এবং প্রাথমিকভাবে এক্সেল ব্যবহার করে? সিরিয়াসলি?!?! এক্সেল কেবলমাত্র একা স্প্রেডশিটে 1, 048, 576 সারি ডেটা পরিচালনা করে। এর বাইরে ডেটা সেটগুলির জন্য এটিতে একটি প্লাগইন প্রয়োজন। এছাড়াও এক্সেলের পিভট টেবিলগুলির বিশ্লেষণে সেগুলি ব্যবহার করে সম্পাদন করা যেতে পারে তার উপর কঠোর বিধিনিষেধ রয়েছে।

আপনি যে কাজের জন্য নিয়োগ দিচ্ছেন তাতে কোন ধরণের ডেটা অ্যানালিটিক্স কার্য সম্পাদন করা প্রয়োজন?

আমি আপনাকে পরামর্শ দিচ্ছি যে আপনি সাক্ষাত্কারগুলি পরিচালনা করবেন যা বিবেচনাধীন চাকরিতে কাজ করা দরকার সেগুলির পরীক্ষা করা অন্তর্ভুক্ত। গোপনীয়তা, গোপনীয়তা বা ডেটা সুরক্ষা লঙ্ঘন না করে, সাক্ষাত্কারের অংশ হিসাবে নির্ধারিত প্রোগ্রামিং বা ডেটা বিশ্লেষণ কার্যটিতে সাক্ষাত্কার প্রাপ্ত পোস্টের সাথে সম্পর্কিত একটি ডেটাসেটের একটি (ছদ্মনাম) উপসেট অন্তর্ভুক্ত করা উচিত। অন্যথায় আপনি হয়ত কথোপকথন ভিত্তিক সাক্ষাত্কারে অন্তর্ভুক্ত এমন কাউকে নিয়োগ দেওয়া শেষ করতে পারেন তবে প্রকৃত কাজটি সম্পাদনে আসলেই সক্ষম নন।


কেউ 'বিগ ডেটা' বলেনি। তারা 'তথ্য বিজ্ঞানী' বলেছেন। সমস্ত ডেটা 'বিগ ডেটা' নয়। আমি অভিজ্ঞ ডাটা বিজ্ঞানীদের সাথে কাজ করেছি যারা একটি প্রকল্পে আর, পাইথন, এসকিউএল এবং এক্সেল সমস্ত ব্যবহার করে। সমস্ত ডেটা বিশ্লেষণ প্রোগ্রামযুক্ত বা স্ক্রিপ্টযুক্ত নয়। অন্য কোথাও যেমন বলা হয়েছে, অস্পষ্ট কাজ ==> বিভিন্ন ধরণের ডেটা বিজ্ঞানীরা।
smci
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.