আমি একজন প্রোগ্রামার, আমি কীভাবে ডেটা সায়েন্সের ক্ষেত্রে নামব?


13

এই শব্দটির প্রথমটি এতই অস্পষ্ট মনে হচ্ছে।

যাইহোক..আমি একটি সফটওয়্যার প্রোগ্রামার। আমি যে ভাষাগুলি কোড করতে পারি তার মধ্যে একটি হল পাইথন। ডেটা বলতে আমি এসকিউএল ব্যবহার করতে পারি এবং ডেটা স্ক্র্যাপিং করতে পারি। এতদূর নিবন্ধ পড়ার পরে আমি এতক্ষণ যা বুঝতে পেরেছি তা ডেটা সায়েন্স এ সম্পর্কে ভাল:

1- পরিসংখ্যান

2- বীজগণিত

3- ডেটা বিশ্লেষণ

4- ভিজ্যুয়ালাইজেশন।

5- মেশিন লার্নিং।

আমি এখন অবধি যা জানি:

1- পাইথন প্রোগ্রামিং 2- পাইথনে ডেটা স্ক্র্যাপিং

আপনি বিশেষজ্ঞরা আমাকে গাইড করতে বা তত্ত্ব এবং ব্যবহারিক উভয়ই ব্রাশ করার জন্য একটি রোডম্যাপের পরামর্শ দিতে পারেন? আমি নিজেকে প্রায় 8 মাস সময়সীমা দিয়েছি।


আপনি "প্রবেশ করতে" চান তা সম্পর্কে নির্দিষ্ট করুন specific শুধু মাঠই নয়, কোন স্তরেও। উদাহরণস্বরূপ - "পেশাদার মেডিকেল পাঠ্য মাইনার" বা "অপেশাদার অ্যাস্ট্রোফিজিকাল মহাবিশ্ব পরীক্ষক"
পিট

আমি এমন কিছু হতে ইচ্ছুক যা পরামর্শদাতা বা কর্মচারী হিসাবে কাজ করতে পারে যা সংস্থাগুলি তাদের ডেটা খনন করতে এবং এর অন্তর্দৃষ্টি পেতে যোগাযোগ হতে পারে।
ভোলিটিল 3

(1) মেশিন লার্নিং এ অ্যান্ড্রু এর এনজি কোর্স; (২) ইয়াসার আবু-মোস্তফা তথ্য থেকে শিক্ষা গ্রহণের কোর্স; উভয়ই অ্যাক্সেসযোগ্য (সময় অন্তর্ভুক্ত নয়) এবং আপনাকে ভাল স্তর বোঝার সুযোগ দেবে।
ভ্লাদিস্লাভস ডভগ্লেলেকস


ডেটা সায়েন্স শব্দটি খুব বিস্তৃত। আপনি কী ধরণের চাকরি চান এবং কোন সংস্থায় আপনি কাজ করতে চান সেগুলির প্রয়োজনীয়তা এবং দায়িত্বগুলি সম্পর্কে আপনি ভাবতে পারেন। তাহলে আপনি জানতে পারবেন যে চাকরীটি আপনার প্রত্যাশা এবং আপনার সামর্থ্যের ব্যবধান পূরণ করে কিনা। এখানে GOOGLE- এ ডেটা বিজ্ঞানীর প্রয়োজনীয়তা রয়েছে। ! [Google থেকে ডেটা সায়েন্টিস্ট আবশ্যকতা ] ( i.stack.imgur.com/5KSN6.png )
Octoparse

উত্তর:


18

দক্ষতা অর্জনের দিকে কম এবং অভিজ্ঞতা অর্জনে আরও মনোনিবেশ করুন। আসলে কিছু সমস্যা সমাধান করার চেষ্টা করুন এবং গিথুবে আপনার কাজ পোস্ট করুন। আপনি প্রক্রিয়াটিতে আরও শিখতে পারবেন এবং নিয়োগকারীদের কাছে জ্ঞান এবং অভিজ্ঞতা প্রদর্শন করতে সক্ষম হবেন যা কোনও বিষয় বা তত্ত্বের অনুমিত গভীর ধারণা থাকার চেয়ে অনেক বেশি মূল্যবান।

ডেটা সায়েন্স এই দিনগুলিতে বেশ লোডযুক্ত ক্ষেত্র, সুতরাং আপনি কী ধরণের কাজ বিশেষভাবে করতে চান তা আমি নিশ্চিত নই, তবে মেশিন লার্নিং এটির একটি উপাদান হিসাবে ধরে নিচ্ছি তবে kaggle.com শুরু করার জন্য একটি ভাল জায়গা। লক্ষ্যগুলির ক্ষেত্রে, আপনি যদি পান্ডা / নম্পি / স্কিপিতে ডেটা নিয়ে কাজ করতে সক্ষম হন, সায়-কিটটিতে মডেল তৈরি করুন এবং সামুদ্রিক, জিগপ্ল্লট বা এমনকি ম্যাটপ্ল্লোব-এ কিছু সুন্দর গ্রাফ তৈরি করুন তবে আপনার পেতে সমস্যা হবে না দক্ষতার দৃষ্টিকোণ থেকে একটি কাজ - বিশেষত যদি আপনার সক্ষমতা প্রদর্শনের জন্য কোড নমুনা এবং উদাহরণ থাকে। আপনি যদি আটকে যান তবে স্ট্যাকেক্সচেঞ্জের হয় উত্তর হবে অথবা আপনি একটি প্রশ্ন পোস্ট করতে পারেন এবং শীঘ্রই আপনার একটি উত্তর হবে। একবার আপনি জীবিকা নির্বাহের জন্য কাজটি করার পরে আপনি আরও বেশি কিছু শিখবেন, সম্ভবত কোনও সিনিয়র দলের সদস্য যিনি আপনাকে পরামর্শ দেন you

ভাগ্য সুপ্রসন্ন হোক.


7

আমি ডেটা সায়েন্সে বার্কলে কোর্সের মতোই করি, ডেটা সায়েন্সের জন্য একটি ভাল ভিত্তি এবং স্বাদ দেবো, পরে উদাসতা এবং কোর্স এবং আরও অনেক সংস্থানগুলিতে স্থানান্তরিত। সুতরাং আপনার কাছে যদি প্রোগ্রামিং দক্ষতা থাকে তার চেয়ে বেশি গণিত এবং স্ট্যাট এবং প্রচুর ভিজ্যুয়ালাইজেশন প্রয়োজন। আইপিথনে অভ্যস্ত হওয়াও দুর্দান্ত হবে কারণ প্রতিটি পদক্ষেপ (ভিজ্যুয়ালাইজ করা) এটি কীভাবে পুরো স্ক্রিপ্ট লেখার পরিবর্তে পরীক্ষা সম্পাদন করে তা পরীক্ষা করা (অ্যানাকোন্ডা ইনস্টল করা এবং এর সাথে কাজ করা সহজ) এর জন্য প্রয়োজনীয় essential কোর্সটি বেলো তালিকাভুক্ত করা হয়েছে: bcourses.berkeley.edu/courses/1267848/Wiki এছাড়াও স্ট্যাটাসে আমি এসএএস এর কাছ থেকে ভাল ফ্রি কোর্স পেয়েছি: পরিসংখ্যান 1: আনোভা, রিগ্রেশন এবং লজিস্টিক রিগ্রেশন সাপোর্ট.সাস.com/edu/schedules.html এর পরিচিতি ? ctry = মার্কিন ও আইডি = 1979

এমএল দিয়ে শুরু করার পরামর্শ দেবে: www.kaggle.com/c/titanic/details/getting-st সূত্র- উইথ-প্যাথন

বামদিকে পিভট টেবিলগুলি ব্যবহার করে এক্সেলের পক্ষে এবং আর। ডেটা ক্যাম্প আর কীভাবে ব্যবহার করতে হয় তার টিউটোরিয়াল প্রকাশ করেছে Once www.dataschool.io থেকে আশ্চর্যজনক ভিডিও টিউটোরিয়াল

আশা করি এটা সাহায্য করবে ...


আপনার উত্তরের জন্য ধন্যবাদ. আপনি কীভাবে শিখলেন?
ভোলিটিল 3

1
অনলাইনে বই, টিউটোরিয়াল এবং ডেটা সহ খেলার সাথে সম্পর্কিত কোডগুলিতে প্রচুর হাত। Kaggle.com চেষ্টা করুন এবং প্রতিযোগিতার মাধ্যমে চেষ্টা করুন। এমএল শিখতে শুরু করে দুর্দান্ত।
n1tk

এবং শেষ পর্যন্ত ডেটা বিজ্ঞানীদের একটি সম্প্রদায় খুঁজে বের করার এবং প্রকল্পগুলিতে অংশ নেওয়ার চেষ্টা করুন, কোনও বই কী শিক্ষা দিতে পারে না এমন প্রকল্পগুলিতে আপনি এত অভিজ্ঞতার ভাগীদার হবেন।
n1tk

তবে পরিসংখ্যান, গণিত ইত্যাদির মতো তত্ত্বের ক্ষেত্রে আমি ভাল নই আমি
উনির

আমি আমার বিশেষ ক্ষেত্রে স্কুলে ফিরে এসে বিশ্লেষণ এবং ডেটা সায়েন্সে পিএইচডি প্রোগ্রামে চলে আসার বিষয়টি বিবেচনা করেছি ... বড় ক্যালকের জন্য ক্যালকুলাস 1,2, লিনিয়ার বীজগণিত, সংখ্যা লিনিয়ার বীজগণিত, এসএএস, আর, গণিত প্রয়োজন, গ্রাফ তত্ত্ব এবং আরও অনেক কিছু ...
n1tk

5

ডেভিডের সাথে দ্বিমত পোষণ করুন, একজন সত্য তথ্য বিজ্ঞানী হলেন একটি প্রয়োগকৃত পরিসংখ্যানবিদ যিনি সঠিক কারণে মেশিন লার্নিং অ্যালগরিদমগুলি কীভাবে ব্যবহার করতে পারেন তা জানেন এবং জানেন। পরিসংখ্যান সমস্ত তথ্য বিজ্ঞানের ভিত্তি science এটি প্রতি সেচ "কেক"। অন্য সব কিছু কেবল আইসিং হয়।

প্রশ্নটি কী ধরণের ডেটা বিজ্ঞানী হতে চান? আপনি কি এই বিভাগের (কীভাবে, কেন, কখন এবং কখন একটি অ্যালগরিদম বা কৌশল প্রয়োগ করবেন না এর জ্ঞান) বা কেগল স্ক্রিপ্ট কিডি স্কিপি ব্যবহার করে এবং তিনি ডেটা সায়েন্টিস্ট ভেবে ভাবতে চান?

1 - পরিসংখ্যান

2- বাকি সব


2
আপনি কী বলছেন তা আমি নিশ্চিত বুঝতে পারছি না। আমি কখনও বলিনি যে "প্রয়োগিত পরিসংখ্যান" জেনে রাখা গুরুত্বপূর্ণ নয় - আমি কেবল এই পার্থক্যটি তৈরি করেছিলাম যে পদ্ধতিগুলি প্রয়োগ করার অভিজ্ঞতা অর্জন করা পদ্ধতিগুলির মধ্যে তাত্ত্বিক জ্ঞান অর্জনের চেয়ে বেশি গুরুত্বপূর্ণ।
ডেভিড

1
ডেভিড, এটা ঠিক আমার মতবিরোধ ছিল। পদ্ধতিগুলির নিজস্ব তাত্ত্বিক জ্ঞান না থাকলে আমরা কেবলমাত্র স্ক্রিপ্ট কিডিস। অভিজ্ঞতা গুরুত্বপূর্ণ, তবে এটি তাত্ত্বিক জ্ঞানের একটি উপ-উত্পাদন, অন্যভাবে নয়।
লুকানো মার্কভ মডেল

2
না, তা নয়। প্রয়োগিত অভিজ্ঞতা এবং তাত্ত্বিক জ্ঞানের মধ্যে একটি বিস্তর পার্থক্য রয়েছে, প্রায়শই শ্রেণিকক্ষে শিল্প বনাম কী অর্জন করা হয় তার মধ্যে পার্থক্য। উদাহরণস্বরূপ, কীভাবে কার্যকরভাবে যাচাই করা যায় যে কোনও মডেল নিয়মিতকরণের তাত্ত্বিক আন্ডারপ্লিনিংগুলি জানার চেয়ে ক্রস যাচাইকরণের মতো প্রয়োগকৃত পদ্ধতি ব্যবহার করে অত্যধিক ফিট করে না তা কার্যকরভাবে কীভাবে যাচাই করা যায় তা জানার জন্য এটি আরও মূল্যবান। এছাড়াও, দয়া করে "স্ক্রিপ্ট বাচ্চাদের" উল্লেখ বন্ধ করুন - কেগল-এর নতুন এবং ভয়াবহ এক-ক্লিক-টু জমা কার্যকারিতাটি ব্যবহার করার পক্ষে পরামর্শ দিচ্ছেন না।
ডেভিড

1
যদি আপনি যা বলছেন তা যদি সত্য হয় তবে কেন সংস্থাগুলি পিএইচডি এবং স্নাতক ডিগ্রিধারী লোকদেরকে কেবল স্নাতক শ্রেণীর লোকদের চেয়ে বেশি পছন্দ করে? এটি এ কারণে যে তাদের কাছে এমন কৌশলগুলির তাত্ত্বিক জ্ঞান রয়েছে যা অ্যালগরিদমগুলি চালিত করে। তারা প্রতি সেচ ইঞ্জিন নির্মাতারা। তাত্ত্বিক জ্ঞান গভীর জ্ঞান। ক্যাগল স্ক্রিপ্ট কিডির জন্য একটি হোল্ডিং ট্যাঙ্ক।
লুকানো মার্কভ মডেল

1
আমি উভয়ই পয়েন্টগুলি দেখতে চাইলে আপনি দেখতে পাচ্ছেন, আমি মনে করি এটি সম্ভবত প্রসঙ্গের বাইরে। মূল প্রশ্নটি ছিল 'কীভাবে একজন প্রোগ্রামার ডেটা সায়েন্সে চাকরিতে রূপান্তর করতে পারে?' যদি প্রতিক্রিয়াটি 'সমস্ত কিছু ফেলে দেয়, পরিসংখ্যানগুলিতে পিএইচডি ডি অর্জন করতে কয়েক বছর সময় ব্যয় করে, তবে নিজেই কিছু প্রকল্প করুন এবং তারপরে প্রয়োগ শুরু করুন', এটি একটি দুর্দান্ত প্রচণ্ড বাধা এবং আপনি সম্ভবত তাদের ব্যবহারিক ক্ষেত্রে বিরক্ত না হওয়ার কথা বলতে পারেন ইন্দ্রিয়. বিপরীতে, পরিসংখ্যান পিএইচডি সংখ্যা (বা এমনকি মাস্টার্স) এবং লোকেরা খুঁজছেন সংখ্যার ভিত্তিতে, নিয়োগকর্তারা এমন ব্যক্তিদের বিবেচনা করতে পারেন যারা কোনও ডিগ্রি ছাড়াই অভিজ্ঞতা প্রদর্শন করতে পারে।
খ্রিস্টস

4

আপনি যদি সত্য জ্ঞানের সাথে ব্যবহারিক মানুষ হতে চান তবে গণিত দিয়ে শুরু করুন (ক্যালকুলাস, সম্ভাব্যতা + স্ট্যাট, লাইনারি বীজগণিত)। প্রতিটি পদক্ষেপে প্রোগ্রামিং সহ সবকিছু বাস্তবায়নের চেষ্টা করুন, অজগর এটির জন্য দুর্দান্ত। আপনি যখন ভাল জমি পাবেন, আসল ডেটা নিয়ে খেলুন এবং সমস্যার সমাধান করুন

পাঠ্যধারাগুলি. লিনিয়ার বীজগণিত - এডএক্স ল্যাফ বা ম্যাট্রিক্স স্ট্যাটে কোডিং - এডিএক্স স্ট্যাট 2x বার্কলে ক্যালকুলাস - পড়ুন ... এটি সহজ


2

ডেভিডের একটি ভাল বক্তব্য রয়েছে, আমি আপনাকে পরামর্শ দিচ্ছি যে যা কিছু এটি আপনার আগ্রহকে আরও বেশি চালিত করে on এটি প্রতিটি ধরণের প্রচেষ্টায় সফল হওয়ার একমাত্র উপায়। আপনি যদি এটির সাথে শীতল কিছু তৈরি করতে চান। আপনি যদি কোনও বই পড়তে চান তবে তাও ভাল। প্রারম্ভিক পয়েন্টটি কোনও ব্যাপার নয়। কিছু দিন আগে আপনি কী চান সে সম্পর্কে আপনার আরও ভাল ধারণা হবে এবং পরবর্তী সময়ে কী করা উচিত।


1

ডেটা সায়েন্স এত বিস্তৃত, এটিতে toোকার জন্য অনেকগুলি বিভিন্ন পথ রয়েছে। এটি সাধারণত 4 বা 5 বিভিন্ন ধরণের মধ্যে বিভক্ত হয় উদাহরণস্বরূপ:

এখানে চিত্র বর্ণনা লিখুন

আপনি এই বিষয়টির অন্যান্য পোস্টগুলি থেকে দেখতে পাচ্ছেন লোকেরা প্রয়োগিত পরিসংখ্যান ব্যাকগ্রাউন্ড (ডান অ্যালগরিদম প্রয়োগ করে), প্রোগ্রামিং ব্যাকগ্রাউন্ড (কাগল অংশ নিচ্ছে) এবং অন্যরা এটি ব্যবসায়ের ব্যাকগ্রাউন্ডে প্রয়োগ করছে

সচেতন সংস্থাগুলি একটি প্রোগ্রামিং স্কিউড ব্যক্তিকে "ডেটা ইঞ্জিনিয়ার" হিসাবে উল্লেখ করতে পারে। বড় সংস্থাগুলি তাদের ডেটা বিজ্ঞান দলের জন্যও প্রতিটি ধরণের ব্যবহার করে, তাই ভাল টি-আকৃতির দক্ষতা প্রদর্শন করা ভাল জিনিস হবে।


0

আপনি যদি একজন প্রোগ্রামার হন তবে আপনি সিদ্ধান্ত গাছের শ্রেণিবদ্ধ দিয়ে শুরু করতে পারেন, এন্ট্রপি এবং তথ্য-অর্জনের পিছনে গণিতটি বোঝার দিকে মনোনিবেশ করুন। এটি বোঝার জন্য প্রয়োজনীয় যে এমএল কেবলমাত্র ডেটা সংক্ষেপণের বিষয়ে about

আমি ব্যবহারিক কোর্সের মান সম্পর্কে অন্যান্য উত্তরগুলির সাথে খুব সম্মত হই। এমএল এর জন্য সর্বাধিক মূল্যবান হ'ল গণিত: সংখ্যা তত্ত্ব, লিনিয়ার বীজগণিত এবং সম্ভাবনা তত্ত্ব।

যদি আপনি গণিতে মনোনিবেশ না করেন তবে আপনি যা শিখবেন তা হ'ল যাদু করার জন্য কিছু গ্রন্থাগার কীভাবে ব্যবহার করা যায়, এটি মেশিন লার্নিং নয় এবং বিজ্ঞান মোটেই নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.