ইন্টারনেট সংস্থাগুলি কেন ডেটা বিজ্ঞানী কাজের জন্য জাভা / পাইথন পছন্দ করে?


53

আমি পাইথন / জাভা অভিজ্ঞতা জিজ্ঞাসা করে ডেটা বিজ্ঞানীর জন্য কাজের বিবরণে অনেক বার দেখছি এবং আর অবজ্ঞা না করে নীচে লিংকডিনের মাধ্যমে আবেদন করা একটি সংস্থার চিফ ডেটা সায়েন্টিস্টের কাছ থেকে প্রাপ্ত একটি ব্যক্তিগত ইমেল আমার নীচে রয়েছে।

এক্স, সংযোগ স্থাপন এবং আগ্রহ প্রকাশ করার জন্য ধন্যবাদ। আপনার কাছে ভাল অ্যানালিটিক্স দক্ষতা রয়েছে। তবে, আমাদের সমস্ত ডেটা বিজ্ঞানীদের অবশ্যই জাভা / পাইথনে ভাল প্রোগ্রামিং দক্ষতা থাকতে হবে কারণ আমরা একটি ইন্টারনেট / মোবাইল সংস্থা এবং আমরা যা কিছু করি তা অনলাইনে।

আমি প্রধান তথ্য বিজ্ঞানীর সিদ্ধান্তকে সম্মান জানালেও পাইথন যে কাজগুলি আর করতে পারে না সেগুলি কী করতে পারে সে সম্পর্কে আমি একটি পরিষ্কার চিত্র পেতে পারিনি। কেউ কি বিস্তৃত যত্ন নিতে পারেন? আমি পাইথন / জাভা শিখতে আগ্রহী, যদি আমি আরও কিছু বিশদ পাই।

সম্পাদনা: আমি কোওরায় একটি আকর্ষণীয় আলোচনা পেয়েছি। পাইথন ডেটা বিজ্ঞানীদের কাছে পছন্দের ভাষা কেন?

সম্পাদনা 2: মেশিন লার্নিংয়ের জন্য ভাষা এবং গ্রন্থাগারগুলিতে উদাসিটি থেকে ব্লগ


8
পাইথন একটি ভাল সমঝোতা: এটি ডেটাসায়েন্সের জন্য অনেকগুলি (অ-মানক) লাইব্রেরি সরবরাহ করে (পান্ডাস, সাইকিট, ...) এবং অনেক শিল্প প্রক্রিয়া ইতিমধ্যে পাইথনে কোডেড।
মনু এইচ

4
"আমাদের ডেটা বিজ্ঞানীদের অবশ্যই জাভা / পাইথনে ভাল প্রোগ্রামিং দক্ষতা থাকতে হবে কারণ আমরা একটি ইন্টারনেট / মোবাইল সংস্থা এবং আমরা যা কিছু করি তা অনলাইনে করা হয়" এটি একটি বিশাল অ-সিকুইটর - উপসংহারটি সিদ্ধান্তটি অনুসরণ করে না । আমার সন্দেহ হয় সিডিএস আপনাকে ছাড়ানোর চেষ্টা করছে।
স্পেসডম্যান

5
@ মানুহ যদি "অ-মানক" দ্বারা বোঝানো হয় তবে আপনি "স্ট্যান্ডার্ড লাইব্রেরিতে নেই," আপনি সঠিক বলেছেন। তবে এই সরঞ্জামগুলি বেশ প্রশস্ত-প্রসারিত ব্যবহার পায় এবং সেগুলি অবশ্যই ভাষার মূল। নম্পির কাছে বর্তমানে এসও-তে 100k এর বেশি প্রশ্ন রয়েছে, পান্ডাসের 74k রয়েছে। আমি মনে করি আপনি অবশ্যই একটি কেস তৈরি করতে পারেন যে তারা শিল্পের মান । (কমপক্ষে সফ্টওয়্যার বিকাশের দিকে। আমি নিজেকে খুব সহজেই একটি "ডেটা সায়েন্টিস্ট" বলি)
jpmc26

2
"ডেটা সায়েন্টিস্ট" ভাল সংজ্ঞাযুক্ত শব্দ নয়। ডেটা সায়েন্টিস্ট মূলত এমন কেউ যিনি ডেটা সহ দরকারী জিনিসগুলি করতে পারেন। তাদের মেশিন লার্নিং বা স্ট্যাটিস্টিকাল প্যাকেজগুলি ব্যবহার করার দরকার নেই। বিপুল পরিমাণে ডেটা পরিচালনা করতে এবং কোনও মেশিন শেখা ছাড়াই দরকারী অন্তর্দৃষ্টি পেতে যে কেউ জাভা / স্কেলা / স্পার্ক / যা ব্যবহার করতে পারে।
আকাওয়াল

2
@ jpmc26 হ্যাঁ এটিই আমি বোঝাতে চাইছিলাম। এখন আমি বুঝতে পেরেছি যে এমনকি গ্রন্থাগারগুলি যা এখনও শিল্পের মানগুলিতে পৌঁছায়নি তাদের উল্লেখ করা যেতে পারে (পাইথনের আরও একটি যুক্তি)
মানু এইচ

উত্তর:


67

সুতরাং আপনি বাকী কোড বেসের সাথে একীভূত করতে পারেন। দেখে মনে হচ্ছে আপনার সংস্থা জাভা এবং পাইথনের মিশ্রণ ব্যবহার করেছে। সাইটের কোনও কোণে যদি মেশিন লার্নিংয়ের প্রয়োজন হয় তবে আপনি কী করতে যাচ্ছেন; একটি ডাটাবেস, বা একটি ক্যাশে দিয়ে চারপাশে তথ্য পাস, আর এ ড্রপ, এবং আরও কি? কেন এটি সব একই ভাষায় করবেন না? এটি দ্রুত, ক্লিনার এবং বজায় রাখা সহজ।

সম্পূর্ণরূপে আর-তে চলে এমন কোনও অনলাইন সংস্থা জানেন? আমিও না...

জাভা হ'ল সর্বশেষ ভাষা হ'ল আমি ডেটা বিজ্ঞান করব do


1
আমি বলছিলাম একটি পরিষেবা-ভিত্তিক আর্কিটেকচার সেতু প্রযুক্তিগুলিতেও সহায়তা করে। পিএমএমএল কিছুটা উদ্যোগ; আমি এটি ব্যবহার করি নি, তবে আপনার জাভা শপ, মাতৃ উদ্যোগের ভাষা, তাই আপনি কখনই জানেন না ...
Emre

3
@ এথুশিয়াস্ট ভুলে যাবেন না যে আপনি আরপিওয়াই 2 ব্যবহার করে অজগরের নীচে আর চালাতে পারেন (উদাহরণস্বরূপ) আপনি শেষ করতে পারেন (যেমন আমি আগের কাজটি করেছিলাম) পাইথুনের মাধ্যমে আর-তে লেখা মডেলগুলি চালিত করতে পারে যাতে তারা ওয়েব ইন্টারফেসের মাধ্যমে উপস্থাপিত হতে পারে জ্যাঙ্গোর মাধ্যমে
এমডি-টেক

2
আমরা সরল পাঠ্য .r ফাইলগুলিতে মডেলটি তৈরি করেছি যা পরীক্ষার (এবং বিল্ডিংয়ের সুবিধার্থে) জন্য আর দোভাষীর মধ্যে লোড করা হয়েছিল। যদিও এটি তৈরি করা হয়েছিল এবং পরীক্ষা করা হচ্ছিল আমরা RPY2 কে রেফারেন্স করে আরপিওয়াই 2 অবজেক্ট তৈরি করে এমন একটি অধ্যায় দিয়ে পাইথন জ্যাঙ্গো প্রকল্প তৈরি করেছি। এই বিষয়বস্তুগুলি তখন আর ফাইলগুলিকে একইভাবে লোড করার জন্য ব্যবহার করা হত আপনি সেগুলি দোভাষীতে লোড করবেন যাতে আমরা মডেলটি আবৃত ফাংশনগুলিতে অ্যাক্সেস করতে পারি। আমরা তখন অজগর মাধ্যমে ডেটাবেস থেকে আর এ পাস করতে পারি। অজগর স্তরটি আমাদের জাঙ্গো এবং ডেটাবেস ইত্যাদির উপর নিয়ন্ত্রণের সাথে ওয়েব ফ্রন্টএন্ড দিয়েছিল
MD-Tech

1
@ এথুশিয়াস্ট মডেলটির ফলাফলগুলি আরপিওয়াই 2-এর মধ্যে আর দ্বারা ফিরে আসে এবং বিভিন্ন উপায়ে বেশিরভাগ গ্রাফের সামনে প্রান্তে উপস্থাপিত হয়।
এমডি-টেক

2
@ এথুশিয়াসট এটি ফাইন্যান্সের জন্য একটি বায়েশিয়ান নেটওয়ার্ক ছিল তবে আমি এর চেয়ে বেশি কিছু বলতে পারি না। মডেলটি স্ট্রেট আরে লেখা হয়েছিল Just যখনই আমার প্রয়োজন হবে আমি ভিমে এটি সম্পাদনা করছিলাম এবং এটি RPy2 অবজেক্টে উত্স ("আমাদের_কোড.আর") ব্যবহার করে আরপি কোড 2 হিসাবে আরপি কোড লোড করে "মোতায়েন" করা হয়েছিল " এটি এমনভাবে করা হয়েছিল যাতে আমরা মডেলটি সম্পাদনা করতে পারি। এটি এই প্রশ্নের উত্তর নয়; এটির একটি উত্তর যা তার জিজ্ঞাসা করা হয়নি;)
এমডি-টেক

24

এর অনেকগুলি কারণ থাকতে পারে:

  1. কর্মশক্তি নমনীয়তা: একটি জাভা / পাইথন প্রোগ্রামার সহজেই অন্যান্য কাজ বা প্রকল্পে সরানো যেতে পারে।

  2. প্রার্থীদের প্রাপ্যতা: প্রচুর জাভা / পাইথন প্রোগ্রামার রয়েছে। পরে কোনও যোগ্য কর্মী নেই বা তারা খুব ব্যয়বহুল, তা জানতে আপনি কোনও নতুন প্রোগ্রামিং ভাষা চালু করতে চান না।

  3. ইন্টিগ্রেশন এবং ইটিএল: কখনও কখনও সঠিক মানের সাথে ডেটা পাওয়া প্রকল্পের সবচেয়ে শক্ত অংশ। সুতরাং অন্যান্য সিস্টেমগুলির মতো একই ভাষা ব্যবহার করা স্বাভাবিক।

  4. ব্যবসায়ের মডেল সংজ্ঞা: বেশিরভাগ ব্যবসায়িক বিধি এবং ব্যবসায়ের মডেল ইতিমধ্যে এই ভাষাগুলিতে লিখিত।

  5. সহজ জিনিস রাখা। প্রযুক্তিগুলির সাথে আপ টু ডেট থাকার জন্য এটি ইতিমধ্যে যথেষ্ট। ভাষার বিভিন্ন ভিত্তি বিশৃঙ্খল হতে পারে। এর জন্য আর, তার জন্য রুবি, স্কালা, ক্লোজার, এফ #, সুইফ্ট, ডার্ট ... তাদের প্রশাসনের জন্য বিভিন্ন সার্ভার, বিভিন্ন প্যাথ, একটি নরকের প্রয়োজন হতে পারে। সরঞ্জাম এবং প্লাগইনগুলির সাথে সকলের নিজস্ব আইডিই রয়েছে (সর্বদা বিনামূল্যে নয়)। ভাষা পছন্দ এবং নতুন প্রযুক্তি সম্পর্কে কিছু চাচা বব এর পয়েন্ট দেখুন

আপনার নির্দিষ্ট কাজের জন্য আর ব্যবহার করেও যদি আপনার 5% - 15% উত্পাদনশীলতার সুবিধা থাকে তবে তারা সম্ভবত এমন কোনও সরঞ্জাম পছন্দ করতে পারে যা সর্বাধিক দক্ষ উপায়ে না হলেও কেবল কাজটি করে।


যদিও সত্য, উপরের কেউই আসলে প্রশ্নের উত্তর দেয় না। ডেটাবেস জিজ্ঞাসা করা বা .csvফাইলগুলি পড়ার জন্য ডেটা প্রাপ্তি 99% বার হ্রাস করে - যার লক্ষ্য হল বাজারে সবচেয়ে ভাল উপযুক্ত সরঞ্জাম aim প্রার্থীদের প্রাপ্যতা: যে আর প্রোগ্রামারগুলির চেয়ে আরও বেশি জাভা প্রোগ্রামার রয়েছে তা বোঝায় না যে আপনার কাছে যদি কোনও আর প্রার্থী থাকে তবে আপনাকে বাতিল করতে হবে। বিজ্ঞানী বিজ্ঞানীরা যতক্ষণ না তাদের পাঠ্যযোগ্য কোড স্থাপন করেন যতক্ষণ না কিছু সার্ভার দ্বারা চালিত করা যায় (বা সংস্থাটি চালিয়ে যাচ্ছে অন্য কোনও জিনিস) ততক্ষণ তাদের অনুশীলনগুলি কার্যকর করে তাতে কিছু যায় আসে না।
জিন্ট

অবশ্যই আপনার প্রার্থী বাতিল করা উচিত নয়। ব্যক্তিটি সরঞ্জামের চেয়ে অনেক বেশি গুরুত্বপূর্ণ। তাদের দলটি আর শিখতে পারে এবং প্রার্থী জাভা / পাইথন শিখতে পারে। তবে সময় লাগবে যার অর্থ অর্থ।
বোরজব

আমি যে বিষয়টি অবশ্যই দ্বিমত পোষণ করছি তা হ'ল ভাষাটি কিছু মনে করে না। যে দলের একমাত্র সদস্য যিনি আর জানেন তা কোনও ছুটির দিন না হলে এবং তাদের পরিবর্তন করা দরকার বস খুশি হবেন না। অথবা কেবল দলটিকে জিজ্ঞাসা করুন "ওহ দুর্দান্ত, আমাদের নতুন ভাষা শিখতে হবে কারণ নতুন এটি এইভাবে কাজ করে"। সার্ভার প্রশাসন হতে পারে অন্য বিভাগ এবং নতুন ধরণের সার্ভারের জন্য কিছু নতুন বিশ্লেষণ, পদ্ধতি ইত্যাদি প্রয়োজন হতে পারে নতুন ভাষা ব্যবহারের জন্য আপনার আইটি সুরক্ষা থেকে সবুজ আলো দরকার।
বোরজব

@ জেনারো টেডেসকো প্রার্থী দ্বারা লিখিত কোডটি অবশ্যই অন্যান্য প্রোগ্রামারদের দ্বারা রক্ষণাবেক্ষণযোগ্য হতে হবে , একসাথে কাজ করার সময় এবং কিছু ভবিষ্যতে যখন মূল লেখক এগিয়ে চলেবেন । কোনও টেকনিক ভাল জানেন এমন প্রার্থী থাকা যথেষ্ট নয়, আপনি যখন প্রয়োজন হবে তখন কারিগরি ভাল জানেন এমন অন্য প্রার্থীকে নিয়োগ দেওয়া কতটা সহজ হবে তা বিবেচনা করা এখনও গুরুত্বপূর্ণ । অবশ্যই, যদি একটি উপযুক্ত কারণ থাকে তবে কুলুঙ্গি প্রযুক্তির একটি নতুন অংশ চালু করা যেতে পারে, তবে এই জাতীয় ব্যবসায়ের ঝুঁকি ছাড়িয়ে নেওয়ার জন্য একটি ভাল কারণ প্রয়োজন।
পিটারিস

আপনি আর ব্যবহার করে একটি $ x এর উত্পাদনশীলতা উন্নতি থাকতে পারে, কিন্তু এটা কোন সাহায্যের যদি তারা ব্যয় করে আছে $ তাদের কর্মপ্রবাহ পরিবর্তন মধ্যে প্রচেষ্টার 2x। তারা কেন এমনটি করবে, বিশেষত যদি তারা এমন কাউকে নিয়োগ করতে পারে যার জন্য তাদের 2x ডলার ব্যয় করতে পারে না ?
ব্যবহারকারী1908704

14

এটি সাধারণভাবে সত্য যে বিশুদ্ধভাবে ডেটা বিজ্ঞান এবং পরিসংখ্যান অনুশীলনের জন্য আর সবচেয়ে ভাল এবং দ্রুত (বিশেষত data.tableপ্যাকেজটি ব্যবহার করে ) সরঞ্জাম এবং পদ্ধতি সরবরাহ করে, অন্যথায় পাইথনে প্রয়োগ করা আরও ভারী হবে (আমি পাইথনের দ্বারা অনুমান করি আমরা সকলেই পাণ্ডকে বোঝাই, যদিও )। বেশিরভাগ ডেটা বিজ্ঞানী সত্যই তাদের মডেল এবং গণনা সম্পাদন করতে, বা কেবল ডেটা কীভাবে আচরণ করে তা দেখতে ব্যবহার করে।

অনুশীলনটি শেষ হয়ে গেলে এটি ব্যবহারের বাকী লোকেদের (যেমন মোতায়েন করার জন্য) এটি উপলব্ধ করার সময় এসেছে; এই লক্ষ্যে প্রায়শই মূলত দুটি মূল কারণে পাইথনে কোড জমা দেওয়া পছন্দ করা হয়:

  1. বেশিরভাগ আর্কিটেকচার পাইথনে লেখা বা পাইথন বান্ধব, তাই সেই ভাষায় স্থানীয়ভাবে রচিত মডেলগুলি প্রয়োগ করা সহজ হবে।
  2. আর সিনট্যাক্স এবং ব্যাকরণ অত্যন্ত জটিল। আমি নিজেও আর কিছু বাদে আর এর পক্ষে দৃ strongly়রূপে সমর্থন করি তবে স্বীকার করতে হবে যে বাক্যবিন্যাসটি সত্যই সরল নয় এবং খুব শিখার বক্ররেখা রয়েছে।

উপরের অংশে বলা হয়েছে, এটি এখনও সত্য যে কোনওটি সহজেই আর কোডটি অন্য যে কোনও ভাষায় অনুবাদ করতে পারে, প্রদত্ত পদ্ধতি, গ্রন্থাগার এবং প্যাকেজগুলি উপলব্ধ রয়েছে (পাইথনে বেশিরভাগ রয়েছে, সুতরাং এটি কোনও সমস্যা নয়)। প্রচুর অবকাঠামো এবং ডাটাবেসগুলি অন্তর্নিহিত আর কোডকে সমর্থন করে, সুতরাং বহনযোগ্যতা আসলেই কোনও সমস্যা নয়, বিশেষ করে যদি কেউ কেবল গণনার ফলাফল জমা দিতে হয় (যে প্রসারিত পর্যন্ত, আসলেই কেউ অন্তর্নিহিত কোডটি দেখতে পায় না)।

খাঁটি তথ্য বিজ্ঞানের জন্য জাভা প্রায় কোনও কাজে আসে না (যদিও স্ট্যানফোর্ড ইউনিভার্সিটিতে জাভাতে লেখা মেশিন লার্নিংয়ের এনএলপি লাইব্রেরি রয়েছে, যতদূর আমার মনে আছে - তবে দয়া করে দেখুন)। এটির প্রয়োজন হওয়ার একমাত্র কারণটি হ'ল বাকী সংস্থাগুলি এটি বড় এক্সটেন্টগুলিতে ব্যবহার করে এবং তারা এটিকে কোনও নতুন কিছু দিয়ে প্রতিস্থাপন করতে চায় না।


আপনার দৃষ্টিভঙ্গি এবং অভিজ্ঞতা ভাগ করে নেওয়ার জন্য ধন্যবাদ !! এটি সহায়ক। আপনার দ্বিতীয় শেষ অনুচ্ছেদ থেকে, আমি ধরে নিয়েছি আপনি বিজ্ঞান-শিখার কথা বলছেন? বা আপনার মানে আরপিই? বিশদ যত্ন?
উত্সাহিত

1
আমি কেবল বোঝাতে চাইছি আপনি আর-এ যা কিছু করছেন, সম্ভবত একই রকম পাইথন প্যাকেজ রয়েছে যা একই কাজ করে। পান্ডাস বেশিরভাগ জিনিস data.tableসরবরাহ করে; সাইকিট-লার্ন, যেমনটি আপনি উল্লেখ করেছেন, এর আরেকটি উদাহরণ, তবে হাতের কেস অনুসারে আরও অনেক কিছু রয়েছে।
14-18

1
ঠিক আমি কি করি। আর-এ গবেষণা শেষ হয়ে গেলে কোডবেজে সংহত করার জন্য অজগরকে অনুবাদ করুন। তবে @ এনথুসিস্ট আপনি সেই সংস্থায় একই কাজ করতে পারবেন কিনা তার সংস্কৃতির উপর নির্ভর করে। বেশিরভাগ লোকেরা তাদের বস ব্যবহার করে প্রোগ্রামিং ভাষা ব্যবহার করে। পাইথন শেখা খুব কঠিন নয়।
jf328

1
@ জেনারো টেডেসকো: "আমি সহজভাবে বলতে চাইছি আপনি আর-তে যা কিছু করছেন, সম্ভবত একই রকম পাইথন প্যাকেজ রয়েছে যা একই কাজ করে"। আমি আসলে এই বক্তব্যটির সাথে দৃ strongly়ভাবে একমত নই। আর এর সাথে সবচেয়ে বড় সুবিধা হ'ল 90% পরিসংখ্যানবিদরা পাইথনের চেয়ে আরে তাদের সর্বশেষ এবং "সর্বশ্রেষ্ঠ" প্রকাশ করেন। যদি এই পদ্ধতিগুলি চালিত হয় তবে শেষ পর্যন্ত তারা পাইথনে যাত্রা করতে পারে। তবে এটি পাইথনের পক্ষেও একটি প্লাস; আছে প্রচুর আর প্যাকেজ যে শুধু আবর্জনা হয় পরিসংখ্যান, যখন আমি মনে করি পাইথন stats প্যাকেজ আরো চেষ্টা এবং সত্য পদ্ধতি হতে করার সম্ভাবনা বেশি।
ক্লিফ এবি

"আর সিনট্যাক্স এবং ব্যাকরণ অত্যন্ত জটিল I এই উভয় মতামত বলে মনে হয়, কিন্তু একটি উদ্দেশ্যমূলক বক্তব্য হিসাবে পরিহিত এবং অন্যটি এটির বিরোধিতা করে। আমি হতবাক আমি এও অনুভব করি যে পাইথনের বাক্য গঠন এবং আইডিয়ামগুলি আরও জটিল (ওওপি জোর, একের জন্য), সুতরাং আমি এই উত্তরটি দ্বিগুণ বিভ্রান্ত করেছি।
উজ্জ্বল-তারকা

7

আমি "ডেটা ইঞ্জিনিয়ার" ধরণের ভূমিকার জন্য ডেটা সায়েন্টিস্ট শিরোনামটি ব্যবহার করে বেশ কয়েকটি সংস্থা দেখেছি। বিশেষত বড় ডেটা স্পেসে।

যদি সংস্থাটি হ্যাডোপ বা স্পার্কের মতো বিতরণ কাঠামোটি জাভা বা পাইথন (বা সম্ভবত স্কালা) এর বিশ্লেষণগুলি করতে করতে ব্যবহার করে তবে সর্বাধিক জ্ঞান অর্জন করবে।


এক্ষেত্রে আমি নিশ্চিতভাবে জানি যে মডেলিংয়ের জন্য ভূমিকাটি ছিল কারণ এটি মেশিন শেখার দক্ষতা এবং নির্দিষ্ট কৌশলগুলির নির্দিষ্ট তালিকা চেয়েছিল।
উত্সাহ

তারা এখনও সেই প্রযুক্তিগুলির মধ্যে জাভা / পাইথন লাইব্রেরি ব্যবহার করে, H20 বা MLlib বসন্তের মতো মনে মনে ব্যবহার করতে পারে।
গ্রীনপেনগুইন

4

জাভা

জাভা প্রশ্নে আমার অন্যান্য পোস্টারগুলির সাথে একমত হতে হবে। কিছু নোএসকিউএল ডাটাবেস রয়েছে (যেমন হ্যাডোপ) যা জাভাতে ম্যাপ্রেডস জব লিখতে হবে । এখন আপনি একই ফলাফল অর্জন করতে এইচআইভি ব্যবহার করতে পারেন ।

পাইথন

অজগর / আর বিতর্ক অব্যাহত রয়েছে। উভয়ই এক্সটেনসিবল ভাষা, সুতরাং সম্ভাব্যভাবে উভয়েরই প্রক্রিয়া করার একই ক্ষমতা থাকতে পারে। আমি কেবল আর জানি এবং আমার অজগর জ্ঞানটি বেশ উচ্চমানের। একটি ছোট ব্যবসায়ের মালিক হিসাবে কথা বলতে চাইলে আপনি আপনার ব্যবসায় খুব বেশি সরঞ্জাম না রাখতে চান অন্যথায় তাদের গভীরতার অভাব হবে এবং তাদের সমর্থন করতে অসুবিধা হবে। আমি মনে করি এটি দলে সরঞ্জাম জ্ঞানের গভীরতায় নেমে আসবে। যদি টিমটি অজগরটির দিকে মনোনিবেশ করে, তবে অন্য একটি অজগর ডেটা বিজ্ঞানী নিয়োগের বিষয়টি বোঝা যাচ্ছে কারণ তারা বিদ্যমান কোড বেস এবং historicতিহাসিক পরীক্ষামূলক কোডের সাথে জড়িত থাকতে পারে।


2

কমপক্ষে আমার বর্তমান দলের জন্য (~ 80 ডেটা বিজ্ঞানী এবং প্রকৌশলী), আমাদের এ জাতীয় পছন্দ নেই। এখানকার তথ্য বিজ্ঞানের অর্ধেকই আর এবং অন্য অর্ধেকটি পাইথন ব্যবহার করেন। উভয় উভয় কোড করতে পারেন। আমরা পাইথন এবং আর কোড প্রযোজনায় স্থাপন করি।

আমি মনে করি না যে আমাদের কোনও ডেটা বিজ্ঞানী জাভা ব্যবহার করেন না। তাদের যদি বড় ডেটা নিয়ে কাজ করার দরকার হয় তবে তারা স্পার্কএসকিউএল বা পাইএসপার্ক ব্যবহার করতে পারে। ডেটা ইঞ্জিনিয়ারিং টিম জাভা / স্কালা / পাইথন / গো এর মিশ্রণ ব্যবহার করে।

আপনি যদি একটি ছোট সংস্থার কয়েকটি ডেটা লোকের একজন হন তবে আমি বুঝতে পারি যে তাদের জন্য কেন নির্দিষ্ট ভাষার দক্ষতা প্রয়োজন তাই আপনি ডেটা সায়েন্স এবং ইঞ্জিনিয়ারিং উভয়ই করতে পারেন। তবে টিবিএইচ, আমি মনে করি বেশিরভাগ ছোট সংস্থাগুলির কাছে এত বড় ডেটা থাকবে না যে পাইথন বা আর উত্পাদন করতে পারে না।


আপনার সংস্থা যে ধরণের ব্যবসায়ের কাজ করে সে সম্পর্কে কী আপনি বিশদ বর্ণনা করতে পারেন? এবং এটি কি বাড়ির এমএল কাজে বা বাহ্যিক ক্লায়েন্টদের জন্য?
উত্সাহিত

1
@ এনথুসিস্ট খুচরা ব্যবসা। ইন-হাউস এমএল এর জন্য 100%।
পিগিগবক্স

0

একটি সাধারণ উদ্দেশ্য প্রোগ্রামার হিসাবে আমার দৃষ্টিভঙ্গি খুব অল্প বিল্প অভিজ্ঞতার সাথে: আর তথ্য বিজ্ঞানের পক্ষে দুর্দান্ত, তবে এটি ম্যানুয়ালি ডেটা ব্যাখ্যার লোকদের দিকে তত্পর। আপনি যদি স্বয়ংক্রিয় কোনও কিছুর জন্য ফলাফলগুলি ব্যবহার করতে চান, আপনাকে অন্য কোনও কিছুর সাথে ইন্টারফেস করতে হবে এবং আর এর মতো কোনও সমস্যা নির্দিষ্ট ভাষায় অন্য কিছু করা শক্ত হবে you আপনি কি আর কোনও ওয়েব সাইট করতে পারবেন? :) অন্যদিকে, অজগরের ডেটা সায়েন্সেস স্টাফের জন্য তৈরি গ্রন্থাগার রয়েছে এবং এটি একটি সাধারণ উদ্দেশ্য প্রোগ্রামিং ভাষা যা এটির সাথে আপনার আর কিছু করার পথে পায় না। জাভা হিসাবে, কয়েক লক্ষ থেকে কয়েক মিলিয়ন লাইনের কোড সহ বৃহত প্রোগ্রামিং প্রকল্পগুলির পক্ষে এটি ভাল। যদি ডেটা বিজ্ঞানের অংশটির সাথে ইন্টারফেসের প্রয়োজন হয় তবে জাভাতে সমস্ত কিছু করা বুদ্ধিমান হতে পারে।

এলোমেলো ঝকঝকে: আমাকে কেন প্রতিটি স্ট্যাকএক্সচেঞ্জ সাইটে আলাদাভাবে সাইন ইন করতে হবে?


4
বাজারে পাওয়া যায় এমন প্রায় সমস্ত সরঞ্জাম সহজেই আর কোড চালানো যায়। তথ্য বিজ্ঞানের জন্য জাভা প্রায় কোনও কাজে আসে না।
জেন্ট করা হয়েছে

1
@ জেনারো টেডেসকো জাভা বিগডাটা সরঞ্জামগুলিতে কোডিংয়ের জন্য দরকারী। সুতরাং তথ্য অনুসন্ধানের জন্য আংশিকভাবে কার্যকর।
উত্সাহ

-1

পাইথনের সরঞ্জামগুলি আর এর চেয়েও ভাল The থের আর সম্প্রদায়টি অচল অবস্থায় রয়েছে যখন পাইথন সম্প্রদায়টি সত্যই দ্রুত বিকশিত হচ্ছে। বিশেষত ডেটা সায়েন্সের সরঞ্জামগুলিতে।
এছাড়াও পাইথন তার চারপাশের সমস্ত কিছু দিয়ে সহজভাবে কাজ করে। আপনি সহজেই ওয়েব স্ক্র্যাপ করতে পারেন, ডাটাবেসের সাথে সংযুক্ত হতে পারেন এবং আরও কিছু করতে পারেন। এটি প্রোটোটাইপিংকে সত্যই দ্রুত করে তোলে।
এবং যদি আপনার কাছে কাজ করার প্রোটোটাইপ থাকে এবং এটি দ্রুত তৈরি করতে বা এটি কোম্পানির কর্মপ্রবাহে সংহত করার জন্য যত্নশীল হয় তবে এটি সাধারণত জাভাতে পুনরায় প্রয়োগ করা হয়।

আর কয়েকটি ঝরঝরে সরঞ্জাম এবং ভিজ্যুয়ালাইজেশন রয়েছে তবে এটিতে নতুন স্টাফ তৈরি করা এত দুর্দান্ত নয়।


4
এটি সব দিক থেকে সম্পূর্ণ ভুল।
জেনেটে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.