মেশিন লার্নিংয়ের জন্য পাইথন বনাম আর


101

আমি কেবল একাডেমিক উদ্দেশ্যে একটি মেশিন লার্নিং অ্যাপ্লিকেশন বিকাশ করা শুরু করছি । আমি বর্তমানে আর ব্যবহার করছি এবং এতে নিজেকে প্রশিক্ষণ দিচ্ছি। তবে, অনেক জায়গায় আমি পাইথন ব্যবহার করে লোকদের দেখেছি ।

লোকেরা একাডেমিয়া এবং শিল্পে কী ব্যবহার করছে এবং এর সুপারিশ কী?


3
ঠিক আছে, কোন ধরণের মেশিন লার্নিং (চিত্র / ভিডিও? এনএলপি? আর্থিক? জ্যোতির্বিজ্ঞান?), কোন শ্রেণিবদ্ধকারী, কোন আকারের ডেটাসেট (এমবি? জিবি? টিবি?), কোন স্কেল, কোন ল্যাটেন্সি, কোন প্ল্যাটফর্মে (মোবাইল / একক কম্পিউটার) / মাল্টিকোর / ক্লাস্টার / মেঘ) ...? আপনার অ্যাপ্লিকেশন কোন নির্দিষ্ট গ্রন্থাগার ব্যবহার করবে / প্রয়োজন হবে এবং আপনি প্রতিটি ভাষাতে কী উপলব্ধ তা পরীক্ষা করেছেন? আপনি কি কেবল নিজের ব্যক্তিগত শিক্ষার জন্য খেলনা অ্যাপ্লিকেশন তৈরি করছেন বা এটি যদি কখনও উত্পাদিত হয় তবে তা বিবেচনা করে? ওপেন-সোর্স বা মালিকানা ব্যবহার করছেন? আপনি কি অন্য ব্যক্তি বা বিদ্যমান অ্যাপ্লিকেশনগুলির সাথে কাজ করবেন এবং তারা কী ব্যবহার / সমর্থন করবেন? ওয়েব ফ্রন্টএন্ড / জিইউআই? ইত্যাদি
স্মি

1
একটি পর্যবেক্ষণ হ'ল পাইথন মেশিন লার্নিং লোকেরা বেশি ব্যবহৃত হয় বড় ডেটাসেটের সাথে কাজ করেন এবং আর বেশি ব্যবহার করেন প্রচলিত "পরিসংখ্যানবিদ", যেমন: শত শত তথ্য পয়েন্ট সহ মনোবিজ্ঞান পরীক্ষায় কাজ করা ব্যক্তিরা। যদিও এই পার্থক্যটি হ্রাস পাচ্ছে।
এক্সজি

অজগর সারা পথ মানুষ! আমার সহকর্মীরা একদিনে 4 বার জিনিসগুলি করে। এবং আপনি কেবল মেশিন লার্নিং নয়, সমস্ত ধরণের প্রোগ্রামিং কাজের জন্য অজগর ব্যবহার করতে পারেন।
ফ্রান্সেস্কো পেগোোরো

উত্তর:


91

আপনি যখন একে অপরকে আর বা পাইথন বেছে নিচ্ছেন তখন কিছু সত্যিকারের গুরুত্বপূর্ণ পার্থক্য বিবেচনা করুন :

  • মেশিন লার্নিংয়ের 2 টি পর্যায় রয়েছে। মডেল বিল্ডিং এবং প্রেডিকশন পর্ব। সাধারণত, মডেল বিল্ডিং ব্যাচ প্রক্রিয়া হিসাবে সম্পাদিত হয় এবং পূর্বাভাসগুলি রিয়েলটাইম হয় । মডেল বিল্ডিং প্রক্রিয়া একটি গণনা নিবিড় প্রক্রিয়া যখন পূর্বাভাস একটি নিমেষে ঘটে। অতএব, পাইথন বা আর-তে একটি অ্যালগরিদমের কার্যকারিতা ব্যবহারকারীর ঘুরে আসা সময়কে সত্যই প্রভাবিত করে না। পাইথন 1, আর 1।
  • উত্পাদন: পাইথন এবং আর এর মধ্যে আসল পার্থক্য উত্পাদন প্রস্তুত হওয়ার ক্ষেত্রে আসে। পাইথন যেমন একটি পূর্ণাঙ্গ প্রোগ্রামিং ল্যাঙ্গুয়েজ এবং অনেক সংস্থাগুলি তাদের উত্পাদন ব্যবস্থায় এটি ব্যবহার করে। আর একটি স্ট্যাটিস্টিকাল প্রোগ্রামিং সফ্টওয়্যার যা অনেকগুলি একাডেমিয়ার দ্বারা অনুগ্রহ করে এবং ডেটা সায়েন্স বৃদ্ধি এবং গ্রন্থাগারের প্রাপ্যতা এবং মুক্ত উত্স হওয়ার কারণে শিল্পটি আর ব্যবহার শুরু করেছে। এই প্রতিষ্ঠানের বেশিরভাগের জাভা, সি ++, সি #, পাইথন ইত্যাদি। সুতরাং, আদর্শিকভাবে তারা লেটেন্সি এবং রক্ষণাবেক্ষণের সমস্যাগুলি হ্রাস করার জন্য একই ভাষায় ভবিষ্যদ্বাণী পদ্ধতিটি দেখতে চান । পাইথন 2, আর 1।
  • গ্রন্থাগারসমূহ: উভয় ভাষার রয়েছে প্রচুর এবং নির্ভরযোগ্য গ্রন্থাগার। আর এর অনেকগুলি ডোমেনের 5000 টিরও বেশি লাইব্রেরি রয়েছে যখন পাইথনের কিছু অবিশ্বাস্য প্যাকেজ রয়েছে যেমন পান্ডা, নুমপি, সায়পি, স্কাইকিট লার্ন, ম্যাটপ্ল্লোলিব । পাইথন 3, আর 2
  • বিকাশ: উভয় ভাষাই বর্ণিত ভাষা। অনেকে বলে যে অজগরটি শেখা সহজ, এটি প্রায় ইংরেজি পড়ার মতো (এটি একটি হালকা নোটে রাখার জন্য) তবে আর আরও প্রাথমিক অধ্যয়নের প্রচেষ্টা প্রয়োজন। এছাড়াও, তাদের উভয়েরই ভাল আইডিই রয়েছে (পাইথনের স্পাইডার ইত্যাদি এবং আর এর জন্য আরস্টুডিও)। পাইথন 4, আর 2
  • গতি: আর সফ্টওয়্যারটির শুরুতে বড় গণনা (যেমন, এনএক্সএন ম্যাট্রিক্স গুণনের মতো) নিয়ে সমস্যা ছিল। কিন্তু, বিপ্লব বিশ্লেষণ দ্বারা আর-এর ভূমিকা নিয়েই এই সমস্যাটির সমাধান করা হয়েছে। সিটিতে তারা পুনরায় লিখিত গণনার নিবিড় ক্রিয়াকলাপ চালিয়েছে যা অত্যন্ত ত্বরান্বিত। পাইথন উচ্চ স্তরের ভাষা হওয়ায় তুলনামূলকভাবে ধীর হয়। পাইথন 4, আর 3
  • ভিজ্যুয়ালাইজেশন: ডেটা সায়েন্সে আমরা ব্যবহারকারীদের কাছে নিদর্শনগুলি প্রদর্শন করতে প্রায়শই ডেটা প্লট করার প্রবণতা রাখি। সুতরাং, সফ্টওয়্যার বাছাইয়ের জন্য ভিজ্যুয়ালাইজেশনগুলি একটি গুরুত্বপূর্ণ মানদণ্ডে পরিণত হয় এবং আর এ ক্ষেত্রে পাইথনকে পুরোপুরি মেরে ফেলে। অবিশ্বাস্য ggplot2 প্যাকেজের জন্য হ্যাডলি উইকহামকে ধন্যবাদ। হাত নীচে জিতল। পাইথন 4, আর 4
  • বড় ডেটা নিয়ে কাজ করা: আর এর অন্যতম বাধা হ'ল এটি সিস্টেমের মেমোরিতে (র‌্যাম) ডেটা সঞ্চয় করে। সুতরাং, আপনি যখন বিগ ডেটা পরিচালনা করছেন তখন র‍্যামের ক্ষমতা সীমাবদ্ধ হয়ে পড়ে। পাইথন ভাল কাজ করে, তবে আমি বলব, আর এবং পাইথন উভয়েরই এইচডিএফএস সংযোগকারী রয়েছে, হ্যাডোপ অবকাঠামোগত সুবিধা অর্জন করলে যথেষ্ট পারফরম্যান্সের উন্নতি হবে। সুতরাং, পাইথন 5, আর 5

সুতরাং, উভয় ভাষা সমানভাবে ভাল। সুতরাং, আপনার ডোমেন এবং আপনি যে স্থানের কাজ করছেন তার উপর নির্ভর করে আপনাকে স্মার্টভাবে সঠিক ভাষা চয়ন করতে হবে। প্রযুক্তি বিশ্ব সাধারণত একটি ভাষা ব্যবহার পছন্দ করে। ব্যবসায় ব্যবহারকারীরা (বিপণন বিশ্লেষণ, খুচরা বিশ্লেষণ) সাধারণত আর এর মতো পরিসংখ্যানগত প্রোগ্রামিং ভাষার সাথে যান, যেহেতু তারা প্রায়শই দ্রুত প্রোটোটাইপিং করে এবং ভিজ্যুয়ালাইজেশন তৈরি করে (যা পাইথনের তুলনায় আরে দ্রুত সম্পন্ন হয়)।


15
আর ভিজ্যুয়ালাইজেশনে অজগরকে কষ্ট সহ্য করে। আমি মনে করি এটি বরং বিপরীত; নয় পাইথন আছে ggplot (যা আমি নিজেকে ব্যবহার না যেহেতু মত আরো pythonic অপশন আছে, সমুদ্রজাত ), এটা এমনকি মত প্যাকেজের সাথে ব্রাউজারে ইন্টারেক্টিভ কল্পনা করতে পারি না বোকে
এমরে

10
এছাড়াও আর শাইনির সাথে ইন্টারঅ্যাকটিভ করার ক্ষমতা রাখে।
stanekam

13
গ্রন্থাগারিক - আমি এর সাথে মোটেও একমত নই। আর এখন পর্যন্ত সবচেয়ে ধনী সরঞ্জাম সেট, এবং এর চেয়েও বেশি কিছু এটি সঠিক উপায়ে তথ্য সরবরাহ করে, আংশিকভাবে এস উত্তরাধিকার সূত্রে প্রাপ্ত, আংশিকভাবে নামী বিশেষজ্ঞদের বৃহত্তম সম্প্রদায়ের অন্যতম by
রপাইও

34
"গতি: ​​আর সফ্টওয়্যারটিতে প্রথমদিকে বৃহত গণনাগুলির ক্ষেত্রে সমস্যা ছিল (যেমন, এনএক্সএন ম্যাট্রিক্স গুণনের মতো) But তবে, এই বিষয়টি আর বিপ্লব বিশ্লেষণ দ্বারা আর এর প্রবর্তনকে সম্বোধন করা হয়েছে। তাদের সি-তে পুনরায় লিখিত গণনা নিবিড় ক্রিয়াকলাপ রয়েছে যা নিন্দনীয়ভাবে দ্রুত। পাইথন উচ্চ স্তরের ভাষা হওয়ায় তুলনামূলকভাবে ধীর হয় "" আমি একজন অভিজ্ঞ আর ব্যবহারকারী নই, তবে যতদূর আমি জানি যে নিম্ন-স্তরের বাস্তবায়নের সাথে আর-তে খুব কম, নিম্পি / স্কিপি / পান্ডা / সাইকিট-লার্ন / যা-ই হোক না কেন একই ধরণের নিম্ন-স্তরের বাস্তবায়ন রয়েছে। পাইথনের নাম্বা ও সিথনও রয়েছে। এই পয়েন্টটি টাই হওয়া উচিত।
ডগল

8
আপনার জন্য "বিগ ডেটার সাথে ডিলিং" মন্তব্য করার জন্য, আমি যুক্ত করব যে অ্যাপাচি স্পার্ক দ্বারা সমর্থিত 3 টি ভাষার মধ্যে পাইথন অন্যতম, যার দ্রুত গতিতে জ্বলজ্বল রয়েছে। আর সি ব্যাক এন্ড সম্পর্কে আপনার মন্তব্যটি সত্য, তবে অজগরের মতো বিজ্ঞানঘটিত পাঠাগারটিও খুব দ্রুত। আমি মনে করি আপনার পোস্টে ভাল ভারসাম্য রয়েছে, তবে আমি দাবি করি যে গতিটি কমপক্ষে একটি টাই এবং স্কেলাবিলিটি (অর্থাত্ বড় ডেটা পরিচালনা করা) অবশ্যই অজগরটির পক্ষে।
জাগার্টনার

23

"পাইথন ভাল" বা "আর x এর চেয়ে অনেক ভাল" এর মতো কিছুই নেই।

কেবলমাত্র আমি জানি যে শিল্পে প্রচুর লোক অজগরকে আঁকড়ে থাকে কারণ তারা বিশ্ববিদ্যালয়ে শিখেছে। পাইথন সম্প্রদায়টি সত্যই সক্রিয় এবং এমএল এবং ডেটা মাইনিং ইত্যাদির জন্য কয়েকটি দুর্দান্ত ফ্রেমওয়ার্ক রয়েছে etc.

তবে সত্যি কথা বলতে, আপনি যদি একটি ভাল সি প্রোগ্রামার পান তবে তিনি একই কাজ করতে পারবেন লোকেরা পাইথন বা আর-তে করে, যদি আপনি একটি ভাল জাভা প্রোগ্রামার পেয়ে থাকেন তবে তিনি জাভাতেও (কাছাকাছি) সবকিছু করতে পারেন।

সুতরাং আপনি যে ভাষাটির সাথে স্বাচ্ছন্দ্য বোধ করেন কেবল তার সাথেই থাকুন।


5
তবে গ্রন্থাগারগুলির কী হবে? উন্নত আর প্যাকেজ রয়েছে (র্যাঁফম ফরেস্ট বা ক্যারেট ভাবেন) যেগুলি আমাদের সি বা জাভা
সান্তিয়াগো সিপাস

মাহাউট ie জাভা জন্য এলোমেলো বন সমর্থন করে
Johnny000

1
হ্যাঁ হতে পারে, তবে আর বড় সেট ডেটা সংগ্রহের জন্য আপনার প্রয়োজনীয় দক্ষতাটি এনে দেয় না এবং বেশিরভাগ সময় শিল্পের ব্যবহারে আপনার কাছে বেশ বড় ডেটাসেট থাকে।
জনি 1000

1
হ্যাঁ, একজন ভাল প্রোগ্রামার সি তেও একই কাজ করতে পারে তবে একজন অভিজ্ঞ প্রোগ্রামার
সিটিতে

1
আমি মনে করি না যে এটি সর্বদা সত্য @ পিথিকোস অন্তর্নিহিত গণিত সূত্রগুলি দেওয়া, আমি সাধারণত আর বি বা পাইথন লাইব্রেরির জন্য অপ্রয়োজনীয় আরকেন সিনট্যাক্সের সাহায্যে ওয়াডিংয়ের মাধ্যমে ভিবি / টি-এসকিউএল দিয়ে নিজেকে দ্রুত প্রয়োগ করতে পারি। এবং প্রক্রিয়াতে, ফলস্বর কোডটি আরও বেশি পরিমাণে স্কেলযোগ্য করুন। আমি আনন্দিত যে এই গ্রন্থাগারগুলির উপস্থিতি রয়েছে তবে সেগুলির মধ্যে ডাউনসাইডগুলি নির্মিত হয়েছে; কিছু পরিস্থিতিতে এবং নির্দিষ্ট প্রকল্পগুলিতে এগুলিকে বাইপাস করা ভাল।
এসকিউএল সার্ভারস্টিভ

16

কিছু অতিরিক্ত চিন্তা।

প্রোগ্রামিং ভাষা 'প্রতি সে' কেবল একটি সরঞ্জাম। সমস্ত ভাষাগুলি অন্য ধরণের তুলনায় কিছু ধরণের নির্মাণকে আরও সহজ করে তুলতে ডিজাইন করা হয়েছিল। এবং প্রোগ্রামিং ভাষার জ্ঞান এবং দক্ষতা অন্যের তুলনায় সেই ভাষার বৈশিষ্ট্যগুলির চেয়ে বেশি গুরুত্বপূর্ণ এবং কার্যকর।

আমি যতদূর দেখতে পাচ্ছি এই প্রশ্নের দুটি মাত্রা রয়েছে। প্রথম মাত্রা হ'ল দ্রুত গতিতে ধারণা বা মডেলগুলির সন্ধানের জন্য প্রমাণ তৈরির ক্ষমতা, অবশেষে যা চলছে তা অধ্যয়ন করার জন্য পর্যাপ্ত সরঞ্জাম হাতে রয়েছে (যেমন পরিসংখ্যান পরীক্ষা, গ্রাফিক্স, পরিমাপ সরঞ্জাম ইত্যাদি)। এই ধরণের ক্রিয়াকলাপটি সাধারণত গবেষকগণ এবং ডেটা বিজ্ঞানীরা পছন্দ করেন (আমি সর্বদা অবাক হই যে এর অর্থ কী, তবে আমি এই শব্দটি তার আলগা সংজ্ঞা হিসাবে ব্যবহার করি)। তারা সুপরিচিত এবং যাচাইকৃত যন্ত্রগুলির উপর নির্ভর করে, যা প্রমাণ বা যুক্তির জন্য ব্যবহার করা যেতে পারে।

দ্বিতীয় মাত্রা হ'ল সরঞ্জাম, অ্যালগরিদম বা মডেলগুলি প্রসারিত, পরিবর্তন, উন্নতি বা এমনকি তৈরি করার ক্ষমতা। আপনার যথাযথ প্রোগ্রামিং ভাষা প্রয়োজন তা অর্জন করার জন্য। মোটামুটি সবই এক রকম। আপনি যদি কোনও সংস্থার হয়ে কাজ করেন তবে আপনি সংস্থার অবকাঠামো, অভ্যন্তরীণ সংস্কৃতি এবং আপনার পছন্দগুলি উল্লেখযোগ্যভাবে হ্রাস করার উপর নির্ভর করে। এছাড়াও, যখন আপনি উত্পাদন ব্যবহারের জন্য একটি অ্যালগরিদম বাস্তবায়ন করতে চান, তখন আপনাকে বাস্তবায়নে বিশ্বাস করতে হবে। এবং অন্য কোন ভাষায় যা আপনি আয়ত্ত করেন না তা প্রয়োগ করে আপনাকে খুব বেশি সহায়তা করবে না।

আমি প্রথমে আর বাস্তুতন্ত্রের ক্রিয়াকলাপের পক্ষে চাই। আপনার কাছে একটি দুর্দান্ত সম্প্রদায়, সরঞ্জামগুলির একটি বিশাল সেট, প্রমাণ রয়েছে যে এই সরঞ্জামগুলি প্রত্যাশার মতো কাজ করে। এছাড়াও, আপনি পাইথন, অষ্টাভে (কয়েকটি নাম দেওয়ার জন্য) বিবেচনা করতে পারেন, যা নির্ভরযোগ্য প্রার্থী।

দ্বিতীয় কাজের জন্য, আপনাকে কী চাইবে তা আগে আপনাকে ভাবতে হবে। আপনি যদি শক্তিশালী উত্পাদন প্রস্তুত সরঞ্জাম চান, তবে সি / সি ++, জাভা, সি # দুর্দান্ত প্রার্থী। আমি পাইথনকে এই বিভাগের দ্বিতীয় নাগরিক হিসাবে বিবেচনা করি, স্কালা এবং বন্ধুদের সাথে। আমি শিখা যুদ্ধ শুরু করতে চাই না, এটি কেবল আমার মতামত। তবে একজন বিকাশকারী হিসাবে 17 বছরেরও বেশি সময় পরে, আপনি যা ভাবেন তা করার স্বাধীনতার চেয়ে আমি কড়া চুক্তি এবং আমার জ্ঞানকে প্রাধান্য দিই (যেমন প্রচুর গতিশীল ভাষার সাথে এটি ঘটে)।

ব্যক্তিগতভাবে, আমি যতটা সম্ভব শিখতে চাই। আমি স্থির করেছিলাম যে আমাকে কঠোর উপায় বেছে নিতে হবে, যার অর্থ নিজে থেকে স্ক্র্যাচ থেকে সবকিছু বাস্তবায়ন করা। আমি আর মডেল এবং অনুপ্রেরণা হিসাবে ব্যবহার করি। এটিতে গ্রন্থাগারগুলিতে দুর্দান্ত কোষাগার রয়েছে এবং প্রচুর অভিজ্ঞতা নিঃসৃত হয়েছে। তবে প্রোগ্রামিং ল্যাঙ্গুয়েজ হিসাবে আরটি আমার জন্য দুঃস্বপ্ন। তাই আমি জাভা ব্যবহার করার সিদ্ধান্ত নিয়েছি এবং কোনও অতিরিক্ত লাইব্রেরি ব্যবহার করব না। এটি কেবল আমার অভিজ্ঞতার কারণে এবং অন্য কিছুই নয়।

আপনার যদি সময় থাকে তবে আপনি যা করতে পারেন তা হ'ল এই সমস্ত কিছু নিয়ে কিছু সময় ব্যয় করা। এইভাবে আপনি নিজের জন্য উপযুক্ত উপযুক্ত উত্তরটি নিজের জন্য উপার্জন করবেন। ডিজকસ્ત્રা একবার বলেছিলেন যে সরঞ্জামগুলি আপনার চিন্তাভাবনাটিকে প্রভাবিত করে, সুতরাং আপনার কীভাবে আপনি কী ভাবছেন তা মডেল করতে দেওয়ার আগে আপনার সরঞ্জামগুলি জানার পরামর্শ দেওয়া হচ্ছে। আপনি তার প্রবন্ধে দ্য হামল প্রোগ্রামার নামক বিখ্যাত পেপারে সে সম্পর্কে আরও পড়তে পারেন


15

এখনও অবধি অন্যেরা যা বলেছে তাতে আমি যুক্ত করব। একক উত্তর নেই যে একটি ভাষা অন্য ভাষার চেয়ে ভাল।

এই বলে যে, ডেটা অনুসন্ধান এবং শেখার জন্য আর এর একটি ভাল সম্প্রদায় রয়েছে। এটির বিশাল দৃশ্যধারণ ক্ষমতা রয়েছে। অন্যদিকে পাইথন পান্ডার প্রবর্তনের পর থেকে ডেটা হ্যান্ডলিংয়ে আরও ভাল হয়ে উঠেছে। আর (আর নিম্ন স্তরের ভাষা হওয়ায়) তুলনায় পাইথনে শেখা ও বিকাশের সময় খুব কম।

আমি মনে করি এটি শেষ পর্যন্ত আপনার ইকো সিস্টেম এবং ব্যক্তিগত পছন্দগুলিতে স্ফীত হয়। আরও বিশদের জন্য আপনি এই তুলনাটি এখানে দেখতে পারেন ।


2
"[...] শেখার জন্য আর একটি উন্নত সম্প্রদায় রয়েছে" - আমি অনুমান করি এটি শেখার ধরণের উপর নির্ভর করে। আর-তে নিউরাল নেটওয়ার্কগুলি (স্বেচ্ছাসেবক ফিড-ফরোয়ার্ড আর্কিটেকচার, সিএনএন, আরএনএন) দিয়ে কত চলছে?
মার্টিন থোমা

1
আর আসলেই সেই "নিম্ন স্তরের" আইএমও নয়। এটি একটি গতিশীল ভাষাও।
এক্সজি

12

কোনও রূপালী বুলেট ভাষা নেই যা প্রতিটি ডেটা সম্পর্কিত সমস্যা সমাধানের জন্য ব্যবহার করা যেতে পারে। ভাষার পছন্দটি সমস্যা, তথ্যের আকারের প্রসঙ্গে এবং যদি আপনি কোনও কর্মক্ষেত্রে কাজ করে থাকেন তবে আপনাকে যা ব্যবহার করে তা আটকে থাকতে হবে depends

ব্যক্তিগতভাবে আমি পাইথনের চেয়ে বেশি বার আর এর ব্যবহারের লাইব্রেরি এবং ইন্টারেক্টিভ স্টাইলের কারণে ব্যবহার করি। তবে যদি আমার আরও কর্মক্ষমতা বা কাঠামোগত কোডের প্রয়োজন হয় তবে আমি অবশ্যই পাইথনটি ব্যবহার করি কারণ এর মধ্যে সায়কিট-লার্ন, ন্যাপি, স্কিপি ইত্যাদির মতো কয়েকটি সেরা গ্রন্থাগার রয়েছে my

সুতরাং আপনি যদি ডেটা বিজ্ঞানের কাজ শুরু করেন তবে আমি আপনাকে উভয়টি শিখতে পরামর্শ দিচ্ছি এবং এটি কঠিন নয়, কারণ পাইথনও পান্ডাদের সাথে আর-তে অনুরূপ ইন্টারফেস সরবরাহ করে ।

যদি আপনাকে আরও বৃহত্তর ডেটাসেটগুলি মোকাবেলা করতে হয় তবে আপনি জাভা (হ্যাডোপ, পিগ, হবেস ইত্যাদি) দিয়ে নির্মিত ইকো-সিস্টেমগুলি এড়াতে পারবেন না।


8

এখানে "আরও ভাল" ভাষা নেই। আমি তাদের দু'জনের চেষ্টা করেছি এবং আমি পাইথন নিয়ে আরামদায়ক তাই আমি কেবল পাইথনের সাথেই কাজ করি। যদিও আমি এখনও স্টাফ শিখছি, তবে পাইথনের সাথে এখন পর্যন্ত আমার কোনও রাস্তাঘাটের মুখোমুখি হয়নি। পাইথন সম্প্রদায় সম্পর্কে ভাল জিনিসটি খুব ভাল এবং আপনি সহজেই ইন্টারনেটে প্রচুর সহায়তা পেতে পারেন। তা বাদে, আমি বলতে চাই যে ভাষা আপনি পছন্দ করেন না সেই ভাষায় যান people


8

আমার অভিজ্ঞতায় উত্তরটি হাতের প্রকল্পের উপর নির্ভর করে। খাঁটি গবেষণার জন্য, আমি দুটি কারণে আরকে পছন্দ করি: 1) গ্রন্থাগারের বিস্তৃত এবং 2) তথ্য বিজ্ঞানের সাহিত্যের বেশিরভাগ ক্ষেত্রে আর নমুনাগুলি অন্তর্ভুক্ত।

যদি লাইপারসনগুলির দ্বারা প্রকল্পটি ব্যবহার করার জন্য একটি ইন্টারেক্টিভ ইন্টারফেসের প্রয়োজন হয় তবে আমি আর খুব সীমাবদ্ধ বলে খুঁজে পেয়েছি। চকচকে একটি দুর্দান্ত শুরু, তবে এটি এখনও যথেষ্ট নমনীয় নয়। এই ক্ষেত্রেগুলিতে আমি আমার আর কাজটি পাইথন বা জেএসে পোর্ট করা শুরু করব।


8

অন্যান্য সমস্ত উত্তর সম্বোধন করতে ব্যর্থ একটি বিষয় লাইসেন্সিং

উল্লিখিত বিস্ময়কর আর-র লাইব্রেরিগুলির বেশিরভাগ হ'ল জিপিএল (উদাঃ ggplot2 , ডেটা টেবিল )। এটি আপনাকে সফ্টওয়্যারকে স্বত্বাধিকারী আকারে বিতরণ করা থেকে বাধা দেয়

যদিও এই লাইব্রেরির অনেকগুলি ব্যবহার সফ্টওয়্যার বিতরণকে বোঝায় না (যেমন মডেলগুলিকে অফলাইনে প্রশিক্ষণ দেওয়ার জন্য), জিপিএল নিজেই সংস্থাগুলি তাদের ব্যবহার থেকে বিরত রাখতে পারে। আমার অভিজ্ঞতা অন্তত।

অন্যদিকে পাইথন রাজ্যে, বেশিরভাগ লাইব্রেরিতে বিএসডি বা এমআইটি-র মতো ব্যবসায় বান্ধব বিতরণ লাইসেন্স রয়েছে।

একাডেমিয়ায়, লাইসেন্সিংয়ের বিষয়গুলি সাধারণত নন-ইস্যু।


7

সরবরাহ করা মন্তব্যে যোগ করার মতো বেশি নয়। কেবলমাত্র তথ্যটি বিজ্ঞানের প্রয়োজনের জন্য আর বনাম পাইথনের তুলনা করা এই ইনফোগ্রাফিকটিই হতে পারে http://blog.datacamp.com/r-or-python-for-data-analysis/


6

সত্যিকারের চ্যালেঞ্জগুলির মধ্যে একটি, আমি আর এর মুখোমুখি হলাম বিভিন্ন সংস্করণগুলির সাথে সামঞ্জস্যপূর্ণ বিভিন্ন প্যাকেজগুলি .. বেশিরভাগ আর প্যাকেজ আর এর সর্বশেষ সংস্করণের জন্য উপলভ্য নয় And সংস্করণ ..


3
আমি নিশ্চিত নই যে এটি আর এর ক্ষেত্রে একটি বিশেষ সমস্যা, বা এটি পাইথন এবং আর-এর পার্থক্য কীভাবে এই প্রশ্নের জবাব দেয়।
শন

5

আমি আর চেষ্টা করিনি (ভাল, কিছুটা হলেও ভাল তুলনা করার পক্ষে যথেষ্ট নয়)। তবে পাইথনসের কয়েকটি শক্তি এখানে রয়েছে:

  • খুব স্বজ্ঞাত সিনট্যাক্স : tuple আন-প্যাক, element in a_list, for element in sequence, matrix_a * matrix_b(ম্যাট্রিক্স গুণ জন্য), ...
  • অনেক গ্রন্থাগার :
    • স্কিপি : বৈজ্ঞানিক গণনা; এর বেশিরভাগ অংশই কেবল বেশ দ্রুত ফোর্টরান কোডের জন্য মোড়ানো
    • থিয়ানো > লাসাগন > নোলার্ন : নিউরাল নেটওয়ার্কগুলির জন্য গ্রন্থাগারগুলি - তাদের কোনও সংশোধন ছাড়াই জিপিইউতে প্রশিক্ষণ দেওয়া যেতে পারে ( এনভিডিয়া , সিউডিএ প্রয়োজন)
    • sklearn : সাধারণ শেখার অ্যালগরিদম
  • ভাল সম্প্রদায় :
  • আইপিথন নোটবুক
  • বিবিধ :
    • 0-ইনডেক্সেড অ্যারে ... আমি আর এর সাথে সর্বদা ত্রুটি করেছি made
    • প্রতিষ্ঠিত প্যাকেজ কাঠামো
    • আপনার কোড পরীক্ষার জন্য ভাল সমর্থন

3

আমি আরথার চেয়ে পাইথন পছন্দ করি কারণ পাইথন একটি সম্পূর্ণ প্রোগ্রামিং ল্যাঙ্গুয়েজ তাই আমি মেশিন লার্নিংয়ের কাজ শেষ করতে পারি যেমন পাইথনে লিখিত এইচটিটিপি সার্ভার ব্যবহার করে ডেটা সংগ্রহ করা, উন্নত এমএল কার্য সম্পাদন করতে এবং তারপরে অনলাইনে ফলাফল প্রকাশ করা। পাইথনে এটি করা যেতে পারে। আমি আসলে খুঁজে পেয়েছি আর শিখার পক্ষে আরও শক্ত হতে এবং পাইথন শেখার পেমেন্টগুলি আরও বেশি কারণ এটি কোনও প্রোগ্রামিংয়ের কাজে ব্যবহার করা যেতে পারে।


2
আপনি এই সমস্ত 3 টি খুব সহজেই আর
গাইস

2

আর: আর ওপেন সোর্স কাউন্টার পার্ট। যা traditionতিহ্যগতভাবে শিক্ষাবিদ এবং গবেষণায় ব্যবহৃত হয়েছে। ওপেন সোর্স প্রকৃতির কারণে, সর্বশেষ কৌশলগুলি দ্রুত মুক্তি পায়। ইন্টারনেটে প্রচুর ডকুমেন্টেশন উপলব্ধ এবং এটি একটি খুব সাশ্রয়ী মূল্যের বিকল্প। পাইথন: ওপেন সোর্স স্ক্রিপ্টিং ভাষা হিসাবে উদ্ভবের সাথে সাথে পাইথনের ব্যবহার সময়ের সাথে সাথে বৃদ্ধি পেয়েছে। আজ, এটি গ্রন্থাগারগুলি (নম্পী, স্কিপি এবং ম্যাটপ্ল্লোটিব) এবং আপনি যে কোনও পরিসংখ্যানমূলক অপারেশন / মডেল বিল্ডিংয়ের জন্য কাজ করতে পারেন তার জন্য কাজ করে। পান্ডার প্রচলনের পর থেকে, এটি কাঠামোগত ডেটার ক্রিয়াকলাপে খুব শক্তিশালী হয়ে উঠেছে।

পাইথন কোড

আমদানি গ্রন্থাগার

অন্যান্য প্রয়োজনীয় লাইব্রেরি যেমন পান্ডা, নম্পী আমদানি করুন ...

স্কলারন আমদানি লিনিয়ার_মডেল থেকে

ট্রেন এবং পরীক্ষার ডেটাসেটগুলি লোড করুন

বৈশিষ্ট্য এবং প্রতিক্রিয়া ভেরিয়েবল (গুলি) সনাক্ত করুন এবং মানগুলি অবশ্যই সংখ্যাসূচক এবং অদ্ভুত অ্যারে

এক্স_ট্রেইন = ইনপুট_ভেরিয়েবলস_ভ্যালু_ট্রেইনিং_ড্যাটসেটস_ট্রেইন = টার্গেট_ভেরিয়েবলস_ভ্যালু_ট্রেইনিং_ড্যাটাসেটস

লিনিয়ার রিগ্রেশন অবজেক্ট তৈরি করুন

লিনিয়ার = লিনিয়ার_মডেল.লাইনারআগ্রেশন ()

প্রশিক্ষণ সেট এবং চেক স্কোর ব্যবহার করে মডেলটিকে প্রশিক্ষণ দিন

লিনিয়ার.ফিট (x_train, y_train) লিনিয়ার.স্কোর (x_train, y_train)

সমীকরণ সহগ এবং ইন্টারসেপ্ট

মুদ্রণ ('সহগ: \ n', লিনিয়ার.coef_) মুদ্রণ ('ইন্টারসেপ্ট: \ n', লিনিয়ার ইন্টিসেপ্ট_)

পূর্বাভাস আউটপুট

পূর্বাভাস = লিনিয়ার.প্রেডিক্ট (এক্স_স্টেস্ট) আর কোড

ট্রেন এবং পরীক্ষার ডেটাসেটগুলি লোড করুন

বৈশিষ্ট্য এবং প্রতিক্রিয়া ভেরিয়েবল (গুলি) সনাক্ত করুন এবং মানগুলি অবশ্যই সংখ্যাসূচক এবং অদ্ভুত অ্যারে

এক্স_টেন <

প্রশিক্ষণ সেট এবং চেক স্কোর ব্যবহার করে মডেলটিকে প্রশিক্ষণ দিন

লিনিয়ার <- lm (y_train ~।, ডেটা = এক্স) সারাংশ (রৈখিক)

পূর্বাভাস আউটপুট

পূর্বাভাস = পূর্বাভাস (লিনিয়ার, এক্স_স্টেট)



0

এখানে চিত্র বর্ণনা লিখুন

আমি এই ছবিটি একটি লিঙ্কডিন পোস্টে পেয়েছি। যখনই পাইথন বা আর ব্যবহার করার বিষয়ে আমার সন্দেহ হয়, আমি এটি সন্ধান করি এবং এটি খুব দরকারী বলে প্রমাণিত।


তাহলে আপনি কি নির্বাচন করবেন?
সেরিহি পোলিশচুক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.