ক্লোজার জুম বনাম: ডেটা বিশ্লেষণের জন্য সুবিধা এবং অসুবিধা


39

আমার অদূর ভবিষ্যতে আর শেখার পরিকল্পনা ছিল। পড়া অপর এক প্রশ্নের আমি Clojure সম্পর্কে খুঁজে পাওয়া যায় নি। এখন কি করতে হবে জানি না।

আমি মনে করি আমার কাছে আর এর বড় সুবিধা হ'ল অর্থনীতিতে কিছু লোক এটি ব্যবহার করে, আমার একজন সুপারভাইজার সহ (যদিও অন্যজন বলেছেন: আর থেকে দূরে থাকুন!)। ক্লোজেরের একটি সুবিধা হ'ল এটি লিস্প-ভিত্তিক, এবং যেহেতু আমি ইমাকস শিখতে শুরু করেছি এবং আমি নিজের নিজস্ব কাস্টমাইজেশন লিখতে আগ্রহী তাই এটি সহায়ক হবে (হ্যাঁ, আমি জানি ক্লোজুর এবং এলিস্প লিস্পের বিভিন্ন উপভাষা, তবে সেগুলি হ'ল) উভয় লিস্প এবং এইভাবে অনুরূপ আমি কল্পনা করব)।

আমি কোনটি ভাল তা জিজ্ঞাসা করতে পারি না, কারণ আমি জানি এটি খুব ব্যক্তিগত, তবে কেউ কি ক্লোজুরে এক্স আর এর সুবিধা (বা সুবিধা) বিশেষত ব্যবহারিক দিক দিয়ে আমাকে দিতে পারেন? উদাহরণস্বরূপ, কোনটি শিখতে সহজ হওয়া উচিত, কোনটি আরও নমনীয় বা আরও শক্তিশালী, কোনটির আরও বেশি গ্রন্থাগার রয়েছে, আরও সমর্থন রয়েছে, আরও ব্যবহারকারী রয়েছে ইত্যাদি?

আমার উদ্দেশ্যযুক্ত ব্যবহার : আমার অনুমানের বেশিরভাগ অংশ মাতলাব ব্যবহার করে করা উচিত, সুতরাং আমি পরিসংখ্যানগত বিশ্লেষণের দিক থেকে খুব গভীর কিছু খুঁজছি না, বরং প্রাথমিক ডেটা ম্যানিপুলেশন এবং ভিজ্যুয়ালাইজেশন, সংক্ষিপ্ত পরিসংখ্যান এবং চার্টিংয়ের জন্য এক্সেলের পরিবর্তে একটি সফ্টওয়্যার, তবে কিছু প্রাথমিক পরিসংখ্যান বিশ্লেষণ বা আমার অনুমানের প্রাথমিক প্রচেষ্টা attempts


10
আপনি যদি আর এর স্বাদ গ্রহণ করেন তবে আপনারা ম্যাটল্যাব থেকে পদত্যাগ করবেন (আমার ক্ষেত্রে যেমন হবে) তবে অত্যন্ত সম্ভাবনা।

আইএমও, এটি সম্প্রদায়ের উইকি হওয়া উচিত (ভাষা "বনাম" টাইপ প্রশ্নগুলি বেশ বিষয়গত)।
শেন

এটি অবশ্যই প্রোগ্রামিং ভাষা সম্পর্কিত একটি প্রশ্ন এবং স্ট্যাক ওভারফ্লোতে জিজ্ঞাসা করা উচিত।
শার্পি

আমি শার্পির সাথে একমত @ ভিভি: আপনার প্রশ্নের শিরোনামটি "ডেটা মংগিংয়ের সুবিধাগুলি এবং অসুবিধাগুলি" বা সেই লাইনের পাশাপাশি কিছুতে পরিবর্তন করা উচিত যাতে এটি আরও অনন্য বিষয়।
শেন

5
@ শার্পি, @ শ্যান আইএমও এই পরিমাণে এটি সরঞ্জাম সম্পর্কে একটি প্রশ্ন, তাই এটি গ্রহণযোগ্য।

উত্তর:


27

আমাকে দু'টি ভাষাতেই ভালবাসার কথাটি বলতে শুরু করুন: আপনি কোনওটি দিয়েই ভুল করতে পারবেন না, এবং ডেটা বিশ্লেষণ করার জন্য সে অবশ্যই সি ++ বা জাভা জাতীয় কিছু থেকে ভাল।

বেসিক ডেটা বিশ্লেষণের জন্য আমি আর (বিশেষত প্লাইয়ার সহ) পরামর্শ দেব। ক্লোজুরের চেয়ে আইএমও, আর কিছুটা শিখতে সহজ, যদিও ক্লোজিউর লিস্পের উপর ভিত্তি করে এবং এটি প্রচুর চমত্কার লিস্প সংস্থান উপলব্ধ রয়েছে (যেমন এসআইসিপি ) this ক্লোজুরেতে কী-ওয়ার্ড কম রয়েছে তবে লাইব্রেরিগুলি ইনস্টল করা এবং এর সাথে কাজ করা আরও অনেক বেশি কঠিন। এছাড়াও, মনে রাখবেন যে আর (বা এস) মূলত স্কিম থেকে উদ্ভূত, সুতরাং এটি ব্যবহার করার সময় আপনি লিস্প জ্ঞান থেকে উপকৃত হবেন।

সাধারণভাবে:

আরআর এর প্রধান সুবিধা হ'ল সিআরএএন-এর সম্প্রদায় (2461 টিরও বেশি প্যাকেজ এবং গণনা)। মাতলাবের মতো বাণিজ্যিক অ্যাপ্লিকেশন নয়, অদূর ভবিষ্যতে কিছুই এর সাথে তুলনা করবে না।

জেভিএমে চলার ক্লোজারের বড় সুবিধা রয়েছে যার অর্থ এটি যে কোনও জাভা ভিত্তিক লাইব্রেরি অবিলম্বে ব্যবহার করতে পারে।

আমি যুক্ত করব যে আমি কিছুক্ষণ আগে আরজে ক্লোজার / ইনকান্টার সম্পর্কিত একটি বক্তব্য দিয়েছি , যাতে আপনি এটি আগ্রহী হতে পারেন। এটি তৈরি করার বিষয়ে আমার অভিজ্ঞতা হিসাবে, ক্লোজুর সাধারণ অপারেশনের জন্য আর এর চেয়ে সাধারণত ধীর ছিল।


11

আমি গত 6-7 বছর ধরে ভারী আর ব্যবহারকারী হয়েছি। ভাষা হিসাবে এটির বেশ কয়েকটি ডিজাইনের সীমাবদ্ধতা রয়েছে। তবুও, একনোমেট্রিক্সে এবং ডেটা বিশ্লেষণে কাজের জন্য, আমি এখনও আন্তরিকভাবে এটির প্রস্তাব দিই। এটিতে প্রচুর পরিমাণে প্যাকেজ রয়েছে যা আপনার অর্থনীতি, সময় সিরিজ, ভোক্তা পছন্দ মডেলিং ইত্যাদির জন্য প্রাসঙ্গিক এবং অবশ্যই দুর্দান্ত ভিজ্যুয়ালাইজেশন, ভাল বীজগণিত এবং সংখ্যাযুক্ত লাইব্রেরি ইত্যাদির জন্য প্রাসঙ্গিক হবে আমি ডেটা আকারের সীমাবদ্ধতা সম্পর্কে খুব বেশি চিন্তা করব না। যদিও আর "বিগ ডেটা" এর জন্য ডিজাইন করা হয়নি (এর বিপরীতে, এসএএস বলুন) এর চারপাশে উপায় রয়েছে। প্যাকেজগুলির প্রাপ্যতা হ'ল আসলে কী পার্থক্য করে।

আমি কেবল ক্লজুরের ভাষার চশমা পড়েছি এবং এটি সুন্দর এবং পরিষ্কার। এটি একটি প্রাকৃতিক উপায়ে সমান্তরালতা এবং স্কেল সম্পর্কিত বিষয়গুলিকে সম্বোধন করে। এবং যদি আপনার কাছে কিছু বেসিক জাভা বা ওওপি জ্ঞান থাকে তবে আপনি প্রচুর পরিমাণে উচ্চ মানের জাভা গ্রন্থাগারগুলি থেকে উপকৃত হতে পারেন।

ক্লোজারের সাথে আমার যে সমস্যাটি রয়েছে তা হ'ল সাম্প্রতিক ওয়ান-ম্যান (আর। হিক্কি) অপারেশন, অতএব 1) খুব ঝুঁকিপূর্ণ 2) খুব অপরিপক্ক 3) কুলুঙ্গি গ্রহণের সাথে। উত্সাহী, প্রথমদিকে গ্রহণকারী, সিএস / এমএল লোকদের জন্য দুর্দান্ত যারা নতুন জিনিস চেষ্টা করতে চান for যে ব্যবহারকারী কোনও ভাষা শেষের মাধ্যম হিসাবে দেখেন এবং যার পক্ষে খুব দৃust় কোডের প্রয়োজন হয় যা অন্যের সাথে ভাগ করে নেওয়া যায় কোডটি, প্রতিষ্ঠিত ভাষাগুলি একটি নিরাপদ পছন্দ বলে মনে হয়। শুধু আপনি কে জানেন।


+1 দুর্দান্ত উত্তর। কিছুক্ষণ আগে আমার একই রকম বিতর্ক হয়েছিল কারণ আমি ইনক্যান্টারের দ্বারা আগ্রহী ছিলাম (এবং কিছু জাভা কোডিং করেছি)। এটি স্পষ্ট ছিল যে পরিসংখ্যানমূলক কাজটি দ্রুত সম্পন্ন করার জন্য আর ভাষা ব্যবহার করার সময় ক্লোজিউর কম্পিউটার বিজ্ঞানীর মতো আরও বেশি ভাবার জন্য ব্যবহার করার ভাষা ছিল। স্পষ্টতই ওভারল্যাপ রয়েছে তবে আপনি যেমন বলছেন "আপনি কে তা জানেন"।
জোশ হেম্যান

এসএএস এত পুরানো যে এটি মূলত খোঁচা কার্ডগুলিতে ছড়িয়েছিল, অতএব এটির বিশ্রী এবং প্রত্নতাত্ত্বিক বাক্য গঠন। এর "বিগ ডেটা ডিজাইন" এর কিছু পরিমাণ হ'ল মূক ভাগ্য যে এটি মূলত "মেইনফ্রেমস" এ চালানোর জন্য ডিজাইন করা হয়েছিল যা আপনার ফোনের তুলনায় কম স্মৃতিযুক্ত ছিল এবং যা ইনপুট ডেটাতে খোঁচা কার্ড ব্যবহার করেছিল। আমি এটি বলব না যে এটি বিগ ডেটার জন্য "ডিজাইন" করা হয়েছে, যদিও এটি ভালভাবে পরিচালিত হয়।
ওয়েন

২০১১ সালে ক্লোজুরে সম্পর্কে যখন আমি প্রথম শুনেছিলাম তখন আমার একই রকম উদ্বেগ ছিল। 2014 সালে আমি এখন তা করি না Clo ক্লোজার এবং এর সম্প্রদায় মোটামুটি পরিপক্ক এবং এটি আশ্চর্যরকমভাবে জনপ্রিয় (সর্বোপরি এটি একটি অ-ওও, কার্যকরী, লিস্প)। যাইহোক, আমি বিশ্বাস করি না যে ইনকান্টার কখনই প্যাকেজের সংখ্যায় R কে ধরবে (সাধারণত, যদি আপনি এটির জন্য চিন্তা করতে পারেন তবে এটি ইতিমধ্যে সম্পন্ন হয়ে গেছে)। জেআরআই জাভা-আর ইন্টারফেসের উপর ভিত্তি করে ক্লোজার লাইব্রেরি রিনক্যান্টার রয়েছে, তবে এটি ব্যবহার করা কতটা সহজ তা আমি নিশ্চিত নই।
মঙ্গলবার

5

আপডেট (আগস্ট ২০১৪): নীচে @ নিখুঁত মন্তব্য হিসাবে, আর সংস্করণ 3.0.০.০ হিসাবে সীমাগুলি বেশি এবং এর অর্থ আর বৃহত্তর ডেটাসেট পরিচালনা করতে সক্ষম।

এখানে একটি ডেটা পয়েন্ট: আর এর একটি "বিগ ডেটা সিলিং" রয়েছে , আপনি বিশাল ডেটা সেট নিয়ে কাজ করার পরিকল্পনা করছেন কিনা তা জানতে দরকারী।

আমি নিশ্চিত নই যে একই সীমাবদ্ধতা ক্লোজার / ইনকান্টারের ক্ষেত্রে প্রযোজ্য কিনা, এটি আর কে ছাড়িয়ে দেয় বা আসলে আরও খারাপ। আমি কল্পনা করেছি যে জেভিএম সম্ভবত বড় ডেটাসেটগুলি পরিচালনা করতে পারে, বিশেষত যদি আপনি ক্লোজুরের অলস বৈশিষ্ট্যের শক্তিকে ব্যবহার করতে পরিচালনা করেন।


1
আর অলস মূল্যায়নও হয়।

3
@ এমবিকিউ: আপনার মন্তব্য বিভ্রান্ত করছে। আর অলসভাবে একটি ফাংশন সংজ্ঞাতে ভেরিয়েবলগুলি মূল্যায়ন করে তবে "অলসতা" স্বাভাবিক আচরণ নয়। ভেরিয়েবলের অ্যাসাইনমেন্টটির সাহায্যে দোভাষীকে অলস হতে বলে ফাংশন বিলম্বএসাইন () উপস্থিত রয়েছে, তবে কোনও ডেটা স্ট্রাকচার সেই ভেরিয়েবলের দিকে নির্দেশ করার পরে দোভাষী তার মূল্যায়ন করা দরকার কি না, তা মূল্যায়ন করে দেবে। আরও, বাণিজ্যিক আর সংস্থা বিপ্লব বিশ্লেষণকে "বিগ ডেটা" বিশ্লেষণে আর ব্যবহারের জন্য তাদের বিপণন সমর্থন করার জন্য একটি আইট্রেটর অবজেক্ট তৈরি করতে হয়েছিল।
জোশ হেম্যান

আমি মনে করি এই উত্তরটি আপডেট করা উচিত। আর 3.0.0 সাল থেকে, আর নেই না 2 ^ 31-1 উপাদান একটা সীমা আর আছে। সীমাটি 2 ^ 63-1 (আমি বিশ্বাস করি) এবং অ্যারের প্রতিটি মাত্রায় 2 ^ 31-1 নয় । এটি এটিকে মেমরির বৃহত বস্তুর জন্য উপযুক্ত করে তোলে।
28
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.