স্কালা ব্যবহার করে ডেটা বিজ্ঞানের সরঞ্জাম Tools


15

আমি জানি স্পার্ক সম্পূর্ণরূপে স্কালার সাথে একীভূত। এটি ব্যবহারের ক্ষেত্রে বিশেষত বড় ডেটা সেটগুলির জন্য। অন্য কোন সরঞ্জামগুলির মধ্যে ভাল স্কালার সমর্থন রয়েছে? বৃহত্তর ডেটা সেটের জন্য স্কেলা কি সবচেয়ে উপযুক্ত? বা এটি ছোট ডেটা সেটগুলির জন্যও উপযুক্ত?


2
আপনি কি যেমন মেশিন লার্নিং টুলকিট যেমন যেমন ফ্যাক্টরি সম্পর্কে জানতে চান?
এরিক কাপলুন

এটি আমার প্রশ্নের সাথে প্রাসঙ্গিক বলে মনে হচ্ছে, আরও ভাগ করে নির্দ্বিধায়।
শেলডোনক্রেজার

উত্তর:


11

পুন: তথ্য আকার

সংক্ষিপ্ত উত্তর

স্কালা ছোট এবং বৃহত উভয় ডেটার জন্যই কাজ করে তবে এর তৈরি এবং বিকাশযোগ্য কিছু স্কেলেযোগ্যের প্রয়োজনের দ্বারা প্রেরণা পায়। স্কেলা হ'ল "স্কেলেবল ভাষা" এর একটি সংক্ষিপ্ত রূপ

দীর্ঘ উত্তর

স্কালা একটি কার্যকর প্রোগ্রামিং ভাষা যা জেভিএম-এ চলে । এর 'কার্যকরী' অংশটি ভাষার একটি মৌলিক পার্থক্য যা আপনাকে প্রোগ্রামিং সম্পর্কে আলাদাভাবে ভাবতে বাধ্য করে। আপনি যদি ভাবনার এই পদ্ধতিটি পছন্দ করেন তবে এটি আপনাকে ছোট ডেটা দিয়ে দ্রুত কাজ করতে দেয়। আপনার এটি পছন্দ হোক বা না হোক, কার্যকরী ভাষাগুলি মূলত বৃহত্তর আকারে সহজ easier Jvm টুকরাটিও গুরুত্বপূর্ণ কারণ jvm মূলত সর্বত্র এবং সুতরাং, স্কাল কোডটি মূলত সর্বত্র চলতে পারে। (দ্রষ্টব্য jvm এ প্রচুর পরিমাণে অন্যান্য ভাষা লেখা আছে এবং প্রচুর অন্যান্য কার্যকরী প্রোগ্রামিং ভাষা রয়েছে , এবং স্কালার বাইরেও দুটি ভাষা উভয় তালিকায় উপস্থিত রয়েছে))

এই আলোচনা স্কালার পিছনে অনুপ্রেরণার একটি ভাল ওভারভিউ দেয়।

পুনরায়: অন্যান্য সরঞ্জামগুলিতে ভাল স্কেল সমর্থন রয়েছে:

যেমনটি আপনি উল্লেখ করেছেন, স্পার্ক (বিতরণযোগ্য ব্যাচের প্রক্রিয়াকরণটি এর সমকক্ষের তুলনায় পুনরাবৃত্ত আলগোরিদিমগুলিতে আরও ভাল) big স্পার্ক সঙ্গে তার লাইব্রেরি আসে Mllib মেশিন লার্নিং এবং জন্য GraphX গ্রাফ জন্য। এরিক অলিক এবং ট্রিস নেফজারের হিসাবে উল্লেখ করা হয়েছে, আক্কা এবং ফ্যাক্টরির উপস্থিতি রয়েছে। রয়েছে প্লে

সাধারণত, আপনি যদি খোঁজেন যে কোনও নির্দিষ্ট ব্যবহারের কেস রয়েছে তা আমি বলতে পারি না (যদি তা হয় তবে এটি আপনার প্রশ্নের একটি অংশ করুন), বা কেবল বড় ডেটা সরঞ্জামগুলির একটি সমীক্ষা চান এবং স্ক্যালাকে কিছুটা জানতে চান এবং চান সেখানে শুরু করতে।


5

ScalaNLP মেশিন লার্নিংয়ের একটি স্যুট এবং সাধারণ প্রাকৃতিক ভাষা প্রক্রিয়াকরণ কাজের জন্য সমর্থনযুক্ত সংখ্যামূলক কম্পিউটিং লাইব্রেরি। http://www.scalanlp.org/

ডেটা সায়েন্সের জন্য স্কালা লাইব্রেরির একটি নতুন আপডেট হওয়া তালিকা এখানে রয়েছে: https://www.datasciencecentral.com/profiles/blogs/top-15-scala-libraries- for-data-sज्ञान-in-2018-1


4

স্কালার স্রষ্টা মার্টিন ওডারস্কির উপস্থাপনা শুনে, অবজেক্ট অরিয়েন্টেশন এবং ফ্লিক্সিবল সিনট্যাক্সের সাথে মিল রেখে ফাংশনাল প্রোগ্রামিং কনস্ট্রাক্টসকে কাজে লাগিয়ে অত্যন্ত স্কেলযোগ্য সিস্টেম তৈরির জন্য এটি বিশেষভাবে উপযুক্ত। এটি ছোট সিস্টেমগুলির বিকাশ এবং দ্রুত প্রোটোটাইপিংয়ের জন্যও দরকারী কারণ এটি অন্যান্য কয়েকটি ভাষার তুলনায় কোডের কম লাইন গ্রহণ করে এবং দ্রুত প্রতিক্রিয়া জানাতে এটি একটি ইন্টারেক্টিভ মোড রয়েছে। একটি উল্লেখযোগ্য স্কাল কাঠামো আক্কা যা সমবর্তী গণনার অভিনেতার মডেল ব্যবহার করে। ওডারস্কির অনেকগুলি উপস্থাপনা ইউটিউবে রয়েছে এবং উইকি.স্কালা-lang.org এ স্কালার সাথে প্রয়োগ করা সরঞ্জামগুলির একটি তালিকা রয়েছে।

একটি অন্তর্নিহিত বিষয় হ'ল স্কালায় লিখিত সরঞ্জামগুলি এবং ফ্রেমওয়ার্কগুলিতে সহজাতভাবে স্কাল একীকরণ এবং সাধারণত একটি স্কালা এপিআই থাকে। এরপরে জাভা দিয়ে শুরু হওয়া অন্যান্য ভাষাগুলি সমর্থন করার জন্য অন্যান্য এপিআইগুলি যুক্ত করা যেতে পারে যেহেতু স্কালা ইতিমধ্যে ইন্টিগ্রেটেড এবং আসলে সমালোচকভাবে জাভার উপর নির্ভরশীল। যদি কোনও সরঞ্জাম বা কাঠামো স্কালায় না লেখা থাকে তবে এটি স্কালার পক্ষে কোনও সমর্থন সরবরাহের সম্ভাবনা কম। সে কারণেই আপনার প্রশ্নের উত্তরে আমি স্কালা এবং স্পার্কে লেখা সরঞ্জাম এবং ফ্রেমওয়ার্কের দিকে ইঙ্গিত করেছি one যাইহোক, স্কালার বর্তমানে বাজারের একটি সামান্য অংশ রয়েছে তবে এটির গ্রহণের হার ক্রমবর্ধমান এবং স্পার্কের উচ্চ বৃদ্ধির হার এটি বাড়িয়ে তুলবে। আমি স্কালা ব্যবহার করার কারণটি হ'ল স্কালার জন্য স্পার্কের এপিআই জাভা এবং পাইথন এপিআইয়ের চেয়ে সমৃদ্ধ।

আমি স্ক্যালাকে সাধারণত পছন্দ করি তার প্রধান কারণ হ'ল এটি জাভার চেয়ে অনেক বেশি প্রকাশ্য কারণ এটি বস্তু ও মান হিসাবে সামঞ্জস্যপূর্ণরূপে বজায় রাখা এবং জাভার তুলনায় কম কম কোড সহ জটিল এবং সঠিক প্রোগ্রামগুলির বিকাশকে সক্ষম করে যা বস্তু এবং মান হিসাবে ফাংশনগুলির ব্যবহারের অনুমতি দেয় এবং সহায়তা করে which আমি ব্যাপক ব্যবহার, স্পষ্টতা এবং দুর্দান্ত ডকুমেন্টেশনের কারণে পছন্দ করেছি।


1
এটি সাধারণভাবে স্কালার সম্পর্কে দুর্দান্ত তথ্য, তবে আমি নির্দিষ্ট ডেটা বিজ্ঞানের সরঞ্জামগুলি বা ফ্রেমওয়ার্কগুলির সম্পর্কে তথ্য সন্ধান করছি যা স্কাল একীকরণ রয়েছে এবং সেই সরঞ্জামগুলি ব্যবহারের জন্য কেন স্কালা একটি ভাল ভাষা।
শেলডোনক্রেজার

0

স্কালা বড় এবং ছোট উভয় ডেটা বিজ্ঞান অ্যাপ্লিকেশনগুলির জন্য উপযুক্ত। আপনি যদি অ্যাপাচি স্পার্কের সাথে ভালভাবে সংহত করে এমন কোনও মেশিন লার্নিং লাইব্রেরি চেষ্টা করতে আগ্রহী হন তবে ডায়নাএমএল বিবেচনা করুন। এটি এখনও শৈশবকালে তাই অফারকৃত মডেলের সংখ্যার দিক থেকে কথা বলতে পারে, তবে এটি বিস্তৃত এবং নমনীয় মেশিন লার্নিং এপিআই দ্বারা এটি তৈরি করে।

কিছু নমুনা ব্যবহারের ক্ষেত্রে বিবেচনা করুন (আরও কোথা থেকে এসেছে)

  1. সিস্টেম সনাক্তকরণ - অ্যাবট পাওয়ার প্ল্যান্ট

দাবি অস্বীকার: আমি ডায়নাএমএল এর লেখক


এটি যদি আপনার প্রকল্প হয় তবে অনুগ্রহ করে আপনার অনুষঙ্গটি নোট করুন।
শন ওভেন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.