এই বিশ্লেষণ কৌশলগুলি সম্পর্কে আপনার কী বিশ্বব্যাপী দৃষ্টি রয়েছে?


24

আমি বর্তমানে একটি প্রকল্পে আছি যেখানে আউটপুট কীভাবে ইনপুট সাথে সম্পর্কিত তা বোঝার জন্য আমাদের সবার মতো আমিও মূলত প্রয়োজন । এখানে বৈশিষ্ট্যটি হ'ল ডেটা আমাকে একবারে এক টুকরো দেওয়া হয়, তাই প্রতিবারই নতুন পাওয়ার পরে আমি আমার বিশ্লেষণ আপডেট করতে চাই । আমি বিশ্বাস করি এটিকে "অন-লাইন" প্রসেসিং বলা হয়, "ব্যাচ" প্রসেসিংয়ের বিপরীতে যেখানে আপনার প্রয়োজনীয় সমস্ত ডেটা থাকে এবং একই সাথে সমস্ত ডেটা ব্যবহার করে আপনার গণনা করেন।Y( y , x ) ( y , x )এক্স(Y,এক্স)(Y,এক্স)

সুতরাং আমি চারপাশে ধারণাগুলির সন্ধান করেছি এবং অবশেষে আমি এই সিদ্ধান্তে এসেছি যে পৃথিবী তিনটি ভাগে বিভক্ত:

  • প্রথম অংশটি পরিসংখ্যান এবং একোমেট্রিক্সের জমি। সেখানকার লোকেরা ওএলএস, জিএলএস, উপকরণের ভেরিয়েবল, আরিমা, পরীক্ষা, পার্থক্যের পার্থক্য, পিসিএ এবং হোয়াট নোট করে না। এই জমিটি বেশিরভাগ ক্ষেত্রেই রৈখিকতার দ্বারা প্রাধান্য পায় এবং কেবল "ব্যাচ" প্রক্রিয়াকরণ করে।

  • দ্বিতীয় অংশটি হ'ল মেশিন লার্নিং এবং অন্যান্য শব্দ যেমন কৃত্রিম বুদ্ধিমত্তা, তদারকি করা এবং নিরীক্ষণযোগ্য শিখন, নিউরাল নেটওয়ার্ক এবং এসভিএম এর দ্বীপ। "ব্যাচ" এবং "অন-লাইন" উভয়ই এখানে প্রক্রিয়াজাত করা হয়।

  • তৃতীয় অংশটি একটি সম্পূর্ণ মহাদেশ যা আমি সবেমাত্র আবিষ্কার করেছি, বেশিরভাগ বৈদ্যুতিক প্রকৌশলী দ্বারা জনবহুল, তাই বলে মনে হয়। সেখানে লোকেরা প্রায়শই তাদের সরঞ্জামগুলিতে "ফিল্টার" শব্দটি যুক্ত করে এবং তারা উইড্রো-হফ অ্যালগরিদম, রিকার্সিভ ন্যূনতম স্কোয়ার্স , উইনার ফিল্টার , কালম্যান ফিল্টার এবং সম্ভবত এখনও আবিষ্কার করেনি এমন দুর্দান্ত জিনিসগুলি আবিষ্কার করেছিল। স্পষ্টতই তারা বেশিরভাগ "অন-লাইন" প্রসেসিং করে কারণ এটি তাদের প্রয়োজনের সাথে আরও ভাল ফিট করে।

সুতরাং আমার প্রশ্নটি হ'ল, আপনার কি এই সমস্ত বিষয়ে একটি বিশ্ব দৃষ্টি রয়েছে? আমি এই ছাপে রয়েছি যে পৃথিবীর এই তিনটি অংশ একে অপরের সাথে খুব বেশি কথা বলে না। আমি কি ভূল? সম্পর্কিত কীভাবে তা বোঝার একটি গ্র্যান্ড ইউনিফাইড থিওরি রয়েছে ? আপনি কি এমন কোনও সংস্থান জানেন যে যেখানে সেই তত্ত্বের ভিত্তি স্থাপন করা যেতে পারে?এক্সওয়াইএক্স

আমি নিশ্চিত নই যে এই প্রশ্নটি সত্যই বোধগম্য হয়েছে, তবে আমি এই সমস্ত তত্ত্বগুলির মধ্যে কিছুটা হারিয়েছি। আমি "আমি এই বা এটি ব্যবহার করা উচিত?" প্রশ্নের উত্তরটি কল্পনা করি? "এটি আপনি কী করতে চান তার উপর নির্ভর করে (এবং আপনার ডেটাতে)"। তবে আমি এই তিনটি পৃথিবী একই প্রশ্নের ( ?) উত্তর দেওয়ার চেষ্টা করার মতো অনুভব করছি এবং তাই এই সমস্ত বিষয়ে উচ্চতর দৃষ্টিভঙ্গি পাওয়া সম্ভব এবং প্রতিটি কৌশলকে কী বিশেষ করে তোলে তা গভীরভাবে বুঝতে হবে।Y=(এক্স)


আমি মনে করি আজকের প্রথম 2 অঞ্চল একে অপরের সাথে অনেক বেশি কথা বলে। দুর্দান্ত প্রশ্ন যদিও!
জাচ

ডায়নামাইটের বিষয় এবং ভাল লেখার প্রশ্ন!
Rolando2

1
দয়া করে এটি তৈরি করুন
কার্ডিনাল

1
আমি নিজেকে একটি পরিসংখ্যানবিদ বলব, তবে আমি প্রচুর পরিমাণে অন-লাইনের জিনিসগুলি করি, বিভিন্ন ধরণের কিছু ননলাইনার মডেলিং করি এবং কমপক্ষে কিছুটা এআই তে ছড়িয়ে পড়েছি। আমি মনে করি যে সাধারণ সরঞ্জামগুলির মধ্যে পার্থক্যগুলি লোকেরা যে ধরণের সমস্যার মুখোমুখি হয় তার সাথে আরও বেশি সম্পর্কযুক্ত। যেখানে তাদের সমস্যাগুলি একত্রিত হয়, তাড়াতাড়ি বা পরে তারা একই সরঞ্জামগুলি সন্ধান করতে বা পুনরায় উদ্ভাবন করতে থাকে (প্রায়শই বিভিন্ন নামে এবং কিছুটা আলাদা ঘণ্টা এবং শিস দিয়ে)।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


4

ব্যাচ বনাম অন-লাইনের ক্ষেত্রে, আমার অভিজ্ঞতা আমাকে বলে যে কখনও কখনও আপনি উভয়কে একত্রিত করেন। আমার অর্থ হ'ল আপনি ভারী-উত্তোলন অর্থাত্ মডেল গঠনের সাথে সম্পর্কিত গণনা নিবিড় জিনিসগুলি অফ লাইন হয়ে যায় এবং তারপরে এই মডেলগুলি ব্যবহার করতে দ্রুত / অভিযোজিত পদ্ধতিতে নিয়োগ করুন। আমরা খুঁজে পেয়েছি যে "নতুন ডেটা" তিনভাবে ব্যবহার করা যেতে পারে; 1. সহজভাবে পূর্বাভাস; 2. পরিচিত মডেলটির পরামিতিগুলি সংশোধন করতে এবং 3. পরামিতিগুলি সংশোধন করতে এবং সম্ভবত মডেলটিকে সংশোধন করতে। এই তিনটি পন্থা "লাইভ বিশ্লেষণ" এর জন্য ব্যবহৃত হয়েছে এবং অবশ্যই এই তিনটি ধাপের একটি সম্পূর্ণ করার সময় ব্যবহৃত সফ্টওয়্যার এবং উপলব্ধ হার্ডওয়্যার উভয়ের উপর নির্ভর করে।

এখন আপনার বনাম এক্স বনাম কীভাবে মডেল করবেন সে সম্পর্কে আপনার অন্য বিন্দুতে। Y এর ইতিহাসের প্রভাব এবং x এর বর্তমান এবং পাস মানগুলি টেনে আনার ভিত্তিতে আমি রিগ্রেশনের একটি প্রসারিত সংস্করণ (যাকে ট্রান্সফার ফাংশন বা এআরএমএক্স মডেলস বলা হয়) ব্যবহার করতে পছন্দ করি। এটি গুরুতর যে একজন গাউসীয় প্রয়োজনীয়তা যাচাই করে এবং এআরএমএ উপাদানটির মাধ্যমে বাদ দেওয়া ডিস্ট্রিমেন্টিক কাঠামো (আউটিলার সনাক্তকরণের মাধ্যমে) এবং বাদ দেওয়া স্টোকাস্টিক কাঠামো উভয়ের জন্য প্রয়োজনীয় প্রক্সি হিসাবে অন্তর্ভুক্ত করে। অতিরিক্তভাবে একজনকে নিশ্চিত করতে হবে যে কেউ অত্যধিক ডেটা (প্যারামিটারের স্থিরতার জন্য পরীক্ষা) ব্যবহার করেনি এবং যে কোনও স্থায়ী ত্রুটি বিভেদ যার ফলে ডিসট্রিমেন্টিক / স্টোচাস্টিক ত্রুটির বৈকল্পিকতা এবং / অথবা y এর প্রত্যাশিত মান এবং তারতম্যের মধ্যে যোগসূত্র হয় অবশিষ্টাংশ।

এখন historতিহাসিকভাবে (বা আপনি যদি ইচ্ছা করেন তবে রহস্যময়ভাবে) চিন্তার বিভিন্ন সিলোগুলি পন্থাগুলি গঠনের চেষ্টা করেছে। আমাদের পূর্বপুরুষ বেতের দ্বারা ব্যবহৃত অনেকগুলি অ্যাডহক মডেল একটি স্থানান্তর ফাংশনের সাবসেট হিসাবে দেখানো হয় তবে এমন ডেটা সেট রয়েছে যা কল্পনা করা যায় যা একটি স্থানান্তর ফাংশনের অনুমানকে চ্যালেঞ্জ জানায়। যদিও এই ডেটা সেটগুলি উপস্থিত থাকতে পারে তবে এটি ধরে নেওয়া উচিত নয় যে তারা বিশ্লেষণের উপসংহার না পাওয়া পর্যন্ত তারা আপনাকে সরাসরি প্রভাবিত করবে।

ওয়েই (অ্যাডিসন-ওয়েসলি) বা বক্স-জেনকিন্সের মতো লেখাগুলি আমার জনসাধারণকে সমর্থন করার জন্য এবং আপনাকে আরও কিছু "উত্তর" বাছাইয়ের জন্য যুক্তিসঙ্গত রাস্তা-মানচিত্র সরবরাহ করা উচিত

যাইহোক এটি একটি দুর্দান্ত প্রশ্ন!

অতিরিক্ত হিসাবে আপনি যদি ব্যবহার করতে চান এমন কোনও তথ্য থাকে তবে আমি এখানে বর্ণিত বিভিন্ন বিকল্পগুলি প্রদর্শন করতে পারি। "Y থেকে x" সম্পর্কিত সম্পর্কিত তাদের প্রচেষ্টা এবং দেখতে সবার জন্য দয়া করে আপনার ডেটা ওয়েবে পোস্ট করুন।


আপনার উত্তরের জন্য ধন্যবাদ! আমি সময় পাওয়ার সাথে সাথে এটিকে আরও গভীরভাবে দেখব এবং সম্ভবত আমি আপনার কাছে ফিরে আসব। আমার অবশ্যই বলতে হবে আমি আর্মাক্স মডেলটি জানতাম না। আমার ধারণা আমি সরাসরি একটি সর্বশেষে ভিএআর এ এসেছি। তথ্য হিসাবে, আসলে আমরা এখনও আমাদের প্রকল্পের জন্য অন্যান্য স্টাফ তৈরি করছি তাই আমার এই মুহুর্তে অনেক প্রাসঙ্গিক ডেটা নেই। তবে আপনাকে অনেক ধন্যবাদ, আপনি আমার কাছ থেকে আবার শুনতে হবে!
আর্থার 21

"গাউসের প্রয়োজনীয়তা বৈধ করুন": গাউসিয়ান / ননপ্যারমেট্রিক / ভুলে যাওয়া-মডেলিং (পেস ব্রেইমান) কি গভীর বিভাজন নয়?
ডেনিস

2

ব্রেইমান এই বিষয়টিকে " পরিসংখ্যানের মডেলিং: দুটি সংস্কৃতি " তে সম্বোধন করেছেন । একটি দুর্দান্ত প্রশ্নের প্রথম প্রতিক্রিয়া।


ধন্যবাদ! আপনার লিঙ্কটি আমার পক্ষে কাজ করে না, এটি একটি কাজ করে এবং এটি সরাসরি পিডিএফের দিকে নিয়ে যায়। আমি কেবল বিমূর্ত এবং কিছু অংশ এলোমেলোভাবে পাঠ্যে পড়েছি এবং এটি দেখতে খুব আকর্ষণীয় দেখাচ্ছে। যদিও ছেলেরা সম্পূর্ণ "অ্যান্টি ক্লাসিক পরিসংখ্যান" বলে মনে হচ্ছে। আবার ধন্যবাদ.
আর্থার 21

দুর্দান্ত - আমি লিঙ্কটি আপডেট করেছি। এটি একটি মজাদার পড়া - উপভোগ করুন!
রাম আহলুওয়ালিয়া

ব্রেইমের "দুটি সংস্কৃতি" এখানে আলোচনা করা হয়েছে : কয়েকটি আকর্ষণীয় বিষয়, তবে নিজের মন-মানসিকতা পরিবর্তন করা বা এমনকি এটি ব্যাখ্যা করা শক্ত।
ডেনিস

1

আমি সন্দেহ করি যে এই প্রশ্নের উত্তর হ'ল "কোনও নিখরচায় মধ্যাহ্নভোজ নেই" এর ধারায় কিছু একটা। সম্ভবত পরিসংখ্যানবিদ, কম্পিউটার বিজ্ঞানী এবং বৈদ্যুতিক প্রকৌশলীরা বিভিন্ন অ্যালগরিদম তৈরির কারণ হ'ল তারা বিভিন্ন ধরণের সমস্যা সমাধানে আগ্রহী।


0

আমি বলব যে আপনি চিহ্নিত এই তিনটি গ্রুপ প্রকৃতপক্ষে মাত্র দুটি গ্রুপ:

  • পরিসংখ্যান
  • মেশিন লার্নিং, কৃত্রিম বুদ্ধি এবং প্যাটার্ন স্বীকৃতি।

সিগন্যাল ফিল্টারিং সম্পর্কিত সমস্ত শাখা দুটি দিকের উপর ভিত্তি করে: বৈশিষ্ট্য নিষ্কাশন (তরঙ্গসামগ্রী, গ্যাবার এবং ফুরিয়ার) যা নিদর্শন স্বীকৃতি এবং ডিস্ক্রিট ফুরিয়ার ট্রান্সফরমেশন যা হার্ড গণিতের অন্তর্গত। প্রকৃতপক্ষে, ডিজিটাল ফিল্টারিং একটি ইঞ্জিনিয়ারিংয়ের আরও বেশি কাছাকাছি কারণ এটি সহজ এবং কম কম্পিউটেশনাল ব্যয় অ্যালগরিদমের মাধ্যমে এই প্যাটার্ন সনাক্তকরণ সমস্যাটি সমাধান করার চেষ্টা করে। তবে মূলত এটি মেশিন লার্নিং।

তদুপরি, ফিল্টারিং, ওয়েভলেটস, গ্যাবার এবং ফুরিয়ার কৃত্রিম দর্শনের মূল হিসাবে চিত্র প্রসেসিংয়ে ব্যাপকভাবে ব্যবহৃত হয়।

পরিসংখ্যান এবং মেশিন লার্নিংয়ের মধ্যে পার্থক্য বিদ্যমান।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.