"পরিসংখ্যানগত শিক্ষার উপাদানগুলি" থেকে 18.1 টেবিলটি পুনরায় উত্পাদন করছে


13

পরিসংখ্যানগত শিক্ষার উপাদানগুলির সারণি 18.1 একটি 14 শ্রেণীর ডেটা সেটটিতে বেশ কয়েকটি শ্রেণিবদ্ধের পারফরম্যান্সের সংক্ষিপ্তসার করেছে। আমি মাল্টিক্লাস শ্রেণিবিন্যাস সমস্যার জন্য লাসো এবং ইলাস্টিক নেট এর সাথে একটি নতুন অ্যালগরিদম তুলনা করছি।

ব্যবহার glmnetসংস্করণ 1.5.3 (রাঃ 2.13.0) আমি বিন্দু 7. পুনর্গঠন করা সক্ষম নই ( MULTINOMIAL -penalized) টেবিল, যেখানে ব্যবহার করা জিনের সংখ্যা 269 এবং পরীক্ষা ত্রুটি রিপোর্ট করা হয় মধ্যে 13 পেরিয়ে গেছে 54. ব্যবহৃত ডেটা হ'ল এটি 14-ক্যান্সার মাইক্রোআরাই ডেটা সেট । আমি যা কিছু চেষ্টা করেছি, 54 এর মধ্যে 16 টির পরীক্ষার ত্রুটির সাথে 170-180 জিনের আশেপাশে ব্যবহার করে একটি সেরা পারফর্মিং মডেল পাচ্ছি।L1

নোট করুন যে পৃষ্ঠা 184 এর পৃষ্ঠার 183-এর শুরুতে, ডেটাটির কিছু প্রাক-প্রসেসিংয়ের বর্ণনা দেওয়া হয়েছে।

আমি এখন পর্যন্ত লেখকদের সাথে যোগাযোগ করেছি - এখন পর্যন্ত কোনও প্রতিক্রিয়া ছাড়াই - এবং আমি জিজ্ঞাসা করেছি যে কেউ যদি হয় কিনা তা নিশ্চিত করতে পারে যে টেবিলটি পুনরুত্পাদন করতে সমস্যা আছে বা কীভাবে টেবিলটি পুনরুত্পাদন করতে পারে তার সমাধান সরবরাহ করতে পারেন।


1
গ্ল্যামনেট সম্প্রতি বেশ কিছুটা পরিবর্তন নিয়েছে এবং অতীতে সংখ্যাসূচক ক্ষেত্রে কিছু সমস্যা ছিল। এটি সম্ভবত এই কারণে হয়? আপনি কত দিন লেখকদের সাথে যোগাযোগ করেছেন? আমি দেখতে পাচ্ছি যে বর্তমান সংস্করণটি 1.7 এবং এটি প্রায় এক সপ্তাহ আগে CRAN এ আপলোড করা হয়েছিল।
কার্ডিনাল

@ কার্ডিনাল, আমি গ্ল্যামনেট নিয়ে সর্বশেষ পরীক্ষা-নিরীক্ষা করে প্রায় চার সপ্তাহ হয়ে গেলাম, তবে আমাদের একটি আলাদা বাস্তবায়নও রয়েছে যা ইএসএলে টেবিলের সাথে সামঞ্জস্য না করে একই রকম ফলাফল তৈরি করে। টেবিলটি অবশ্যই পুরানো, সুতরাং আমার অনুমান যে টেবিলটি সঠিক নয়, তবে এটি নিশ্চিতভাবে জেনে ভাল লাগবে।
এনআরএইচ

আমি খুব অল্প সংক্ষেপে sections বিভাগগুলি স্কিম করেছিলাম এবং আমার মনে একটি প্রশ্ন এসেছিল যে 66 66১ পৃষ্ঠা (তৃতীয় মুদ্রণ) এর (১৮.১৯) সংকোচনের পরামিতি বাছাইয়ের জন্য ক্রস বৈধকরণ কীভাবে করা হয়েছিল। কোন ধারণা? আমি এটি মিস করেছি বা এটি অন্য কোথাও বর্ণিত হয়েছে? এটি সম্ভবত এমন জায়গার মতো মনে হয় যেখানে আপনার বিশ্লেষণ পুনরায় তৈরি করার আপনার প্রচেষ্টা পদ্ধতির পার্থক্যের জন্য সংবেদনশীল হতে পারে।
কার্ডিনাল

@ কার্ডিনাল, এতে আগ্রহী হওয়ার জন্য প্রথমে ধন্যবাদ। এটি ঠিক যে সিভি কোনও পার্থক্য আনতে পারে তবে লেখকরা ডেটা সহ একত্রে ওয়েব পৃষ্ঠায় সিভির জন্য সাবসেট (সূচকগুলি) ব্যবহার করেন। যাইহোক, সিভি কেবলমাত্র সর্বোত্তম পেনাল্টি প্যারামিটার ল্যাম্বদা বাছাই করার জন্য ব্যবহৃত হয়, তারপরে পুরো প্রশিক্ষণের ডেটা সেটটি মডেলটির সাথে মানিয়ে যায়, যা পরীক্ষার ডেটাতে পরে মূল্যায়ন করা হয়। সুতরাং, সিভি পদক্ষেপটি একটি আলাদা ল্যাম্বডা বাছাই করলেও, সেই
ল্যাম্বদা

উত্তর:


2

আপনি কি বইয়ের আর প্যাকেজটি পরীক্ষা করেছেন ? এতে সমস্ত ডেটাসেট, ফাংশন এবং সেখানে ব্যবহৃত বেশিরভাগ স্ক্রিপ্ট রয়েছে ...


7
ভাল চেষ্টা. হ্যাঁ, আমি প্যাকেজটি যাচাই করেছি, তবে দাবি করে যে এটিতে সমস্ত ডেটা, ফাংশন এবং বেশিরভাগ স্ক্রিপ্ট রয়েছে অতিরঞ্জিত। এটি সম্পূর্ণ নয়, এবং এটিতে প্রশ্নযুক্ত ডেটা সেট নেই।
এনআরএইচ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.