Walton Electronics Co., Ltd.
تماس با ما

تماس با شخص : Walton-cara

شماره تلفن : 15986872308

Free call

یادگیری ماشینی به چند مرحله نیاز دارد

July 18, 2022

مقدمه

استقرار یادگیری ماشین (ML) یک فرآیند چند مرحله ای است.این شامل انتخاب یک مدل، آموزش آن برای یک کار خاص، اعتبارسنجی آن با داده های آزمایشی، و سپس استقرار و نظارت بر مدل در تولید است.در اینجا، این مراحل را مورد بحث قرار می دهیم و آنها را تجزیه می کنیم تا شما را با ML آشنا کنیم.ML به سیستم هایی اطلاق می شود که بدون آموزش صریح، قادر به یادگیری و بهبود هستند.این سیستم ها از داده ها برای انجام یک کار یا عملکرد خاص یاد می گیرند.در برخی موارد، یادگیری.یا آموزش خاص تر، به شیوه ای نظارت شده رخ می دهد که در آن خروجی های نادرست منجر به تنظیم مدل برای سوق دادن آن به سمت خروجی صحیح می شود.در موارد دیگر، یادگیری بدون نظارت زمانی رخ می دهد که سیستم داده ها را سازماندهی می کند تا الگوهای ناشناخته قبلی را آشکار کند.اکثر مدل های ML از این دو پارادایم پیروی می کنند (یادگیری نظارت شده در مقابل یادگیری بدون نظارت).اکنون بیایید به این بپردازیم که منظور از یک مدل چیست و سپس بررسی کنیم که چگونه داده ها سوخت برای یادگیری ماشینی می شوند.مدل یادگیری ماشینی یک مدل انتزاعی از یک راه حل برای یادگیری ماشین است.مدل معماری را تعریف می‌کند که پس از آموزش، به پیاده‌سازی تبدیل می‌شود.بنابراین، ما مدل‌ها را مستقر نمی‌کنیم.ما پیاده‌سازی‌هایی از مدل‌های آموزش‌دیده از داده‌ها را مستقر می‌کنیم (اطلاعات بیشتر در این مورد در بخش بعدی).بنابراین مدل‌ها به اضافه داده‌ها به‌علاوه آموزش نمونه‌های برابر راه‌حل‌های ML (شکل 1).ترجمه لازم استبه عنوان مثال، تغذیه داده‌های متنی در یک شبکه یادگیری عمیق مستلزم رمزگذاری کلمات به شکل عددی است که معمولاً یک بردار با ابعاد بالا است که کلمات مختلفی را می‌توان استفاده کرد.به طور مشابه، خروجی ها ممکن است نیاز به ترجمه از یک فرم عددی به یک فرم متنی داشته باشند.مدل‌های ML انواع مختلفی دارند، از جمله مدل‌های شبکه عصبی، مدل‌های بیزی، مدل‌های رگرسیون، مدل‌های خوشه‌بندی و غیره.مدلی که انتخاب می کنید بر اساس مشکل موجود است.در زمینه شبکه‌های عصبی، مدل‌ها از شبکه‌های چند لایه کم عمق تا شبکه‌های عصبی عمیق که لایه‌های زیادی را شامل می‌شوند، متغیر هستند.

نورون های تخصصی (واحدهای پردازش).شبکه های عصبی عمیق نیز طیف وسیعی از مدل ها را بر اساس برنامه مورد نظر شما در دسترس دارند.

مثلا:

●اگر برنامه شما بر روی شناسایی اشیاء درون تصاویر متمرکز است، شبکه عصبی کانولوشنال (CNN) یک مدل ایده آل است.CNN ها برای تشخیص سرطان پوست به کار رفته اند و نسبت به متخصص پوست معمولی عمل می کنند.

●اگر برنامه شما شامل پیش‌بینی یا تولید توالی‌های پیچیده (مانند جملات زبان انسانی) باشد، شبکه‌های عصبی بازگشتی (RNN) یا شبکه‌های حافظه کوتاه مدت (LSTM) مدل‌های ایده‌آلی هستند.LSTM همچنین برای ترجمه ماشینی زبان های انسانی به کار گرفته شده است.

●اگر برنامه شما شامل توصیف محتویات یک تصویر به زبان انسانی باشد، می توان از ترکیب CNN و LSTM استفاده کرد (که در آن تصویر به CNN وارد می شود و خروجی CNN نشان دهنده ورودی LSTM است که توالی کلمات را منتشر می کند).

●اگر برنامه شما شامل تولید تصاویر واقعی (مانند مناظر یا چهره) باشد، یک شبکه متخاصم مولد (GAN) نشان دهنده مدل پیشرفته فعلی است.این مدل ها نشان دهنده برخی از محبوب ترین معماری های شبکه عصبی عمیق هستند که امروزه مورد استفاده قرار می گیرند.شبکه های عصبی عمیق به این دلیل محبوب هستند که می توانند داده های بدون ساختار مانند تصاویر، ویدئو یا اطلاعات صوتی را بپذیرند.لایه های درون شبکه سلسله مراتبی از ویژگی ها را می سازند که به آنها اجازه می دهد اطلاعات بسیار پیچیده را طبقه بندی کنند.شبکه های عصبی عمیق عملکرد پیشرفته ای را در تعداد زیادی از حوزه های مشکل نشان داده اند.اما مانند سایر مدل های ML، دقت آنها به داده ها بستگی دارد.اجازه دهید این جنبه را در ادامه بررسی کنیم.

داده ها و آموزش

داده ها سوختی هستند که یادگیری ماشین را نه تنها در حین کار، بلکه در ساخت راه حل ML از طریق آموزش مدل، هدایت می کند.در زمینه آموزش داده‌ها برای شبکه‌های عصبی عمیق، بررسی داده‌های لازم در زمینه کمیت و کیفیت مهم است.شبکه های عصبی عمیق برای آموزش به داده های زیادی نیاز دارند.یک قانون کلی برای طبقه بندی مبتنی بر تصویر 1000 تصویر است

در هر کلاساما پاسخ به پیچیدگی مدل و تحمل خطا بستگی دارد.برخی از نمونه‌های راه‌حل‌های ML تولیدی، طیفی از اندازه‌های داده را به دست می‌دهند.یک سیستم تشخیص چهره و تشخیص چهره به 450000 تصویر نیاز داشت و یک چت ربات پرسش و پاسخ با 200000 سوال همراه با 2 میلیون پاسخ آموزش داده شد.مجموعه داده های کوچکتر نیز می توانند بر اساس مشکل حل شده کافی باشند.یک راه حل تحلیل احساسات که قطبیت نظر را از متن نوشته شده تعیین می کند، تنها به ده ها هزار نمونه نیاز دارد.کیفیت داده ها به اندازه کمیت مهم است.با توجه به مجموعه داده های بزرگ مورد نیاز برای آموزش، حتی مقادیر کمی از داده های آموزشی اشتباه می تواند به یک راه حل ضعیف منجر شود.بسته به نوع داده‌های لازم، داده‌های شما ممکن است فرآیند پاکسازی را طی کنند.این تضمین می کند که مجموعه داده سازگار است، فاقد داده های تکراری است، دقیق و کامل است (فاقد داده های نامعتبر یا ناقص).ابزارهایی برای پشتیبانی از این فرآیند وجود دارد.اعتبارسنجی داده‌ها برای بایاس نیز مهم است تا اطمینان حاصل شود که داده‌ها به یک راه‌حل مغرضانه ML منجر نمی‌شوند.آموزش ML بر روی داده های عددی عمل می کند، بنابراین بسته به راه حل شما می توان به یک مرحله پیش پردازش نیاز داشت.برای مثال، اگر داده‌های شما زبان انسانی است، ابتدا باید به شکل عددی ترجمه شود تا پردازش شود.تصاویر را می توان برای یکپارچگی از قبل پردازش کرد.به عنوان مثال، تصاویری که به یک شبکه عصبی عمیق وارد می شوند، برای حذف نویز (در میان سایر عملیات) اندازه تغییر می کنند و صاف می شوند.یکی از بزرگترین مشکلات در ML بدست آوردن یک مجموعه داده برای آموزش راه حل ML شما است.این می تواند بزرگترین تلاش بسته به مشکل شما باشد زیرا ممکن است وجود نداشته باشد و نیاز به تلاش جداگانه ای داشته باشد

گرفتن.در نهایت، مجموعه داده باید بین داده های آموزشی و داده های آزمایشی تقسیم شود.بخش آموزشی برای آموزش مدل استفاده می‌شود و پس از آموزش، داده‌های آزمون برای تأیید صحت راه‌حل استفاده می‌شود.

 

با ما در تماس باشید

وارد کنید پیام شما