نظریه یادگیری محاسباتی

نظریه یادگیری محاسباتی(به انگلیسی : Computational Learning Theory) شاخه‌ای از ریاضیات و علوم رایانه است که به ارزیابی کارایی الگوریتم‌های یادگیری ماشینی می‌پردازد. این نظریه عموماً به تحلیل الگوریتم‌های یادگیری با نظارت می‌پردازد و سعی می‌کند کران‌هایی برای کارایی یک الگوریتم در داده دیده‌نشده با استفاده از اطلاعات کارایی آن الگوریتم در داده در دسترس و پیچیدگی الگوریتم بیابد. بعد وی‌سی و یادگیری صحیح احتمالی تخمینی مثال‌هایی از نظریه یادگیری محاسباتی هستند که به ترتیب به اختراع الگوریتم‌های ماشین بردار پشتیبانی و بوستینگ انجامیدند. این نظریه به تحلیل پیچیدگی زمانی الگوریتم‌های یادگیری نیز می‌پردازد. [1]

در این شکل یادگیر، باید به وسیله نمونه‌های ورودی آموزش ببیند که نمونه‌های درون مستطیل، به عنوان مثال دارای c(x) = 1 می‌باشند و برای بقیه نمونه‌ها ،c(x) = 0 می‌باشد.

مقدمه

همچنین این تئوری به دنبال جواب سوالاتی مانند "تحت چه شرایطی یادگیری موفق، ممکن یا ناممکن است؟" ویا "تحت چه شرایطی یک الگوریتم یادگیری خاص موفقیت یادگیری را تضمین می‌کند؟" می‌باشد. دو چهارچوب برای بررسی یادگیری الگوریتم‌های یادگیری در نظر گرفته می‌شود. چهارچوب اول، چهارچوب تقریباً درست یا PAC که در بالا اشاره ‌‌شد، می‌باشد. در این چهارچوب کلاس فرضیه‌هایی را که می‌توان یا نمی‌توان با تعداد چندجمله‌ایی از نمونه‌های آموزشی یادگرفت را بررسی می‌کند و معیاری طبیعی برای پیچیدگی فضای فرضیه‌ای که تعداد نمونه‌های آموزشی برای یادگیری استقرایی را محدود می‌کند، تعریف می‌کنیم. در چهارچوب کران خطا تعداد خطاهای آموزشی ای را که یادگیر قبل از تعیین فرضیه درست انجام می‌دهد را بررسی می‌کنیم. در مطالعه یادگیری ماشین، این سؤال طبیعی است که بپرسیم :

چه قوانین کلی‌ای بر یادگیری‌های ماشین( یا حتی غیر ماشین) حاکم است؟
آیا می‌توان تعداد نمونه‌های لازم برای اینکه یادگیری حتماً موفق شود را تعیین کرد؟
آیا می‌توان تعداد خطاهای یادگیر قبل از یادگیری تابع هدف را مشخص کرد؟
آیا می‌توان پیچیدگی ذاتی کلاس‌های مسائل مختلف را مشخص کرد؟

اگر چه جواب جامع همه این سوالات هنوز معلوم نیست، اما این قسمت از هوش محاسباتی برای پاسخ به این سوالات به وجود آمده‌است. برای مثال مسئله یادگیری استقرایی تابع هدفی نامعلوم از نمونه‌های آموزشی این تابع هدف و فضای فرضیه معلوم را در نظر بگیرید. در این مثال پاسخ به سوالاتی مثل تعداد نمونه‌های لازم برای یادگیری موفق و تعداد اشتباهات قبل از یادگیری کامل مطرح می‌شود. برای تعیین مرزهای این کمیت‌ها به ویژگی‌های مسئله‌ یادگیری از جمله موارد زیر بستگی دارد :‌

اندازه یا پیچیدگی فضای فرضیه‌ای در نظر گرفته شده
دقت لازم برای یادگیری
احتمال اینکه یادگیر فرضیه‌ای موفق را خروجی دهد
روند ارائه نمونه‌ها

در اکثر موارد ما بر روی الگوریتم یادگیری خاصی تمرکز نمی‌کنیم و ترجیح می‌دهیم بیشتر بر روی کلاس‌های الگوریتم‌های یادگیری با خواص یکسان (فضای فرضیه‌ای مشابه، نحوه نمایش نمونه‌های آموزشی مشابه و ...) بحث کنیم. در اکثر موارد سوالات بالا مطرح هستند. توجه کنید روش‌های گوناگونی برای تعریف موفق وجود دارد. ممکن است یادگیری فرضیه‌ای را موفق بدانیم که خروجی آن دقیقا مشابه هدف باشد، همچنین ممکن است یادگیری‌ای را موفق بدانیم که فرضیه اش در اکثر موارد مشابه هدف باشد. [2]

مدل یادگیری یک فرضیه تقریباً درست (PAC)

در این بخش، حالت خاصی را برای مسائل یادگیری در نظر می‌گیریم، این حال مدل یادگیری تقریباً درست (PAC) نامیده می‌شود. برای سادگی کار، یادگیری مفاهیم منطقی از داده‌های آموزشی بدون خطا را در نظر بگیرید. با این وجود بسیاری از نتایج حاصل را می‌توان به حالت کلی یادگیری توابع حقیقی مقادیر تابع هدف تعمیم داد. همچنین بسیاری دیگر از نتایج را می‌توان به یادگیری از انواع خاصی از داده‌های خطادار تعمیم داد. فرض کنید $X$ مجموعه‌ای از تمامی نمونه‌های ممکن بر روی تابع هدف مفروض باشد. برای مثال، مجموعه تمامی افراد با ویژگی‌های سن (پیر و جوان) و قد (بلند و کوتاه) باشد. $C$ مجموعه مفاهیم هدفی است که ممکن است، یادگیر برای یادگیری آن‌ها برای یادگیری آنها، به کار برده باشد. هر مفهوم هدف $c$ در مجموعه $C$ متناسب با زیر مجموعه‌ای از $X$ است. به‌طور مشابه $c$ متناسب با تابع $c:X\rightarrow \{0,1\}$ می‌باشد. برای مثال، یک تابع هدف $c$ در $C$ ، ممکن است مفهوم افراد اسکی باز باشد. اگر $x$ نمونه مثبتی از $c$ باشد، داریم : [3]

$c(x)=0$

در این حالت فرض می‌کنیم که نمونه‌ها به صورت تصادفی و با توزیع احتمال $D$ انتخاب می‌شوند. برای مثال، $D$ ممکن است، توزیع احتمال نمونه افرادی باشد که از یک باشگاه ورزشی بیرون می‌آیند (توزیع احتمالی بر روی تمامی افراد). در کل $D$ ممکن است، هر توزیع احتمالی باشد و درحالت کلی این توزیع برای یادگیر ناشناخته است. تمامی اطلاعات موجود در $D$ این است که توزیع احتمالی ثابت است، بدین معنا که این توزیع احتمال با زمان تغییر نمی‌کند. نمونه‌های آموزشی با این توزیع احتمال انتخاب شده و به همراه مقدار تابع هدفشان ( $c(x)$ ) به یادگیر داده می‌شوند.

این شکل تعریف خطای PAC را نشان می‌دهد. مفاهیم c و h با مجموعه نمونه‌های X نمایش داده شده‌اند. نمونه‌های آموزشی در این مثال با علامت‌های مثبت و منفی نشان داده شده‌اند. خطای h برای c، احتمال دسته بندی غلط نمونه تصادفی در این صفحه یا قرار گرفتن در اختلاف این دو مجموعه (نواحی هلالی شکل) می‌باشد.

یادگیر $L$ مجموعه‌ای از فرضیه‌های ممکن مانند $H$ را در یادگیری مفهوم هدف در نظر می‌گیرد. برای مثال، $H$ ممکن است، مجموعه تمامی فرضیه‌های قابل بیان به صورت عطف سن و قد باشد. بعد از مشاهده یک سری از نمونه‌های آموزشی، برای تابع هدف $c$ ، باید فرضیه‌ای مانند $h$ از $H$ که تخمین آن از $c$ است، به عنوان فرضیه‌ تخمینی خروجی دهد. موفقیت $L$ را کارایی این فرضیه $h$ بر روی نمونه‌های جدیدی که به صورت تصادفی از $X$ و باتوزیع $D$ انتخاب می‌شوند، می‌سنجیم. در چنین حالتی، علاقه ما به کارایی یادگیرهای مختلف $L$ با فضای فرضیه‌های مختلف $H$ در یادگیری مجموعه توابع هدف مختلف درون $C$ است. زیرا ما می‌خواهیم یادگیر $L$ به اندازه کافی جامع باشد تا بتواند هر تابع هدف درون $C$ را مستقل از اینکه توزیع $D$ چیست، یاد بگیرد. در بعضی مواقع نیز علاقه داریم که بدترین حالت توابع هدف درون $C$ را برای تمامی توزیع‌های $D$ بررسی کنیم. چون علاقه ما به نزدیکی فرضیه خروجی $h$ به تابع هدف حقیقی $c$ است، پس کار را با تعریف خطای واقعی یک فرضیه $h$ بر روی $c$ و توزیع احتمال $D$ شروع می‌کنیم. خطای واقعی $h$ ، حطای $h$ در دسته‌بندی نمونه‌های جدید با توزیع $D$ است.

تعریف :‌ خطای واقعی( $error_{D}(h)$ ) فرضیه $h$ برای تابع هدف $c$ و توزیع احتمال نمونه $D$ این است که نمونه انتخابی بر اساس توزیع $D$ اشتباه دسته‌بندی شود. (در رابطه زیر، $Pr_{x\in D}$ نشان دهنده احتمال عبارت با فرض اینکه $x$ از توزیع $D$ پیروی می‌کند، می‌باشد.

$error_{D}(h)\equiv Pr_{x\in D}[c(x)\not =h(x)]$

توجه کنید که خطا را طوری تعریف کرده ایم که که خطای تمامی نمونه‌های ممکن را اندازه بگیرد و فقط محدود به نمونه‌های آموزشی نباشد. بنابراین انتظار داریم که زمانی که از فرضیه بدست آمده بر روی نمونه‌های تصادفی جدید استفاده می‌کنیم، چنین خطایی داشته باشد. همچنین توجه کنید که این خطا به شدت به توزیع احتمال $D$ وابسته است. برای مثال، اگر $D$ توزیعی یکنواخت باشد که به تمامی نمونه‌های $X$ احتمالی یکسان نسبت می‌دهد، خطای فرضیه آمده در شکل روبرو نسبت به نمونه‌های درون نواحی هلالی به تمامی نمونه‌ها خواهد بود. در نتیجه اگر $D$ احتمال بیشتری به نمونه‌های نواحی هلالی نسبت دهد، خطا بیشتر خواهد شد. در بدترین حالت نیز، $D$ ، احتمال صفر به نمونه‌های خارج نواحی هلالی و احتمال ۱ به نمونه‌های درون نواحی هلالی نسبت می‌دهد و خطا ۱ خواهد بود، با وجود اینکه $c$ و $h$ واقعا اشتراک دارند. توجه داشته باشید که خطای $h$ برای $c$ به‌طور مستقیم، برای یادگیر غیرقابل مشاهده است. $L$ فقط کارایی $h$ را بر روی نمونه‌های آموزشی، در دسترس دارد و باید انتخاب خود در مورد فرضیه را بر اساس همین معیار انجام دهد. ما از عبارات خطای آموزشی (در مقابل خطای واقعی) برای نمایش نسبت نمونه‌های آموزشی با دسته‌بندی اشتباه توسط $h$ به کل نمونه‌های آموزشی استفاده می‌کنیم. قسمت بزرگی از بررسی ما از پیچیدگی یادگیری بر محور این سؤال متمرکز می‌شود که چگونه احتمال دارد که خطای آموزشی مشاهده شده، معیاری غلط‌انداز از $error_{D}(h)$ باشد؟ است. [4]

مدل یادگیری مرز خطا

با وجود اینکه تمرکز، بیشتر بر مدل PAC می‌باشد،‌ تئوری یادگیری محاسباتی تعریف مسئله‌های دیگر را در بر می‌گیرد. تعریف مسئله‌های یادگیری مختلفی که مورد مطالعه قرار گرفته‌است، در نحوه ایجاد نمونه‌های یادگیری، نویز داده‌ها(با خطا یا بدون خطا)، تعریف موفق (مفهوم هدف باید یاد گرفته شود یا اینکه تقریباً با احتمال خاصی یادگرفته شود.)، فرض‌های یادگیر(شامل توزیع نمونه‌ای و اینکه $C\subseteq H$ ) و معیاری که با آن یادگیر ارزیابی می‌شود (مانند تعداد نمونه‌های آموزشی، تعداد اشتباه‌ها، زمان کل یادگیری و ...)، متفاوت است. در این مدل، یادگیر با تعداد اشتباه‌هایش قبل از همگرایی به فرضیه درست، ارزیابی می‌شود. مشابه تعریف مسئله در مدل PAC، فرض کنید، یادگیر یک سری از نمونه‌های آموزشی را دریافت ‌‌می‌کند. با این وجود، در اینجا می‌خواهیم یادگیر، قبل از دریافت هر نمونه $x$ ، مقدار تابع هدف $c(x)$ را(قبل از معلوم شدن مقدار درست هدف) پیش‌بینی کند. حال سؤال این است که یادگیر قبل از یادگیری مفهوم هدف چه تعداد پیش‌بینی اشتباه خواهد کرد؟. اهمیت این سؤال در کاربرد عملی است، زیرا که یادگیری باید زمانی که سیستم در حال استفاده واقعی است، انجام شود، نه در مرحله آموزشی مجزا. برای مثال، اگر سیستم برای یادگیری پیش‌بینی اینکه چه پرداخت‌هایی برای یک کارت اعتباری باید ثبت شود و چه پرداخت‌‌،‌هایی تقلبی هستند، بر اساس اطلاعاتی که در حین استفاده از سیستم، جمع‌آوری می‌کند، طراحی می‌شود. بنابراین علاقه خواهیم داشت که تعداد اشتباهات قبل از همگرایی به تابع هدف کمینه شود. در اینجا تعداد کل اشتباهات، می‌تواند اهمیت بیشتری نسبت به تعداد کل نمونه‌های آموزشی داشته باشد. این مسئله یادگیری مرز خطا را می‌توان در شرایط خاص مختلفی مورد مطالعه قرار داد. برای مثال، ممکن است تعداد اشتباهات قبل از یادگیری PAC تابع هدف را بشماریم. اما در اکثر مثال‌ها قبل از اینکه یادگیر، مفهوم هدف را دقیقا یاد بگیرد، تعداد اشتباه‌ها را در نظر می‌گیریم. یادگیری مفهوم هدف به این معناست که به فرضیه‌ای میل کنیم که داشته باشیم: [2] $\forall {x\in X}:h(x)=c(x)$

جستارهای وابسته

هوش مصنوعی (Artificial Intelligence)
هوش محاسباتی (Computational Intelligence)
یادگیری ماشین (Machinelearning)
شبکه عصبی مصنوعی (Artificial Neural Network)
یادگیری عمیق (Deep Learning)
یادگیری تقویتی (Reinforcement learning)
یادگیری بانظارت (Supervised learning)

منابع

Angluin, D (1992). "Computational learning theory: Survey and selected bibliography". In Proceedings of the Twenty-Fourth Annual ACM Symposium on Theory of Computing: 351–354.
Mitchell, Tom (1997). Machine Learning. McGraw Hill Education. ISBN 0-070-42807-7.
Kivinen, Jyrki; H.Sloan, Robet (2012). Computational Learning Theory: 15th Annual Conference on Computational Learning Theory. Springer. ISBN 3-540-43836-X.
J.Kearns, Michael; V.Vazirani, Mesh (1994). An Introduction to Computational Learning Theory. The MIT Press. ISBN 0-262-11193-4.

پیوند به بیرون

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[1] Angluin, D (1992). "Computational learning theory: Survey and selected bibliography". In Proceedings of the Twenty-Fourth Annual ACM Symposium on Theory of Computing: 351–354.

[ml-2] Mitchell, Tom (1997). Machine Learning. McGraw Hill Education. ISBN 0-070-42807-7.

[3] Kivinen, Jyrki; H.Sloan, Robet (2012). Computational Learning Theory: 15th Annual Conference on Computational Learning Theory. Springer. ISBN 3-540-43836-X.

[4] J.Kearns, Michael; V.Vazirani, Mesh (1994). An Introduction to Computational Learning Theory. The MIT Press. ISBN 0-262-11193-4.

علوم رایانه
Note: This template roughly follows the 2012 ACM Computing Classification System.
سخت‌افزار	برد مدار چاپی دستگاه جانبی مدار مجتمع یکپارچه‌سازی کلان‌مقیاس سامانه روی یک تراشه رایانش سبز خودکارسازی طراحی الکترونیکی شتاب‌دهنده سخت‌افزاری
سازمان سامانه‌های رایانه	معماری رایانه سامانه نهفته رایانش بی‌درنگ اطمینان‌پذیری
شبکه رایانه‌ای	معماری شبکه پروتکل ارتباطات سخت‌افزار شبکه برنامه‌ریز شبکه کارایی شبکه رایانه‌ای سرویس شبکه‌ای
سازمان نرم‌افزار	مفسر میان‌افزار ماشین مجازی سیستم‌عامل کیفیت نرم‌افزار
نظریه زبان‌های برنامه‌نویسی و ابزار توسعه نرم‌افزار	الگو برنامه‌نویسی زبان برنامه‌نویسی کامپایلر زبان خاص دامنه زبان مدل‌سازی چارچوب نرم‌افزاری محیط یکپارچه توسعه نرم‌افزار مدیریت پیکربندی نرم‌افزار کتابخانه (رایانه) مخزن نرم‌افزاری
توسعه نرم‌افزار	فرایند توسعه نرم‌افزار تحلیل نیازمندی‌ها طراحی نرم‌افزار ساخت نرم‌افزار استقرار نرم‌افزار تعمیر و نگهداری نرم‌افزار تیم برنامه‌نویسی نرم‌افزار متن‌باز برنامه‌نویسی آزمون نرم‌افزار
نظریه محاسبات	مدل محاسبه زبان صوری نظریه اتوماتا نظریه رایانش‌پذیری نظریه پیچیدگی محاسباتی منطق در علوم کامپیوتر معنی‌شناسی (علوم رایانه)
الگوریتمها	الگوریتم تحلیل الگوریتم‌ها کارایی الگوریتمی الگوریتم‌های تصادفی هندسه محاسباتی
ریاضیات رایانه	ریاضیات گسسته احتمالات آمار نرم‌افزار ریاضی نظریه اطلاعات آنالیز ریاضی آنالیز عددی
سامانه اطلاعاتی	پایگاه داده ذخیره‌سازی داده رایانه سامانه اطلاعات سازمانی نرم‌افزار اجتماعی سامانه اطلاعات جغرافیایی سامانه پشتیبانی تصمیم کنترل فرایند پایگاه داده چند رسانه‌ای داده‌کاوی کتابخانه دیجیتال سکوی رایانش بازاریابی اینترنتی وب جهان‌گستر بازیابی اطلاعات مستندسازی فنی
امنیت رایانه	رمزنگاری روش‌های صوری خدمات امنیتی سامانه تشخیص نفوذ خرابی سخت‌افزار امنیت شبکه امنیت اطلاعات امنیت برنامه
تعامل انسان و رایانه	طراحی تعاملی رایانش اجتماعی رایانش فراگیر مصورسازی دسترس‌پذیری رایانه واسط‌های کاربر رایانش پوشیدنی
همروندی	رایانش همزمان رایانش موازی رایانش توزیع‌شده چندریسمانی چندپردازشی
هوش مصنوعی	پردازش زبان‌های طبیعی بازنمود دانش بینایی رایانه‌ای برنامه‌ریزی خودکار بهینه‌سازی نظریه کنترل فلسفه هوش مصنوعی هوش مصنوعی توزیع شده استدلال خودکار زبان‌شناسی رایانشی یادگیری ماشینی
یادگیری ماشین	یادگیری با نظارت یادگیری بی‌نظارت یادگیری تقویتی یادگیری چند-وظیفه‌ای روش اعتبارسنجی متقابل
گرافیک رایانه‌ای	پویانمایی رایانه‌ای رندرینگ (گرافیک رایانه‌ای) روتوش واحد پردازش گرافیکی واقعیت ترکیبی واقعیت مجازی فشرده‌سازی تصویر مدلسازی جامد
رایانش کاربردی	تجارت الکترونیک نرم‌افزار سازمانی ریاضیات محاسباتی فیزیک محاسباتی شیمی محاسباتی زیست‌شناسی محاسباتی علوم اجتماعی محاسباتی مهندسی و علم محاسبه انفورماتیک پزشکی هنر دیجیتال نشر الکترونیک جنگ مجازی رأی‌گیری الکترونیکی بازی ویدئویی واژه‌پرداز تحقیق در عملیات فناوری آموزشی سامانه مدیریت اسناد
توجه: بنا بر سامانه رده‌بندی رایانش ای‌سی‌ام علم رایانه همچنین می‌تواند به موضوع‌ها یا زمینه‌های گوناگون تقسیم شود. کتاب:علوم رایانه رده:علوم رایانه طرح کلی علوم رایانه ویکی‌پدیا:ویکی‌پروژه علوم رایانه ویکی‌انبار

علوم اعصاب
خطوط کلی علوم اعصاب تاریخچه علوم اعصاب
علوم پایه	وارژن‌شناسی رفتاری ژنتیک رفتاری علوم اعصاب سلولی علوم اعصاب محاسباتی کانکتویکس تصویربرداری ژنتیکی علوم اعصاب یکپارچه علوم اعصاب ملکولی مهندسی مغز و اعصاب کالبدشناسی اعصاب شیمی اعصاب عصب‌شناسی غدد درون‌ریز ژنتیک اعصاب نوروانفورماتیک نورومتریکس شکل‌شناسی اعصاب فیزیک اعصاب فیزیولوژی اعصاب علوم اعصاب سیستمی
علوم اعصاب بالینی	عصب‌شناسی رفتاری نوروفیزیولوژی بالینی نوروکاردیولوژی همه‌گیرشناسی عصبی گوارش‌شناسی عصبی ایمنی شناسی عصبی مراقبت ویژه عصبی عصب‌شناسی عصب‌شناسی سرطان عصب‌شناسی چشم آسیب‌شناسی عصبی داروشناسی عصبی اندام‌سازی عصبی روانپزشکی عصبی رادیولوژی عصبی توانبخشی عصبی جراحی مغز و اعصاب عصب‌شناسی گ.ح.ب. ویروس‌شناسی عصبی عصب‌شناسی تغذیه روان‌پزشکی
علوم اعصاب شناختی	علوم اعصاب-روان علوم اعصاب رفتاری کرونوبیولوژی شناخت سلولی-ملکولی کنترل حرکتی عصب‌شناسی زبان عصب-روانشناسی علوم اعصاب حسی علوم اعصاب شناختی-اجتماعی
گرایش‌های بین‌رشته‌ای	عصب‌شناسی مصرف‌کننده علوم اعصاب فرهنگی علوم اعصاب تربیتی علوم اعصاب تکاملی انسان‌شناسی عصبی مهندسی زیستی عصبی نوروبایوتیکس جرم‌شناسی عصبی اقتصاد عصب‌بنیان شناخت‌شناسی عصبی زیبایی‌شناسی عصبی عصب‌شناسی اخلاق رفتارشناسی عصبی تاریخ‌شناسی عصبی حقوق عصب‌شناختی بازاریابی عصبی نورومورفیک پدیدارشناسی عصبی نوروفلسفه سیاست‌شناسی عصبی نوروروباتیک علوم اعصاب دین باستان‌شناسی عصبی علوم اعصاب اجتماعی
مفاهیم	واسط مغز و رایانه تکوین اعصاب شبکه عصبی مصنوعی مدار عصبی نظریه تشخیص نظارت نوروفیزیولوژیکی حین عمل تراشه عصبی زوال عصبی اختلال عصبی-تکوینی تنوع عصبی عصب‌زایی تصویربرداری عصبی دستگاه عصبی-ایمنی مدیریت عصبی مدولاسیون عصبی انعطاف‌پذیری عصبی فناوری عصبی نوروتوکسین
رده