شگفتانگیزترین ایده هوش مصنوعی از نظر Andrej Karpathy
هوش مصنوعی به سرعت در حال پیشرفت هست. بهگونهای که باید زمان و انرژی زیادی صرف کنید تا از پیشرفتها جا نمانید. اما، کدام ایده از نظر شما جذابترین ایده هوش مصنوعی هست؟ بیایید، ابتدا جواب این سوال را از زبان یکی از نخبههای هوش مصنوعی آقای Andrej Karpathy بشنویم. سپس، شما هم نظر خودتان را در کامنتها به اشتراک بگذارید.
شگفتانگیزترین ایده هوش مصنوعی از نظر Andrej Karpathy
در جایی از گفتوگوی آقای Lex Fridman با Andrej Karpathy، این مساله مطرح میشود. در ادامه، این سوال و جواب را میتوانید بخوانید و ببینید:
- Lex Fridman: به نظرت زیباترین و شگفتانگیزترین ایده در دیپ لرنینگ یا هوش مصنوعی چی هست؟
- Andrej Karpathy: معماری ترنسفورمر! بر پایه شبکه عصبی، معماریهای زیادی ساخته شدن که برای برای دادههای مختلفی مثل تصویر، متن و صوت کاربرد دارن. اما اخیرا، شاهد همگرایی هستم؛ میتونید دادههای مختلف مثل ویدئو، تصویر، متن، صوت و غیره رو به معماری ترنسفورمر بدید. انگار که با یک کامپیوتر همهمنظوره (General-purpose) مواجه هستیم که میتونه آموزش (Train) ببینه و برای اجرای روی سختافزارهای ما خیلی بهینه هست.
از صحبتهای Karpathy کاملا مشخص هست که شبکه ترنسفورمر بین همه نوع داده یکسان هست. یعنی، اجزای داخلی شبکه ترنسفورمر برای دادههای مختلف تغییر نمیکند. در بینایی کامپیوتر از همان ترنسفورمری استفاده میشود که در NLP بهکار برده میشود. اصلا این شاخصه یکی از دلایل مهم محبوبیت شبکه ترنسفورمر است. اما، دوست دارم نگاهی به تاریخچه هوش مصنوعی بیندازم و چند نکته ساده و جالب بگویم.
سیر تحولات در حوزه هوش مصنوعی
وقتی به تاریخچه تحول رهیافتها در هوش مصنوعی نگاه کنید، به وضوح یک همگرایی میبینید. همان همگرایی که Karpathy به آن اشاره کرد. واضحتر توضیح میدهم:
- قبل از شکوفایی یادگیری عمیق، رهیافتها دستی (Handcrafted) و مهندسی بودند. یعنی، شما باید از دل تصویر یا متن، ویژگی استخراج میکردید و بعد این ویژگی/فیچر را به بخش تصمیمگیری میدادید. در چنین دورانی، وجه اشتراک بسیار کمی بین شاخههای مختلف هوش مصنوعی مثل تصویر، متن، صوت و غیره وجود داشت. به ندرت الگوریتم یا روشی وجود داشت که هم در تصویر و هم در متن استفاده شود. بنابراین، شما برای ساخت محصول به یک عالمه نیروی خبره نیاز داشتید که رهیافتهای کارآمد استخراج ویژگی بسازند. تجربه کردم که میگویم! آن زمان، وارد شغلی شدم که 4 نیروی ارشد و دکترا با دانش عالی مشغول ساخت رهیافتهای استخراج ویژگی کارآمد بودند!
- بعد از شکوفایی یادگیری عمیق، استخراج ویژگی در حوزههای مختلف از سنتی و دستی به سمت مبتنی بر شبکه عصبی با قابلیت یادگیری تغییر کرد. واقعا دیگر به یک اتاق پر از ارشد و دکترا برای ساخت استخراج ویژگی مهندسیشده نیازی نبود! علاوهبراین، شاهد همگرایی در دادههای مختلف بودیم. یعنی، دیگر شما در حوزه بینایی کامپیوتر ایزوله نبودید و مدام از حوزههای دیگر مانند پردازش زبان طبیعی میشنیدید. چرا؟ چون همه رهیافتهای بر پایه شبکه عصبی ساخته میشد. مقطع ارشد من در راستای بینایی کامپیوتر بود و از پردازش زبان طبیعی چیزی نمیدانستم. اما، بعد از یادگیری عمیق، مطالب پردازش زبان طبیعی را درک میکردم و حتی کمکم یادگیری آن را شروع کردم. اتفاقا، سالها پیش یک آموزش یادگیری عمیق رایگان در Udacity میدیدم که توسط گوگل ساخته شده بود. مدرس این دوره میگفت با آمدن یادگیری عمیق، شاخههای مختلف هوش مصنوعی به هم نزدیک شدهاند و شما راحتتر میتوانید شاخههای مختلف را درک کنید. چرا؟ چون همیشه با شبکه عصبی سروکار داشتیم. مثلا، در بینایی کامپیوتر با شبکه عصبی کانولوشنی، در پردازش زبان طبیعی با شبکه عصبی بازگشتی و …
- اما، بعد از معرفی شبکه ترنسفورمر و رشد آن در حوزههای مختلف، این همگرایی بیشتر و بیشتر شد! طوریکه بر خلاف عرصه قبلی، حتی نیازی نیست که شبکه اختصاصی برای هر حوزه داشته باشید. با یک معماری ترنسفورمر میتوانید به راحتی بسیاری از دادههای رایج را پردازش کنید.
حالا، با این توضیحات، شاید آن عبارت کامپیوتر همهمنظوره (General-purpose) برای شما واضحتر شده باشد. حالا لطفا شما بگویید: به نظر شما، زیباترین و شگفتانگیزترین ایده در دیپ لرنینگ یا هوش مصنوعی چیست؟
دیدگاهتان را بنویسید