ارتباط با ما 02144787082

یک مدل هوش مصنوعی که مانند ما فکر می‌کند، روش‌های جدیدی برای بررسی درون جعبه سیاه ارائه می‌دهد

زمان مطالعه: 4 دقیقه یک مدل هوش مصنوعی که مانند ما فکر می‌کند، روش‌های جدیدی برای بررسی درون جعبه سیاه ارائه می‌دهد وقتی یک مدل زبان بزرگ استاندارد (LLM) با یک مسئله مواجه می‌شود، سعی می‌کند آن را با تطبیق آن با اطلاعات مشابهی که قبلاً دیده است، حل کند و سپس بر اساس آن الگوهای گذشته پاسخی ارائه ...

یک مدل هوش مصنوعی که مانند ما فکر می‌کند، روش‌های جدیدی برای بررسی درون جعبه سیاه ارائه می‌دهد
4 دقیقه
0 دیدگاه
مهسا نعمتی
زمان مطالعه: 4 دقیقه

یک مدل هوش مصنوعی که مانند ما فکر می‌کند، روش‌های جدیدی برای بررسی درون جعبه سیاه ارائه می‌دهد

وقتی یک مدل زبان بزرگ استاندارد (LLM) با یک مسئله مواجه می‌شود، سعی می‌کند آن را با تطبیق آن با اطلاعات مشابهی که قبلاً دیده است، حل کند و سپس بر اساس آن الگوهای گذشته پاسخی ارائه دهد.

اما اینکه چگونه تصمیم می‌گیرد از کدام اطلاعات استفاده کند و چه ارزشی به بخش‌های مختلف اطلاعات می‌دهد، می‌تواند از بیرون تا حدودی غیرقابل درک باشد.

تیمی از EPFL یک مدل زبان بزرگ جدید ایجاد کرده است که ساختاری مشابه مغز انسان دارد و به کاربران امکان کنترل بیشتر و فاصله گرفتن از هوش مصنوعی “جعبه سیاه” را می‌دهد.

مدل LLM MiCRo (ترکیبی از استدلال‌کنندگان شناختی) از نظر معماری به چهار ناحیه تخصصی تقسیم شده است که مانند بخش‌های مختلف مغز انسان عمل می‌کنند و به کاربران این امکان را می‌دهند که کنترل بیشتری بر نحوه برخورد با یک سوال و درک بهتر نحوه رسیدن به پاسخ‌های آن داشته باشند.

این مدل که در کنفرانس بین‌المللی بازنمایی‌های یادگیری (ICLR 2026) ارائه شد، از آزمایشگاه NLP، بخشی از دانشکده علوم کامپیوتر و ارتباطات (IC)، و آزمایشگاه NeuroAI، بخشی از IC و دانشکده علوم زیستی در EPFL، تهیه شده است.

این مقاله در سرور پیش‌چاپ arXiv قرار گرفته است.

چهار متخصص

برای ایجاد MiCRo، محققان چهار ناحیه از مغز را شناسایی کردند که در عملکردهای مختلف تخصص دارند و آنها را «متخصص» می‌نامند: زبان، منطق، استدلال اجتماعی و دانش جهانی.

بدر الخمیسی، کاندیدای دکترا که رهبری این تحقیق را بر عهده دارد، می‌گوید: «مغز به مناطق تخصصی سازماندهی شده است که هر کدام برای انجام یک عملکرد خاص تنظیم شده‌اند. تاکنون، ما این تقسیم کار را به وضوح در مدل‌های زبانی فعلی نمی‌بینیم. ما چهار ناحیه مغز را که دانشمندان علوم اعصاب به خوبی می‌شناسند انتخاب کردیم و به مدل ماژول‌های تخصصی خود را دادیم که هر کدام برای شبیه بودن به یکی از آن مناطق مغز آموزش دیده‌اند.»

یک LLM معمولاً به عنوان مجموعه‌ای از لایه‌ها عمل می‌کند که یک مشکل یا سوال می‌تواند از طریق آنها پردازش شود.

در مورد MiCRo، هر لایه به چهار متخصص مختلف تقسیم می‌شود. شما یک جمله را به مدل می‌دهید که از لایه اول شروع می‌شود، به عنوان مثال، «گربه خواب است». سپس در این لایه، روتر می‌تواند یک متخصص برای کلمه اول، «the»، اما یک متخصص متفاوت برای کلمه دوم، «cat» و غیره انتخاب کند، که آن را مدولار و بسیار سازگار می‌کند.

الخمیسی توضیح می‌دهد: «هر کلمه از یک جمله می‌تواند به متخصصان مختلفی برسد. بنابراین یک جمله در واقع می‌تواند توسط چندین متخصص در هر لایه پردازش شود.»

یک سوال مانند این را در نظر بگیرید: «اما می‌خواهد یک صورتحساب شام ۶۰ فرانک سوئیسی را بین سه دوست تقسیم کند، اما می‌داند که جیک هفته گذشته شغلش را از دست داده و خیلی مغرور است که بگوید در حال تقلا است.»

یک ماژول صرفاً ریاضی محاسبات را انجام می‌دهد: ۶۰ فرانک سوئیس تقسیم بر سه می‌شود ۲۰ فرانک سوئیس برای هر کدام.

اما ماژول استدلال اجتماعی به چیزی ظریف‌تر می‌پردازد: آگاهی اما از وضعیت جیک، غرور ناگفته او و پیشنهاد ضمنی مبنی بر اینکه ممکن است بی‌سروصدا سهم او را بپردازد. هر دو نوع استدلال برای درک کامل آنچه اتفاق می‌افتد مورد نیاز است و در MiCRo، هر جنبه از سوال به متخصصی که بهترین تجهیزات را برای رسیدگی به آن دارد، ارجاع داده می‌شود.

«وقتی می‌بینیم که مدل چگونه کار می‌کند، می‌توانیم ببینیم که کلماتی را که مربوط به جنبه‌های اجتماعی هستند به متخصص اجتماعی ارجاع می‌دهد و وقتی بخش ریاضی را انجام می‌دهد، آن اعداد را به متخصص منطق ارجاع می‌دهد.»

این جداسازی، مشاهده‌ی نحوه‌ی «تفکر» مدل و دلیل تصمیم‌گیری‌های خاص آن را آسان‌تر می‌کند. همچنین به این معنی است که می‌توان تصمیمات را هدایت کرد برای مثال، می‌توانید تصمیم بگیرید که بسته به نوع مدلی که می‌خواهید در یک موقعیت خاص استفاده کنید، تأثیر متخصص اجتماعی را افزایش دهید یا متخصص منطق را سرکوب کنید.

الخمیسی می‌گوید: «در LLM های سنتی، می‌توانید این کار را از طریق تحریک انجام دهید، به این صورت که به مدل می‌گویید خروجی را اجتماعی‌تر یا مرتبط‌تر با احساسات کند. اما در اینجا، این کار با مداخله در خود معماری بدون انجام هیچ تحریکی انجام می‌شود.»

«یک چرخه‌ی مثبت»

برای ساخت MiCRo، تیم EPFL با گرتا توکوت، دانشمند علوم اعصاب از دانشگاه هاروارد و MIT، همکاری کرد تا بفهمد کدام بخش‌های مغز انسان توسط مسائل مختلف فعال می‌شوند و سپس آن یادگیری را در مدل اعمال کرد.

برای شناسایی ناحیه‌ای مشابه متخصص «منطق» در مغز، دانشمندان علوم اعصاب به انسان‌ها وظایف دشواری مانند معادلات ریاضی سخت و وظایف آسان‌تر مانند معادلات ریاضی آسان را می‌دهند و سپس فعالیت مغز آنها را ثبت می‌کنند تا دریابند کدام مناطق مغز برای وظایف دشوار در مقابل وظایف غیر دشوار فعال‌تر هستند.

تیم الخمیسی سپس همین کار را برای مدل انجام داد و معادلات ریاضی دشواری را به آن داد تا ببیند کدام متخصصان بیشترین فعالیت را دارند.

«نکته جالب این است که ما دقیقاً از همان کاری که در علوم اعصاب انجام می‌دهند، اما در مدل، استفاده کردیم. و مدل توانست به تنهایی آن متخصصان را شناسایی کند.»

در حالی که علوم اعصاب به مدل اطلاعات می‌دهد، این مدل همچنین درک مغز را نیز شکل می‌دهد و به طور بالقوه به دانشمندان علوم اعصاب اجازه می‌دهد تا سهم حوزه‌های مختلف را برای یک مسئله یا سوال مشخص کشف کنند؛ به عنوان مثال، اینکه یک جمله خاص حوزه‌های زبانی را 20٪، حوزه‌های ریاضی را 50٪ و حوزه‌های استدلال اجتماعی را 40٪ فعال می‌کند.

الخمیسی می‌گوید: «برای کار دکترایم، به این چرخه مفید بین علوم اعصاب و هوش مصنوعی علاقه‌مند بوده‌ام. از یک جهت، ما از یافته‌ها و بینش‌های علوم اعصاب در مورد مغز استفاده می‌کنیم و آنها را در مدل‌های زبانی ادغام می‌کنیم، و اکنون، با مدل‌هایی مانند MiCRo، می‌توانیم جهت دیگر را بررسی کنیم و بپرسیم که چگونه می‌توانیم از مدل‌های هوش مصنوعی برای کمک به درک بهتر مغز استفاده کنیم.»

لینک مفید:هوش مصنوعی همراه با دستگاه نوری کوچک، نور تحریف شده را برای تصویربرداری واضح‌تر اصلاح می‌کند

بیشتر بدانید:هوش مصنوعی، دقت در تجزیه و تحلیل نانومواد را بهبود می‌بخشد

بیشتر بخوانید:چگونه هوش مصنوعی می تواند درمان شخصی برای سرطان را ارائه دهد

 

تاریخ:1405/4/9

مهسا نعمتی

دیدگاهتان را بنویسید