یک مدل هوش مصنوعی که مانند ما فکر میکند، روشهای جدیدی برای بررسی درون جعبه سیاه ارائه میدهد
وقتی یک مدل زبان بزرگ استاندارد (LLM) با یک مسئله مواجه میشود، سعی میکند آن را با تطبیق آن با اطلاعات مشابهی که قبلاً دیده است، حل کند و سپس بر اساس آن الگوهای گذشته پاسخی ارائه دهد.
اما اینکه چگونه تصمیم میگیرد از کدام اطلاعات استفاده کند و چه ارزشی به بخشهای مختلف اطلاعات میدهد، میتواند از بیرون تا حدودی غیرقابل درک باشد.
تیمی از EPFL یک مدل زبان بزرگ جدید ایجاد کرده است که ساختاری مشابه مغز انسان دارد و به کاربران امکان کنترل بیشتر و فاصله گرفتن از هوش مصنوعی “جعبه سیاه” را میدهد.
مدل LLM MiCRo (ترکیبی از استدلالکنندگان شناختی) از نظر معماری به چهار ناحیه تخصصی تقسیم شده است که مانند بخشهای مختلف مغز انسان عمل میکنند و به کاربران این امکان را میدهند که کنترل بیشتری بر نحوه برخورد با یک سوال و درک بهتر نحوه رسیدن به پاسخهای آن داشته باشند.
این مدل که در کنفرانس بینالمللی بازنماییهای یادگیری (ICLR 2026) ارائه شد، از آزمایشگاه NLP، بخشی از دانشکده علوم کامپیوتر و ارتباطات (IC)، و آزمایشگاه NeuroAI، بخشی از IC و دانشکده علوم زیستی در EPFL، تهیه شده است.
این مقاله در سرور پیشچاپ arXiv قرار گرفته است.
چهار متخصص
برای ایجاد MiCRo، محققان چهار ناحیه از مغز را شناسایی کردند که در عملکردهای مختلف تخصص دارند و آنها را «متخصص» مینامند: زبان، منطق، استدلال اجتماعی و دانش جهانی.
بدر الخمیسی، کاندیدای دکترا که رهبری این تحقیق را بر عهده دارد، میگوید: «مغز به مناطق تخصصی سازماندهی شده است که هر کدام برای انجام یک عملکرد خاص تنظیم شدهاند. تاکنون، ما این تقسیم کار را به وضوح در مدلهای زبانی فعلی نمیبینیم. ما چهار ناحیه مغز را که دانشمندان علوم اعصاب به خوبی میشناسند انتخاب کردیم و به مدل ماژولهای تخصصی خود را دادیم که هر کدام برای شبیه بودن به یکی از آن مناطق مغز آموزش دیدهاند.»
یک LLM معمولاً به عنوان مجموعهای از لایهها عمل میکند که یک مشکل یا سوال میتواند از طریق آنها پردازش شود.
در مورد MiCRo، هر لایه به چهار متخصص مختلف تقسیم میشود. شما یک جمله را به مدل میدهید که از لایه اول شروع میشود، به عنوان مثال، «گربه خواب است». سپس در این لایه، روتر میتواند یک متخصص برای کلمه اول، «the»، اما یک متخصص متفاوت برای کلمه دوم، «cat» و غیره انتخاب کند، که آن را مدولار و بسیار سازگار میکند.
الخمیسی توضیح میدهد: «هر کلمه از یک جمله میتواند به متخصصان مختلفی برسد. بنابراین یک جمله در واقع میتواند توسط چندین متخصص در هر لایه پردازش شود.»
یک سوال مانند این را در نظر بگیرید: «اما میخواهد یک صورتحساب شام ۶۰ فرانک سوئیسی را بین سه دوست تقسیم کند، اما میداند که جیک هفته گذشته شغلش را از دست داده و خیلی مغرور است که بگوید در حال تقلا است.»
یک ماژول صرفاً ریاضی محاسبات را انجام میدهد: ۶۰ فرانک سوئیس تقسیم بر سه میشود ۲۰ فرانک سوئیس برای هر کدام.
اما ماژول استدلال اجتماعی به چیزی ظریفتر میپردازد: آگاهی اما از وضعیت جیک، غرور ناگفته او و پیشنهاد ضمنی مبنی بر اینکه ممکن است بیسروصدا سهم او را بپردازد. هر دو نوع استدلال برای درک کامل آنچه اتفاق میافتد مورد نیاز است و در MiCRo، هر جنبه از سوال به متخصصی که بهترین تجهیزات را برای رسیدگی به آن دارد، ارجاع داده میشود.
«وقتی میبینیم که مدل چگونه کار میکند، میتوانیم ببینیم که کلماتی را که مربوط به جنبههای اجتماعی هستند به متخصص اجتماعی ارجاع میدهد و وقتی بخش ریاضی را انجام میدهد، آن اعداد را به متخصص منطق ارجاع میدهد.»
این جداسازی، مشاهدهی نحوهی «تفکر» مدل و دلیل تصمیمگیریهای خاص آن را آسانتر میکند. همچنین به این معنی است که میتوان تصمیمات را هدایت کرد برای مثال، میتوانید تصمیم بگیرید که بسته به نوع مدلی که میخواهید در یک موقعیت خاص استفاده کنید، تأثیر متخصص اجتماعی را افزایش دهید یا متخصص منطق را سرکوب کنید.
الخمیسی میگوید: «در LLM های سنتی، میتوانید این کار را از طریق تحریک انجام دهید، به این صورت که به مدل میگویید خروجی را اجتماعیتر یا مرتبطتر با احساسات کند. اما در اینجا، این کار با مداخله در خود معماری بدون انجام هیچ تحریکی انجام میشود.»
«یک چرخهی مثبت»
برای ساخت MiCRo، تیم EPFL با گرتا توکوت، دانشمند علوم اعصاب از دانشگاه هاروارد و MIT، همکاری کرد تا بفهمد کدام بخشهای مغز انسان توسط مسائل مختلف فعال میشوند و سپس آن یادگیری را در مدل اعمال کرد.
برای شناسایی ناحیهای مشابه متخصص «منطق» در مغز، دانشمندان علوم اعصاب به انسانها وظایف دشواری مانند معادلات ریاضی سخت و وظایف آسانتر مانند معادلات ریاضی آسان را میدهند و سپس فعالیت مغز آنها را ثبت میکنند تا دریابند کدام مناطق مغز برای وظایف دشوار در مقابل وظایف غیر دشوار فعالتر هستند.
تیم الخمیسی سپس همین کار را برای مدل انجام داد و معادلات ریاضی دشواری را به آن داد تا ببیند کدام متخصصان بیشترین فعالیت را دارند.
«نکته جالب این است که ما دقیقاً از همان کاری که در علوم اعصاب انجام میدهند، اما در مدل، استفاده کردیم. و مدل توانست به تنهایی آن متخصصان را شناسایی کند.»
در حالی که علوم اعصاب به مدل اطلاعات میدهد، این مدل همچنین درک مغز را نیز شکل میدهد و به طور بالقوه به دانشمندان علوم اعصاب اجازه میدهد تا سهم حوزههای مختلف را برای یک مسئله یا سوال مشخص کشف کنند؛ به عنوان مثال، اینکه یک جمله خاص حوزههای زبانی را 20٪، حوزههای ریاضی را 50٪ و حوزههای استدلال اجتماعی را 40٪ فعال میکند.
الخمیسی میگوید: «برای کار دکترایم، به این چرخه مفید بین علوم اعصاب و هوش مصنوعی علاقهمند بودهام. از یک جهت، ما از یافتهها و بینشهای علوم اعصاب در مورد مغز استفاده میکنیم و آنها را در مدلهای زبانی ادغام میکنیم، و اکنون، با مدلهایی مانند MiCRo، میتوانیم جهت دیگر را بررسی کنیم و بپرسیم که چگونه میتوانیم از مدلهای هوش مصنوعی برای کمک به درک بهتر مغز استفاده کنیم.»
بیشتر بدانید:هوش مصنوعی، دقت در تجزیه و تحلیل نانومواد را بهبود میبخشد
بیشتر بخوانید:چگونه هوش مصنوعی می تواند درمان شخصی برای سرطان را ارائه دهد
تاریخ:1405/4/9
مهسا نعمتی