اشتراک گذاری مطلب
هوش مصنوعی

توسعه مدل هوش مصنوعی ارزان‌قیمت با عملکرد پیشرفته

8097
admin
1 دقیقه مطالعه

«تجارت نیوز» گزارش می‌دهد:

توسعه مدل هوش مصنوعی ارزان‌قیمت با عملکرد پیشرفته

محققان دانشگاهی مدل هوش مصنوعی s1 را با هزینه کمتر از ۵۰ دلار توسعه دادند که عملکردی مشابه مدل‌های پیشرفته دارد و به‌صورت متن‌باز منتشر شده است.

فولاد سل

به گزارش تجارت نیوز،

محققان دانشگاه استنفورد و دانشگاه واشینگتن موفق به آموزش یک مدل هوش مصنوعی به نام s1 شده‌اند که با هزینه‌ای کمتر از ۵۰ دلار عملکردی مشابه مدل‌های پیشرفته‌ای مانند o1 از OpenAI و R1 از DeepSeek دارد. این مدل، که در حوزه‌های ریاضیات و کدنویسی عملکرد برجسته‌ای نشان داده، به همراه کد منبع و داده‌های آموزشی، به‌صورت متن‌باز در گیت‌هاب منتشر شده است. این دستاورد نشان می‌دهد که حتی تیم‌های کوچک بدون حمایت شرکت‌های بزرگ فناوری نیز می‌توانند به پیشرفت‌های قابل‌توجهی در حوزه هوش مصنوعی دست یابند.

فرآیند آموزش: استفاده از مدل جمینی گوگل

محققان برای توسعه مدل s1 از تکنیکی به نام “استخراج دانش” (distillation) استفاده کردند. در این روش، یک مدل کوچک‌تر، قابلیت‌های استدلالی خود را از یک مدل پیشرفته‌تر استخراج می‌کند. در این پروژه، مدل s1 با استفاده از نسخه آزمایشی “Flash Thinking” از مدل جمینی ۲.۰ گوگل آموزش داده شد.

در مرحله بعد، تیم تحقیقاتی یک مدل متن‌باز کوچک از آزمایشگاه هوش مصنوعی Qwen (وابسته به علی‌بابا) را انتخاب کردند. سپس مجموعه‌ای از ۱۰۰۰ پرسش به همراه پاسخ‌ها و مراحل استدلالی آنها را که توسط مدل جمینی ایجاد شده بود، گردآوری کردند. این داده‌ها از طریق “تنظیم دقیق تحت نظارت” (Supervised Fine-Tuning) به مدل s1 آموزش داده شد که منجر به بهبود قابل‌توجه توانایی‌های استدلالی آن گردید.

عملکرد قدرتمند با هزینه‌ای ناچیز

فرآیند آموزش s1 بسیار سریع و مقرون‌به‌صرفه بود. با استفاده از ۱۶ کارت گرافیک Nvidia H100، کل فرآیند آموزش کمتر از ۳۰ دقیقه زمان برد. نیکلاس مونینگهوف، یکی از محققان استنفورد، تخمین زده که هزینه اجاره این قدرت پردازشی امروز حدود ۲۰ دلار خواهد بود.

علی‌رغم هزینه ناچیز، مدل s1 توانست در آزمون‌های ارزیابی هوش مصنوعی عملکرد چشمگیری از خود نشان دهد، به‌ویژه در حوزه استدلال منطقی. تیم تحقیقاتی همچنین دریافت که افزودن یک مرحله ساده در فرآیند استدلال مانند تأخیر کوتاه در تولید پاسخ،می‌تواند دقت مدل را بهبود بخشد، چرا که این روش به مدل اجازه می‌دهد پاسخ‌های خود را بازبینی و اصلاح کند.

پیامدهای توسعه این مدل در رقابت هوش مصنوعی

موفقیت s1 پرسش‌هایی را درباره آینده رقابت در صنعت هوش مصنوعی مطرح می‌کند. اگر محققان بتوانند مدل‌هایی با کیفیت مشابه محصولات چندمیلیون‌دلاری را با کسری از هزینه توسعه دهند، مزیت رقابتی شرکت‌های بزرگ فناوری چه خواهد شد؟

این موضوع باعث نگرانی برخی شرکت‌های بزرگ شده است. به‌عنوان مثال، OpenAI اخیراً شرکت DeepSeek را به سوءاستفاده از API خود برای توسعه مدل‌های مشابه متهم کرده است. گوگل نیز، که دسترسی محدودی به جمینی ۲.۰ را در اختیار کاربران قرار داده، قوانین سخت‌گیرانه‌ای علیه استفاده از مدل‌هایش برای ایجاد سیستم‌های رقیب دارد و هنوز مشخص نیست که توسعه s1 نقض سیاست‌های این شرکت محسوب می‌شود یا خیر.

آینده توسعه مدل‌های متن‌باز و ارزان‌قیمت

اگرچه تکنیک‌هایی مانند استخراج دانش امکان بازتولید مدل‌های پیشرفته را با هزینه کم فراهم می‌کنند، اما این روش لزوماً منجر به جهش‌های اساسی در پیشرفت هوش مصنوعی نمی‌شود. شرکت‌های بزرگی مانند متا، گوگل و مایکروسافت قصد دارند در سال ۲۰۲۵ صدها میلیارد دلار در زیرساخت‌های هوش مصنوعی سرمایه‌گذاری کنند تا مدل‌هایی پیشرفته‌تر و خلاقانه‌تر توسعه دهند.

با این حال، موفقیت s1 نشان می‌دهد که تحقیق‌های دانشگاهی و پروژه‌های متن‌باز همچنان می‌توانند نقشی کلیدی در پیشرفت این فناوری ایفا کنند. این پروژه همچنین نشان می‌دهد که دسترسی گسترده‌تر به هوش مصنوعی، حتی با منابع محدود، می‌تواند رقابت در این حوزه را تقویت کرده و فرصت‌های جدیدی برای نوآوری ایجاد کند.

دانشگاه تهران

منبع خبر

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest
0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها