آیا می توان تنها با 50 دلار یک مدل در سطح ChatGPT ساخت؟ محققان اخیراً با استفاده از روش های خاص، موفق به انجام این کار شده اند!

DeepSeek R1 و جنجال استفاده از داده های OpenAI

هفته گذشته، مدل DeepSeek R1 که توسط یک شرکت چینی توسعه یافته، ادعا کرد که به سطح ChatGPT o1 (مدل رایگان OpenAI) رسیده است. این خبر در دنیای فناوری سر و صدای زیادی به پا کرد، اما بعداً مشخص شد که این مدل برای کاهش هزینه های آموزشی، از پاسخ های ChatGPT در داده های آموزشی خودش استفاده کرده است!

OpenAI این موضوع را تأیید کرده و آن را یکی از دلایل برتری DeepSeek R1 نسبت به مدل های دیگر دانسته است. این ماجرا نشان داد که استفاده از پاسخ های یک مدل پیشرفته تر می تواند تأثیر بزرگی بر عملکرد مدل های جدید داشته باشد.

 حالا، محققان روش DeepSeek را برای ساخت مدل جدیدی به نام S1 به کار گرفته اند!

گروهی از محققان تصمیم گرفتند با استفاده از همین تکنیک، یک مدل هوش مصنوعی جدید با کمترین هزینه ممکن توسعه دهند. آن ها با کمک مدل Gemini 2.0 Flash، هزاران نمونه پرسش و پاسخ باکیفیت تولید کرده و از این داده ها برای آموزش مدل خود، S1-32B، استفاده کردند.

 نکته جالب این است که مدل S1-32B بر پایه مدل متن باز Qwen (متعلق به علی بابا) توسعه یافته است. این یعنی محققان بدون نیاز به سرمایه گذاری سنگین برای ایجاد مدل های عظیم از صفر، توانستند یک مدل بسیار قوی با حداقل هزینه تولید کنند.

 نتیجه: یک مدل در سطح ChatGPT، تنها در 30 دقیقه و با هزینه 50 دلار!

 پس از آموزش، محققان عملکرد S1-32B را با ChatGPT o1 مقایسه کردند و نتایج شگفت انگیزی به دست آمد:

 مدل S1-32B در برخی آزمایش ها حتی تا 27٪ عملکرد بهتری از ChatGPT o1 داشته است!
 فرآیند آموزش فقط 30 دقیقه طول کشیده و هزینه آن تنها 50 دلار بوده است!

 آیا این تکنیک آینده هوش مصنوعی را تغییر خواهد داد؟

 اگرچه OpenAI، Anthropic و Google میلیاردها دلار برای توسعه مدل های هوش مصنوعی هزینه می کنند، اما این روش جدید نشان می دهد که می توان با هزینه ای ناچیز مدل هایی با عملکرد بالا ایجاد کرد. اگر این روش گسترش پیدا کند، آیا آینده ی هوش مصنوعی به سمت مدل های ارزان قیمت تر خواهد رفت؟

 نظر شما چیست؟ آیا این روش می تواند انقلابی در دنیای هوش مصنوعی ایجاد کند؟

 جدیدترین اخبار دنیای فناوری را در رایزمگ دنبال کنید!

0 نظر ثبت شده

ثبت یک نظر

آدرس ایمیل شما منتشر نخواهد شد. فیلدهای الزامی مشخص شده اند *

0 نظر ثبت شده