OpenAI، مدل جدیدی از هوش مصنوعی نامگذاری شد o1 اولین مدل این استارتاپ از سری مدل های ویژگی را معرفی کرداستدلال» برای پاسخ به سوالات پیچیده تر. همچنین یک نسخه کوچکتر و ارزانتر از این نامیده می شود o1-mini نیز منتشر می شود. در شایعات پیرامون این استارت آپ از این مدل با نام «توت فرنگی» یاد شده است.
o1 گام مهمی برای OpenAI به سمت هدف ایجاد مدل های انسان مانند هوش مصنوعی است. این مدل در نوشتن کد و حل مسائل چند مرحله ای بهتر از مدل های قبلی عمل می کند، اما نسبت به GPT-4o گرانتر و کندتر است. OpenAI همچنین به o1 به عنوان نسخه “پیش نمایش” اشاره می کند تا بر ماهیت نوپای آن تأکید کند.
ویدیوی زیر توانایی o1 را برای تولید کد بازی ویدیویی از طریق یک دستور متنی ساده نشان میدهد:
قیمت و زمان دسترسی به مدل o1
کاربران ChatGPT Plus و Team اکنون به o1 و o1-mini دسترسی دارند و کاربران Enterprise و Edu اوایل هفته آینده دسترسی خواهند داشت. OpenAI همچنین قصد دارد o1-mini را برای همه کاربران رایگان ChatGPT در دسترس قرار دهد، اما هنوز زمان آن را اعلام نکرده است.
برای توسعه دهندگان، این مدل قیمت نسبتاً بالایی دارد و API آن برای هر 1 میلیون توکن ورودی در دسترس است. 15 دلار و به ازای هر 1 میلیون توکن خروجی 60 دلار هزینه دارد. در مقایسه، GPT-4o برای 1 میلیون توکن ورودی 5 دلار و برای 1 میلیون توکن خروجی 15 دلار هزینه دارد.

علاوه بر این، روش آموزش این مدل با مدل های قبلی OpenAI متفاوت است که البته این استارت آپ توضیح دقیقی از جزئیات آن ارائه نکرده است. جری ترک، رئیس تحقیقات OpenAI، می گوید که o1 با استفاده از یک الگوریتم بهینه سازی کاملاً جدید و مجموعه داده آموزشی جدیدی که به طور خاص برای آن ایجاد شده است، آموزش داده شده است.
در واقع برای o1 از تکنیکی به نام «یادگیری تقویتی» استفاده شد که باعث می شود مدل به تنهایی مشکلات را با پاداش و تنبیه حل کند. سپس از یک “زنجیره فکر” برای پردازش سوالات استفاده می کند، مشابه اینکه مردم چگونه مشکلات را در یک بررسی گام به گام پردازش می کنند.
با این روش آموزشی جدید، OpenAI می گوید که این مدل با دقت بیشتری کار می کند و توهمات کمتری دارد.
ویدئوی زیر توانایی استدلال این مدل را نشان می دهد:
با توجه به توضیحات OpenAI، مهم ترین چیزی که این مدل جدید را از GPT-4o متمایز می کند، توانایی آن در حل مسائل پیچیده مانند کدنویسی و ریاضیات است که نسبت به مدل های قبلی بسیار بهتر عمل می کند و همچنین دلایل آن را توضیح می دهد. با این حال، o1 به اندازه GPT-4o در بسیاری از مناطق توانایی ندارد. o1 با دانش دنیای واقعی به خوبی عمل نمی کند و همچنین توانایی وب گردی یا پردازش فایل ها و تصاویر را ندارد.