هوش مصنوعی DeepSeek چیست؟ رقیب رایگان و بدون تحریم ChatGPT
استارتاپ چینی (DeepSeek AI)درحالرشدی است که بهدلیل پیشرفتهای خود در زمینه هوش مصنوعی موردتوجه جهان قرار گرفته است. شرکت چینی به عقیده بسیاری از کارشناسان یکی از قدرتمندترین مدلهای هوش مصنوعی رایگان با نام دیپسیک را منتشر کرده است که در ادامه این مطلب آن را معرفی خواهیم کرد.
به گزارش سایت دیده بان ایران؛ DeepSeek AI استارتاپ چینی درحالرشدی است که بهدلیل پیشرفتهای خود در زمینه هوش مصنوعی موردتوجه جهان قرار گرفته است. شرکت چینی به عقیده بسیاری از کارشناسان یکی از قدرتمندترین مدلهای هوش مصنوعی رایگان با نام دیپسیک را منتشر کرده است که در ادامه این مطلب آن را معرفی خواهیم کرد.
جدیدترین نسخه از مدل هوش مصنوعی این شرکت که DeepSeek V۳ نام دارد، اواخر ۲۰۲۴ منتشر شد و توسعهدهندگان میتوانند شخصیسازیشده آن را دانلود و در برنامههای خود استفاده کنند. همانطور که اشاره کردیم، مدلهای دیپسیک کاملاً متنباز هستند؛ توسعهدهندگان میتوانند آنها را دانلود کنند و برای استفاده در برنامهها و پروژههای خود تغییر دهند.
این مدل هوش مصنوعی از معماری نوآورانهای بهره میبرد که در ادامه به آن میپردازیم. همین معماری باعث شده در مقایسه با بسیاری از مدلهای هوش مصنوعی قدرتمند امروزی از شرکتهایی مانند متا و OpenAI که برای استفاه از امکانات پیشرفته آنها باید پول بپردازید، قدرتمندتر باشد.
قابلیتهای هوش مصنوعی DeepSeek V۳ و برتری آن نسبت به رقبا
دیپ سیک میگوید که مدل پرچمدار آن میتواند طیف وسیعی از وظایف و کارهای مبتنیبر متن، نظیر کدنویسی، ترجمه و نگارش مقاله و ایمیل را انجام دهد. همچنین در آموزش آن از پردازشگرهای گرافیکی H۸۰۰ مخصوص چین از شرکت انویدیا استفاده شده است.
دیپ سیک با تستهای خود اعلام کرده DeepSeek V۳ هم از مدلهای قابلدانلود و رایگان هم از مدلهای غیررایگان که فقط از طریق API در دسترس هستند، بهتر عمل میکند. به گفته این شرکت و طبق تصویر زیر مدل هوش مصنوعی آن در کدنویسی از مدلهای دیگر مانند Llama ۳.۱ متعلق به متا، GPT-۴o از OpenAI و Qwen ۲.۵، ۷۲B شرکت چینی Alibaba بهتر عمل کرده است.
دیپ سیک ادعا کرده DeepSeek V۳ با مجموعه دادهای از ۱۴ تریلیون و ۸۰۰ میلیارد توکن آموزش دیده است. برای درک بهتر این موضوع باید گفت هر یکمیلیون توکن معادل حدود ۷۵۰ هزار کلمه است. DeepSeek V۳ از نظر اندازه نیز بسیار وسیع است و از ۶۷۱ میلیارد پارامتر پشتیبانی میکند (پارامترها متغیرهای داخلی هستند که مدلهای برای پیشبینی یا تصمیمگیری از آنها استفاده میکنند). با این شرایط، هوش مصنوعی این شرکت تقریباً ۱.۶ برابر از Llama ۳.۱۴۰۵B شرکت متا بزرگتر است که از ۴۰۵ میلیارد پارامتر پشتیبانی میکند.
نکته جالب دیگر اینکه چینیها مدل پرچمدار خود را فقط در ۲ ماه و با هزینهای نزدیک به ۵.۵۸ میلیون دلار آموزش دادهاند؛ بنابراین در مقایسه با شرکتهای بزرگی مانند متا و OpenAI این شرکت زمان و منابع کمتری برای مدل هوش مصنوعی خود صرف کرده است.
معماری نوآورانه DeepSeek V۳
دیپ سیک برای توسعه مدل خود از معماری بهینهشدهای (با نام ترکیبی-از-متخصصان یا MoE) استفاده کرده است که نیاز آن به قدرت محاسباتی گسترده و سختافزارهای قدرتمند را کاهش میدهد. این معماری را تیم (متخصص) از سیستمهای هوش مصنوعی تخصصی در نظر بگیرید که در آن هر بهاصطلاح «متخصص» شبکه عصبی خود را دارد و برای انجام وظایف مرتبط با خود فعال میشوند.
برای آزمایش نحوه عملکرد هوش مصنوعی DeepSeek نیز در ادامه به چند مثال اشاره کردهایم. در اولین مورد، از این مدل خواستهشده شرح مفصلی از شخصیتی فانتزی (ملکهای که مقابل امپراتوری شیطانی مقاومت میکند) بنویسد. سپس DeepSeek V۳ با انتخاب نام، عنوان، سن و ظاهر این شخصیت داستانی فانتزی نوشته است:
برای آزمایش مهارت این مدل در کدنویسی نیز طبق مثال زیر کد جاوا اسکریپت معیوب به آن داده شده است. همانطور که در تصویر زیر مشاهده میکنید، دیپسیک بلافاصله مشکل را متوجه شده و ضمن توضیح آن، کد اصلاحشده را برای کاربر ارسال کرده است:
در مثال زیر، توانایی DeepSeek V۳ در بهرهوری آزمایش شده است. در آن کاربر از هوش مصنوعی خواسته دستور کار مختصری برای جلسهای درباره راهاندازی محصولی جدید تهیه کند. سپس هوش مصنوعی فهرست موضوعات پیشنهادی خود را که میتوان در جلسه مطرح کرد، همراه مدت برنامهریزیشده برای آنها به کاربر ارائه کرده است:
درکل، درباره عملکرد این مدل گفته شده DeepSeek طیف گستردهای از وظایف مانند نوشتن و رفع مشکلات کدهای پیچیده را بهراحتی انجام میدهد. همچنین این مدل میتواند لحن و سبک نوشتههای خود را براساس موضوعات مختلف تنظیم کند، اما DeepSeek هم مانند بسیاری از مدلهای هوش مصنوعی دیگر در پاسخ به موضوعات بسیار خاص ممکن است اطلاعات اشتباه ارائه کند. همچنین ظاهراً DeepSeek V۳ تمایلی به ارائه پاسخ درباره موضوعات تاریخی حساس ندارد.
دسترسی به هوش مصنوعی DeepSeek V۳
هماکنون رایگان میتوانید از نسخه وب هوش مصنوعی پرچمدار چینی DeepSeek V۳ استفاده کنید. البته برای استفاده از آن به حساب کاربری نیاز دارید که از طریق حساب گوگل نیز میتوان آن را ایجاد کرد. محیط کاربری این سرویس شباهت زیادی به ChatGPT دارد و میتوانید پس از ورود به حساب خود با آن گفتوگو کنید. نکته قابلتوجه اینکه این مدل از زبان فارسی نیز پشتیبانی میکند و کاربران ایرانی را تحریم نکرده است.
افزونبر نسخه وب، درحالحاضر اپلیکیشن DeepSeek برای اندرویدو iOS نیز موجود است.
دوران حرفهای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمیگرده؛ مسیری که با سختافزار شروع شد، با نرمافزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا میکنه. من جوادم و نزدیک به سه دهه از عمرم میگذره و علاوه بر دنیای فناوری عاشق فیلموسینما، موسیقی کلاسیکراک و رئال مادریدم.