حدیث روز
امام علی (ع) می فرماید : هر کس از خود بدگویی و انتقاد کند٬ خود را اصلاح کرده و هر کس خودستایی نماید٬ پس به تحقیق خویش را تباه نموده است.

سه شنبه, ۲۳ دی , ۱۴۰۴ Tuesday, 13 January , 2026 ساعت تعداد کل نوشته ها : 5840 تعداد نوشته های امروز : 0 تعداد اعضا : 30 تعداد دیدگاهها : 0×
بهتر از DeepSeek؛ هوش مصنوعی جدید شرکت چینی Alibaba معرفی شد [تماشا کنید]
1404-10-18 ساعت: ۴:۱۹
شناسه : 12384
بازدید 4
1

به ادعای Alibaba مدل هوش مصنوعی Qwen2.5-Max از مدل تحسین‌شده DeepSeek-V3 بهتر است.

ارسال توسط :
پ
پ

شرکت فناوری چینی Alibaba نسخه جدیدی از مدل هوش مصنوعی Qwen 2.5 خود رونمایی کرد که ادعا می‌کند از مدل تحسین‌شده DeepSeek-V3 بهتر است.

براساس اعلام Alibaba، مدل جدید Qwen2.5-Max در بنچمارک‌هایی مانند Arena-Hard، LiveCodeBench و GPQA-Diamond از DeepSeek V3 بهتر عمل می‌کند. در دیگر بنچمارک‌ها نیز تقریباً هم‌سطح مدل دیپ‌سیک است. همچنین این شرکت می‌گوید که مدلش از GPT-4o و Llama-3.1-405B در بخش‌های مختلفی عملکرد بهتری دارد.

اکنون می‌توانید به API این مدل در Alibaba Cloud دسترسی داشته باشید. همچنین این مدل قدرتمند در Qwen Chat منتشر شده است که در آن می‌توانید عکس و ویدیو نیز تولید کنید.

هوش مصنوعی جدید Alibaba

مدل Qwen2.5-Max یک مدل MoE (ترکیب متخصصان) در مقیاس بزرگ است که بر روی بیش از 20 تریلیون توکن و با روش‌های تنظیم دقیق نظارت‌شده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است. درکل رویکرد MoE کمک می‌کند تا هوش مصنوعی بدون خوشه‌های GPU عظیم به دست آید و هزینه‌های زیرساخت را 40 تا 60 درصد نسبت به سایر رویکردهای مدل‌های زبانی بزرگ کاهش داد.

مدل جدید علی‌بابا و البته DeepSeek نشان می‌دهند که به‌جای سرمایه‌گذاری هنگفت در ایجاد مراکز داده و خوشه‌های GPU بزرگ می‌توان با بهینه‌سازی معماری هوش مصنوعی مدل‌هایی کم‌هزینه و کارآمد توسعه داد. عملکرد قوی این مدل در تولید کد (با امتیاز 38.7 درصد در بنچمارک LiveCodeBench) و استدلال (با امتیاز 89.4 درصد در Arena-Hard) نشان می‌دهد می‌توان بسیاری از کاربردهای هوش مصنوعی مولد را با توان پردازشی کمتری مدیریت کرد.

البته فقط عملکرد خوب در بنچمارک‌ها کافی نیست تا یک مدل هوش مصنوعی در بین کاربران محبوب شود. رعایت حریم خصوصی داده‌های کاربران، ارائه API قابل‌اطمینان و پشتیبانی طولانی‌مدت نیز از عوامل تأثیرگذار هستند. درکل اکنون باید دید که آیا مدل جدید علی‌بابا می‌تواند در رقابت با دیپ‌سیک و شرکت‌های آمریکایی عملکرد قابل‌قبولی داشته باشد یا خیر.

ثبت دیدگاه

  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.