چهارشنبه, ۶ اسفند , ۱۴۰۴ Wednesday, 25 February , 2026 ساعت تعداد نوشته های امروز : 25×

تیتر اخبار آکادمی

آغاز نام‌نویسی آزمون‌های ورودی سمپاد از 13 اسفند دانشگاه فرهنگیان تا 3 سال آینده مرجع ملی تربیت معلم می‌شود نگاهی به مفهوم و ابزارهای خود افشایی هیجانی دریافت گواهینامه صلاحیت حرفه‌ای برای همه معلمان اجباری شد ماهواره «خیام» کاهش پوشش جنگلی اطراف دریاچه سوها را ثبت کرد ابعاد مختلف روان‌شناسی رقابت رکوردشکنی حضور دانش‌آموزان در اعتکاف؛ مشارکت از 800 هزار نفر گذشت حل مسئله در خواب ممکن شد گزارش تلخ نوجوانان از پشت‌پرده تجربه در اینستاگرام بزرگسالان هم باید مثل کودکان بازی کنند! تأکید وزیر آموزش‌وپرورش بر اولویت‌ها و تقویت آموزش قرآن تکذیب شایعه تعطیلی مدارس منطقه 11 تهران پدیده «ماه خونین» در راه است؛ چگونه ماه‌گرفتگی کامل 3 مارس را رصد کنیم رشد هنرستان‌ها و افزایش گرایش به رشته‌های مهارتی جزئیات جدید از 3 ماهواره در حال ساخت ایران بزرگسالان هم باید بازی کنند نتایج نهایی پذیرش بدون آزمون نوبت بهمن ۱۴۰۴ دانشگاه‌ها اعلام شد واکنش وزیر آموزش‌و‌پرروش به فیلم پخش شده توسط یکی از معلمان پیش‌ثبت‌نام مدارس غیردولتی با 3 شرط و سقف 20 درصد شهریه تعویق دوباره پرتاب آرتمیس 2؛ سفر انسان به ماه به فروردین موکول شد پرتاب 28 استارلینک جدید؛ ماهواره‌های اسپیس‌ایکس به‌ مرز 10 هزار رسید PTSD چیست؟ وقتی گذشته هنوز تمام نشده است/ اینفوگرافیک پنجمین جشنواره کشوری هنری سمپاد برگزار می‌شود ارتقای کیفیت آموزشی در مناطق آزاد با ساخت مدارس جدید شهادت 22 دانش‌آموز و 5 معلم در حوادث دی‌ماه برگزاری اردو آموزشی آمادگی کنکوری بیش از ۱۰۰ دانش آموز هرمزگانی بازگشت 39 هزار بازمانده از تحصیل به مدرسه تأکید وزیر آموزش‌وپرورش بر ارتقای شفافیت در صندوق ذخیره فرهنگیان واریز 7 هزار میلیارد ریال سود به حساب بازنشستگان صندوق ذخیره فرهنگیان حمله پانیک چیست؟ هشدار پلیس فتا درباره ترفند جدید کلاهبرداری در “شاد” استرس چگونه بر عملکرد و سلامت کلیه‌های انسان تأثیر می‌گذارد؟ تعطیلات زمستانه مدارس به زودی تصویب می شود امام جمعه بهاباد: قدرت واقعی ملت‌ها در علم و شناخت نهفته است دانش‌آموزان با تکیه بر علم و ایمان، آینده روشن کشور را رقم می‌زنند ۵۰ برگزیده کنکور سراسری سال ۱۴۰۴ در شهرستان بهاباد تجلیل شدند گروه همسالان؛ سکوی خودشناسی یا تهدیدی برای مبارزه با والدین؟ به خاطر سلامت مغزتان هم که شده یادگیری را متوقف نکنید! اجرای 4 برنامه ویژه قرآنی برای معلمان و دانش‌آموزان در ماه رمضان آموزش هوش مصنوعی به 1 میلیون دانش‌آموز در مدارس غیردولتی انتخاب 32 اثر برگزیده در جشنواره ملی کتاب رشد با مشارکت 300 ناشر رونمایی از نشان افتخار نویسندگان رشد در جشنواره کتاب رشد چالش کتاب کودک و نوجوان از نگاه دبیر شورای عالی انقلاب فرهنگی نقشه جامع ترویج کتابخوانی در مدارس تدوین شود توزیع 60 هزار میلیارد سود بین اعضای موسسه صندوق ذخیره فرهنگیان کاظمی: مصرف کتاب در مدارس حلقه کلیدی زنجیره کتاب‌خوانی است جزییات پرداخت اوراق بازنشستگان آموزش و پرورش هلیوم3؛ 12 سال برق رایگانِ ایران با 25 تن خاک ماه غم مادرانه؛ نگاهی به افسردگی پس از زایمان 15 اسفند؛ تاریخ احتمالی ناسا برای اعزام 4 فضانورد به ماه

گوگل و هاروارد مجموعه داده عظیمی با 1 میلیون کتاب برای آموزش هوش مصنوعی تولید می‌کنند
1404-10-18
شناسه : 12845
بازدید 28
1

مایکروسافت و OpenAI نیز از جمله سرمایه‌گذاران این پروژه خواهند بود که داده‌های آموزشی هوش مصنوعی را در دسترس همه قرار می‌دهد.

ارسال توسط :
پ
پ

شرکت‌های حوزه فناوری برای آموزش مدل‌های هوش مصنوعی خود باید از داده‌هایی استفاده کنند که معمولاً با هزینه زیادیی در اختیار آنها قرار می‌گیرد. به همین دلیل اکنون دانشگاه هاروارد اعلام کرده که می‌خواهد مجموعه داده‌ای را منتشر کند که شامل حدود 1 میلیون کتاب دارای مالکیت عمومی در سبک و زبان‌های مختلف از نویسندگانی مانند «چارلز دیکنز» و «شکسپیر» می‌شود که به دلیل سن آنها دیگر تحت قانون کپی‌رایت قرار نمی‌گیرند.

همانطور که WIRED گزارش می‌دهد، این مجموعه داده هنوز در دسترس قرار نگرفته و مشخص نیست چه زمانی منتشر می‌شود. بااین‌حال گفته می‌شود که شامل کتاب‌هایی است که از پروژه قدیمی اسکن کتاب گوگل، یعنی Google Books مشتق شده‌اند، بنابراین غول فناوری نیز در انتشار آن مشارکت خواهد داشت.

تلاش بزرگ برای ساده‌ترکردن آموزش هوش مصنوعی

گوگل و هاروارد مجموعه داده عظیمی با 1 میلیون کتاب برای آموزش هوش مصنوعی تولید می‌کنند
گوگل و هاروارد مجموعه داده عظیمی با 1 میلیون کتاب برای آموزش هوش مصنوعی تولید می‌کنند

دانشگاه هاروارد اولین بار در ماه مارس سال جاری از این مجموعه داده با عنوان «ابتکار داده‌های سازمان» (IDI) خبر داده بود و برنامه‌ها خود برای ساخت یک «پل ارتباطی قابل اعتماد برای داده‌های قانونی مورد نیاز هوش مصنوعی» را اعلام کرد.

بااین‌حال تاکنون اطلاعات بیشتری از این پروژه منتشر نشده است و فقط گفته شده که مایکروسافت و OpenAI نیز از جمله سرمایه‌گذاران آن خواهند بود.

«گرگ لپرت»، مدیر اجرایی IDI می‌گوید که این مجموعه داده با در دسترس قراردادن چنین اطلاعات عظیمی برای هر کسی (از آزمایشگاه‌های تحقیقاتی گرفته تا استارتاپ‌های هوش مصنوعی) که می‌خواهد مدل زبانی بزرگ (LLM) خود را توسعه بدهد، هدف «همسطح‌کردن حوزه رقابت» را دنبال می‌کند.

ثبت دیدگاه علمی و آموزشی

  • دیدگاه‌های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام‌هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام‌هایی که به غیر از زبان فارسی یا غیرمرتبط باشد منتشر نخواهد شد.