خبر " تحقیق اپل: مدل‌های زبانی می‌توانند با داده‌های صوتی و حرکتی تشخیص دهند چه کار می‌کنید " | مجله آموزشی آکادمی علمی eaedu | مجله آموزشی آکادمی علمی

مدل‌های زبانی بزرگ می‌توانند با داده‌های کمتر نوع فعالیت کاربر را مشخص کنند

در این تحقیق مشخص شد که مدل‌های زبانی بزرگ توانایی بسیار قابل‌توجهی در استنباط فعالیت‌های کاربر از طریق سیگنال‌های صوتی و حرکتی دارند، حتی اگر به‌صورت خاص برای این کار آموزش ندیده باشند. همچنین وقتی تنها یک مثال به آنها داده می‌شود، دقتشان حتی بیشتر هم می‌شود.

یک تفاوت مهم این است که در این مطالعه، LLM خود فایل صوتی واقعی را دریافت نکرده بود، بلکه توضیحات کوتاه متنی تولیدشده توسط مدل‌های صوتی و یک مدل حرکتی مبتنی بر IMU به آن داده شد. IMU یا دستگاه سنجش لختی (اینرسی) حرکت را از طریق داده‌های شتاب‌سنج و ژیروسکوپ دنبال می‌کند.

در این مقاله، محققان توضیح داده‌اند که از Ego4D (یک مجموعه داده عظیم از رسانه‌هایی که با دیدگاه اول‌شخص ضبط شده) استفاده کرده‌اند. این داده‌ها شامل هزاران ساعت اطلاعات از محیط‌ها و موقعیت‌های واقعی از کارهای خانه گرفته تا فعالیت‌های فضای باز هستند.

محققان داده‌های صوتی و حرکتی را از طریق مدل‌های کوچک‌تر عبور دادند که زیرنویس متنی و پیش‌بینی کلاس‌ها را تولید می‌کردند، سپس این خروجی‌ها را به مدل‌های مختلف LLM مانند جمینای ۲.۵ پرو و Qwen-32B دادند تا ببینند چقدر می‌توانند فعالیت‌ها را شناسایی کنند.

اپل عملکرد این مدل‌ها را در دو وضعیت مختلف مقایسه کرد؛ یکی زمانی که لیست ۱۲ فعالیت ممکن برای انتخاب در اختیارشان قرار گرفت و دیگری زمانی که هیچ گزینه‌ای داده نشد.

محققان در پایان اشاره می‌کنند که نتایج این مطالعه اطلاعات جالبی درباره نحوه ترکیب چند مدل برای تحلیل داده‌های فعالیت و سلامت ارائه می‌دهد، به‌ویژه در مواردی که داده‌های خام سنسورها به تنهایی کافی نیستند تا تصویر واضحی از فعالیت کاربر ارائه دهند.

مجله آموزشی آکادمی علمی EAedu از سال ۱۳۸۱ با انتشار اخبار و مقالات علمی و آموزشی، آموزش‌های تخصصی و مهارت‌محور را به‌صورت سریع، جذاب و به‌روز ارائه می‌دهد و با رویکردی کاربردی، مسیر پیوند دانش‌آموزان، دانشجویان و علاقه‌مندان به یادگیری را با نیازهای بازار کار هموار می‌کند.

تیتر اخبار آکادمی

تحقیق اپل: مدل‌های زبانی می‌توانند با داده‌های صوتی و حرکتی تشخیص دهند چه کار می‌کنید

مدل‌های زبانی بزرگ می‌توانند با داده‌های کمتر نوع فعالیت کاربر را مشخص کنند

اخبار و مقالات علمی و آموزشی مرتبط

دستاورد پژوهشگران دانشگاه تهران در حوزه امنیت هوش مصنوعی

روبات انسان نما به یک کودک لگد زد

انویدیا با غول‌های فناوری کره جنوبی قرارداد بست

روبات انسان نما به قله ۶۲۰۰ متری صعود کرد!

ثبت دیدگاه علمی و آموزشی

دستاورد پژوهشگران دانشگاه تهران در حوزه امنیت هوش مصنوعی

روبات انسان نما به یک کودک لگد زد

انویدیا با غول‌های فناوری کره جنوبی قرارداد بست

روبات انسان نما به قله ۶۲۰۰ متری صعود کرد!

روبات انسان نما فروشگاه ۲۴ ساعته را می گرداند

محقق ایرانی پمپ مینیاتوری برای نرم روبات‌ها ابداع کرد

روبات انسان نمای چینی کارگر آزمایشی انبار می شود

علی بابا هوش مصنوعی برای روبات ها ارائه کرد

روبات ایتالیایی به کمک بیماران ALS آمد

مذاکره با دستگاه‌ها برای توسعه صادرات محصولات فریلنسرها

اخبار تحصیل

رنجبر: ۲ زندانی خراسان شمالی در کنکور کارشناسی ارشد شرکت کردند

آزمون کارشناسی ارشد ۱۴۰۵ در مشهد

رقابت ۶۵۰ هزار نفری در کنکور ارشد؛ سهم یک‌درصدی سمنان از ماراتن علمی

علم فناوری اطلاعات

معاون اجرایی رییس جمهور: دولت بیشترین ضرر را از قطع اینترنت متحمل می‌شود

اینترنت «همراه اول» وصل شد؟

اینترنت «ایرانسل» وصل شد؟

عضو اتاق بازرگانی: اینترنت تجار هنوز وصل نشده

جدیدترین مقالات و اخبار روز علمی

متفاوت‌ترین کتابفروشی اروپا که سکوت را فریاد می‌زند

ذهن آرام، تصمیم‌های بهتر؛ چگونه شتاب افکار را مهار کنیم؟/ اینفوگرافیک

صلح با چه کسی؟ دوقطبی‌سازی بدهنگام یاران خاتمی

طحان نظیف: مدرسه و بیمارستان از افسارگسیختگی آمریکا در امان نیستند

شکارچی: مدیریت تنگه هرمز به قبل از ۹ اسفند بازنخواهد گشت

دیدگاه‌های علمی و آموزشی اخیر

Davood