چت‌بات جدید علی‌بابا عکس‌ها را می‌فهمد و مسائل ریاضی را حل می‌کند

شرکت چینی علی‌بابا چت‌بات هوش مصنوعی جدیدی معرفی کرده است که توانایی درک تصاویر را دارد و مسائل ریاضی موجود در تصاویر را حل می‌کند.

31777 علی‌بابا، غول صنعت تجارت الکترونیک در چین، روز گذشته دو مدل هوش مصنوعی جدید منتشر کرد که یکی از آن‌ها توانایی «درک تصاویر» را دارد و دیگری «مکالمات پیچیده‌تری» نسبت‌به نسخه‌های قبلی انجام می‌دهد. چت‌بات جدید علی‌بابا درحالی رونمایی می‌شود که تب‌و‌تاب هوش مصنوعی هنوز نخوابیده و شرکت‌های بزرگ برای رهبری در این حوزه رقابت شدیدی به‌راه انداخته‌اند.

علی‌بابا می‌گوید دو مدل هوش مصنوعی جدید Qwen-VL و Qwen-VL-Chat متن‌باز خواهند بود؛ این یعنی پژوهشگران و شرکت‌های مختلف در سراسر دنیا می‌توانند از این مدل‌ها برای ساخت اپلیکیشن‌های اختصاصی بر پایه‌ی هوش مصنوعی استفاده کنند. استفاده از این مدل‌ها باعث صرفه‌جویی در زمان و هزینه‌ی عملیاتی شرکت‌ها می‌شود.

مدل زبانی Qwen-VL می‌تواند به سؤالات تشریحی و نامحدود درباره‌ی تصاویر مختلف پاسخ دهد و توضیح متنی برای تصاویر بنویسد. این در حالی است که Qwen-VL-Chat روی «تعاملات پیچیده‌تر» با کاربر متمرکز شده است؛ نظیر مقایسه‌ی چندین ورودی تصویری و پاسخ به چند سری سؤال. چت‌بات Qwen-VL-Chat همچنین می‌تواند مقاله بنویسد و تصاویر جدیدی بر اساس تصاویر ورودی ایجاد کند. Qwen-VL-Chat توانایی حل مسائل ریاضی موجود در تصاویر را نیز دارد.

از زمان افزایش محبوبیت هوش مصنوعی در اواخر سال ۲۰۲۲، فناوری هوش مصنوعی مولد بیشتر روی پاسخ به متن تمرکز داشته است. نسخه‌ی جدید ChatGPT نیز می‌تواند همچون Qwen-VL-Chat تصاویر را بفهمد و در قالب متن پاسخ دهد. ChatGPT که اواخر سال گذشته در دسترس قرار گرفت، چت‌باتی است که اینترنت را زیرورو کرد.

دو مدل هوش مصنوعی جدید علی‌بابا از روی مدل زبانی بزرگ این شرکت ساخته شده‌اند که Tongyi Qianwen نام دارد و اوایل سال ۲۰۲۳ معرفی شد. مدل زبانی بزرگ (LLM) نوعی مدل هوش مصنوعی است که بر پایه‌ی حجم بسیار زیادی داده توسعه داده شده و در چت‌بات‌ها کاربرد دارد.

۵
از ۵
۱۱ مشارکت کننده