کسبوکارها و سازمانهای بخش عمومی در سرتاسر جهان در حال توسعه عوامل هوش مصنوعی هستند تا قابلیتهای نیروهای کاری را که به اطلاعات بصری تعداد فزایندهای از دستگاهها – از جمله دوربینها، حسگرهای اینترنت اشیا و وسایل نقلیه متکی هستند، افزایش دهند.
برای پشتیبانی از کار خود، طرح جدید NVIDIA AI برای جستجو و خلاصهسازی ویدیو، توسعه دهندگان را در تقریباً هر صنعتی قادر میسازد تا عوامل هوش مصنوعی بصری بسازند که محتوای ویدیو و تصویر را تجزیه و تحلیل میکنند. این عوامل می توانند به سوالات کاربران پاسخ دهند، خلاصه ایجاد کنند و هشدارها را برای سناریوهای خاص فعال کنند.
Blueprint بخشی از NVIDIA Metropolis، مجموعهای از ابزارهای توسعهدهنده برای ساخت برنامههای هوش مصنوعی بینایی است.
یکپارچهکنندههای سیستمهای جهانی و ارائهدهندگان راهحلهای فناوری، از جمله Accenture، Dell Technologies، و Lenovo، طرحهای هوش مصنوعی NVIDIA را برای جستجوی بصری و خلاصهسازی به شرکتها و شهرهای سراسر جهان ارائه میکنند و موج بعدی برنامههای هوش مصنوعی را راهاندازی میکنند که میتوانند برای افزایش بهرهوری و بهرهوری به کار گرفته شوند. ایمنی در کارخانه ها و انبارها، مغازه ها، فرودگاه ها، تقاطع های ترافیکی و غیره.
NVIDIA AI Blueprint که پیش از کنگره جهانی شهرهای هوشمند اعلام شد، مجموعه کاملی از نرمافزارهای بهینهسازی شده برای ساخت و استقرار عوامل مولد مبتنی بر هوش مصنوعی را در اختیار توسعهدهندگان محاسبات بصری قرار میدهد که میتوانند حجم عظیمی از جریانهای ویدیوی زنده یا آرشیو دادهها را دریافت و درک کنند.
کاربران میتوانند این عوامل هوش مصنوعی بصری را با استفاده از اعلانهای زبان طبیعی به جای کدهای سختگیرانه سفارشی کنند و مانع استقرار دستیارهای مجازی در سراسر صنایع و برنامههای شهر هوشمند را کاهش دهند.
NVIDIA AI Blueprint از مدل های زبان بینایی استفاده می کند
عاملهای هوش مصنوعی بصری توسط مدلهای زبان بینایی (VLMs)، دستهای از مدلهای هوش مصنوعی مولد هستند که بینایی رایانهای را با درک زبان برای تفسیر دنیای فیزیکی و انجام وظایف منطقی ترکیب میکنند.
NVIDIA AI Blueprint را می توان برای جستجو و خلاصه کردن ویدئو با استفاده از ریزسرویس NVIDIA NIM برای VLM هایی مانند NVIDIA VILA، LLMs مانند Meta's Llama 3.1 405B، و مدل های AI برای پاسخگویی به سوالات با شتاب GPU و تولید پیشرفته برای بازنگری زمینه آگاه پیکربندی کرد. توسعه دهندگان می توانند به راحتی VLM ها، LLM ها و سایر پایگاه های داده گراف را با استفاده از پلتفرم NVIDIA NeMo برای محیط ها و موارد استفاده منحصر به فرد خود تعویض و تنظیم کنند.
استفاده از NVIDIA AI Blueprint می تواند ماه ها تلاش توسعه دهندگان را برای بررسی و بهینه سازی مدل های هوش مصنوعی مولد برای برنامه های شهر هوشمند صرفه جویی کند. این کارت گرافیک که بر روی پردازندههای گرافیکی NVIDIA در لبه، در محل یا در فضای ابری مستقر شده است، میتواند به طور چشمگیری روند پردازش بایگانیهای ویدیویی را برای شناسایی لحظات کلیدی سرعت بخشد.
در یک محیط انبار، یک عامل هوش مصنوعی ایجاد شده با استفاده از این گردش کار می تواند در صورت نقض پروتکل های ایمنی به کارگران هشدار دهد. در تقاطعهای شلوغ، یک عامل هوش مصنوعی میتواند برخوردهای ترافیکی را شناسایی کرده و گزارشهایی را برای کمک به تلاشهای واکنش اضطراری ایجاد کند. در زیرساختهای عمومی، کارکنان تعمیر و نگهداری میتوانند از عوامل هوش مصنوعی بخواهند فیلمهای هوایی را بررسی کنند و جادهها، خطوط قطار یا پلهای رو به وخامت را شناسایی کنند تا از تعمیر و نگهداری پیشگیرانه پشتیبانی کنند.
علاوه بر فضاهای هوشمند، عوامل هوش مصنوعی بصری همچنین می توانند برای خلاصه کردن ویدیوها برای افراد دارای نقص بینایی، تولید خودکار خلاصه رویدادهای ورزشی و کمک به طبقه بندی مجموعه داده های بصری عظیم برای آموزش سایر مدل های هوش مصنوعی استفاده شوند.
گردش کار جستجو و خلاصهسازی ویدیو به مجموعهای از نقشههای هوش مصنوعی NVIDIA میپیوندد که ایجاد آواتارهای دیجیتالی مبتنی بر هوش مصنوعی، ایجاد دستیارهای مجازی برای خدمات مشتری شخصیسازی شده و استخراج بینشهای سازمانی از دادههای PDF را آسان میکند.
برنامههای NVIDIA AI Blueprints برای توسعهدهندگان رایگان است و میتوانند آنها را امتحان و دانلود کنند و میتوانند در تولید در مراکز داده و ابرهای شتابدهنده با استفاده از NVIDIA AI Enterprise، یک پلتفرم نرمافزار جامع که خطوط لوله علم داده را تسریع میکند و توسعه و استقرار هوش مصنوعی مولد را تسهیل میکند، به کار گرفته شود.
عوامل هوش مصنوعی بینش هایی را از انبارها به پایتخت های جهانی ارائه می دهند
مشتریان سازمانی و بخش عمومی نیز میتوانند از مجموعه کامل نقشههای هوش مصنوعی NVIDIA با کمک اکوسیستم شریک NVIDIA بهرهمند شوند.
شرکت خدمات حرفه ای جهانی Accenture NVIDIA AI Blueprints را در Accenture AI Refinery ادغام کرده است که بر اساس NVIDIA AI Foundry ساخته شده است و مشتریان را قادر می سازد تا مدل های AI سفارشی آموزش دیده بر روی داده های سازمانی را توسعه دهند.
یکپارچهکنندههای سیستمهای جهانی در آسیای جنوب شرقی – از جمله ITMAX مالزی و FPT ویتنام – در حال ساخت عوامل هوش مصنوعی بر اساس جستجوی ویدیویی و خلاصهسازی طرحهای NVIDIA AI برای شهر هوشمند و برنامههای حمل و نقل هوشمند هستند.
توسعه دهندگان همچنین می توانند با محاسبات، شبکه و نرم افزار ارائه شده توسط سازندگان سرور جهانی، طرح های NVIDIA AI را بر روی پلتفرم های NVIDIA AI ایجاد و استقرار دهند.
دل از رویکردهای VLM و پروکسی با پلتفرم Dell NativeEdge برای بهبود برنامههای هوش مصنوعی موجود و ایجاد قابلیتهای جدید با قابلیت هوش مصنوعی استفاده میکند. معماریهای مرجع Dell AI Factory Dell با NVIDIA و NVIDIA AI Blueprint برای جستجو و خلاصهسازی ویدیو، از قابلیتهای VLM در گردشهای کاری AI سفارشی برای مراکز داده، لبه و موارد استفاده چندرسانهای داخلی پشتیبانی میکند.
بلوپرینتهای هوش مصنوعی انویدیا نیز در راهحلهای هوش مصنوعی هیبریدی لنوو که توسط انویدیا ارائه میشوند، ادغام شدهاند.
شرکتهایی مانند K2K، ارائهدهنده برنامههای کاربردی شهر هوشمند در اکوسیستم NVIDIA Metropolis، از NVIDIA AI Blueprint برای ساخت عوامل هوش مصنوعی استفاده میکنند که دوربینهای ترافیک زنده را در زمان واقعی تجزیه و تحلیل میکنند. این امر به مقامات شهری امکان میدهد درباره فعالیتهای خیابانی سؤال بپرسند و توصیههایی در مورد راههای بهبود عملیات دریافت کنند. این شرکت همچنین با مدیران ترافیک در پالرموی ایتالیا برای استقرار عوامل هوش مصنوعی با استفاده از میکروسرویسهای NIM و نمودارهای هوش مصنوعی NVIDIA کار میکند.
با بازدید از غرفه NVIDIA در کنفرانس جهانی شهرهای هوشمند که تا 7 نوامبر در بارسلون برگزار می شود، درباره طرح NVIDIA AI برای جستجو و خلاصه سازی ویدیو بیشتر بیاموزید.
یاد بگیرید که چگونه یک عامل هوش مصنوعی بصری ایجاد کنید و با طرح کلی شروع کنید.
منبع: https://blogs.nvidia.com/blog/video-search-summarization-ai-agents/