رمزگشایی چگونه هوش مصنوعی می تواند علم داده را تسریع کند

رمزگشایی چگونه هوش مصنوعی می تواند علم داده را تسریع کند

یادداشت سردبیر: این پست بخشی از سری رمزگشایی هوش مصنوعیکه هوش مصنوعی را با در دسترس‌تر کردن فناوری، نمایش سخت‌افزار، نرم‌افزار، ابزار و شتاب‌دهنده‌های جدید برای کاربران ایستگاه‌های کاری RTX و رایانه‌های شخصی، ابهام زدایی می‌کند.

در سراسر صنایع، هوش مصنوعی نوآوری را هدایت می‌کند و کارآیی‌ها را ممکن می‌سازد – اما برای به‌کارگیری پتانسیل کامل آن، این فناوری باید بر روی حجم عظیمی از داده‌های با کیفیت بالا آموزش داده شود.

دانشمندان داده نقش کلیدی در تهیه این داده ها ایفا می کنند، به ویژه در مناطق خاص دامنه که در آن داده های تخصصی و اختصاصی اغلب برای افزایش قابلیت های هوش مصنوعی ضروری است.

NVIDIA برای کمک به دانشمندان داده در رسیدگی به نیازهای افزایش بار کاری، اعلام کرد که RAPIDS cuDF، کتابخانه‌ای که به کاربران امکان می‌دهد راحت‌تر با داده‌ها کار کنند، کتابخانه نرم‌افزار پانداها را بدون هیچ تغییری در کد سرعت می‌بخشد. Pandas یک کتابخانه تجزیه و تحلیل و دستکاری داده انعطاف پذیر، قدرتمند و محبوب برای زبان برنامه نویسی پایتون است. با cuDF، دانشمندان داده اکنون می توانند از پایگاه کد مورد علاقه خود بدون به خطر انداختن سرعت پردازش داده استفاده کنند.

سخت‌افزار و فناوری‌های NVIDIA RTX AI همچنین می‌توانند سرعت پردازش داده‌ها را فراهم کنند. این شامل پردازنده‌های گرافیکی قدرتمندی است که عملکرد محاسباتی مورد نیاز برای تسریع سریع و کارآمد هوش مصنوعی در هر سطح را فراهم می‌کند – از گردش‌های کاری علم داده تا آموزش و سفارشی‌سازی مدل‌ها در رایانه‌های شخصی و ایستگاه‌های کاری.

گلوگاه در علم داده

رایج ترین فرمت داده ها، داده های جدولی است که در ردیف ها و ستون ها سازماندهی می شوند. مجموعه داده های کوچکتر را می توان با استفاده از ابزارهای صفحه گسترده مانند اکسل مدیریت کرد، با این حال، مجموعه داده ها و خطوط لوله مدل سازی حاوی ده ها میلیون ردیف معمولاً به کتابخانه های چارچوب داده در زبان های برنامه نویسی مانند پایتون متکی هستند.

بخوانید:   Rift Apart در ماه جولای برای رایانه شخصی عرضه می شود - WGB، صفحه اصلی بررسی های عالی

پایتون یک انتخاب محبوب برای تجزیه و تحلیل داده است، در درجه اول به دلیل کتابخانه پانداها، که دارای یک API آسان برای استفاده است. با این حال، با افزایش اندازه داده‌ها، پانداها در مورد سرعت پردازش و کارایی در سیستم‌های فقط CPU با مشکلاتی مواجه می‌شوند. این کتابخانه همچنین در مدیریت مجموعه داده‌هایی که حاوی متن متراکم هستند، مشکل ضعیفی دارد، که یک نوع داده مهم برای مدل‌های زبان بزرگ است.

هنگامی که نیازهای داده از توانایی های پاندا فراتر می رود، دانشمندان داده با یک معضل مواجه می شوند: تحمل جدول زمانی پردازش آهسته یا برداشتن گام پیچیده و گران قیمت به سمت ابزارهای کارآمدتر اما کمتر کاربرپسند.

تسریع در پیش پردازش خطوط لوله با RAPIDS cuDF

RAPIDS cuDF کتابخانه محبوب پانداها را تا 100 برابر در رایانه‌های شخصی مجهز به هوش مصنوعی و ایستگاه‌های کاری مجهز به پردازنده‌های RTX سرعت می‌بخشد.

با RAPIDS cuDF، دانشمندان داده می توانند از پایگاه کد مورد علاقه خود بدون به خطر انداختن سرعت پردازش استفاده کنند.

RAPIDS یک مجموعه منبع باز از کتابخانه های پایتون با شتاب GPU است که برای بهینه سازی خطوط لوله علوم داده و تجزیه و تحلیل طراحی شده است. cuDF یک کتابخانه DataFrame GPU است که یک API پاندا مانند برای بارگذاری، فیلتر کردن و دستکاری داده ها ارائه می دهد.

با استفاده از «حالت شتاب پانداها» cuDF، دانشمندان داده می‌توانند کد پانداهای موجود خود را روی GPUها اجرا کنند تا از پردازش موازی قدرتمند بهره ببرند، در حالی که اطمینان حاصل کنند که کد در صورت لزوم به پردازنده‌ها تغییر می‌کند. این سازگاری عملکرد پیشرفته و قابل اعتمادی را ارائه می دهد.

آخرین نسخه cuDF از مجموعه داده های بزرگتر و میلیاردها ردیف داده متن جدولی پشتیبانی می کند. این به دانشمندان داده اجازه می دهد تا از کد پانداها برای پیش پردازش داده ها برای موارد استفاده از هوش مصنوعی مولد استفاده کنند.

بخوانید:   نینتندو موفق شد تا زمان عرضه اشک های بزرگ ترین راز پادشاهی را نگه دارد

علم داده را در ایستگاه های کاری و رایانه های شخصی هوش مصنوعی مجهز به NVIDIA RTX تسریع کنید

طبق یک مطالعه اخیر، 57٪ از دانشمندان داده از منابع داخلی مانند رایانه های شخصی، رایانه های رومیزی یا ایستگاه های کاری برای علم داده استفاده می کنند.

دانشمندان داده می‌توانند با پردازنده گرافیکی NVIDIA GeForce RTX 4090 به سرعت‌های قابل توجهی دست یابند، همانطور که مجموعه داده‌ها رشد می‌کنند و حافظه پردازشی بیشتر مصرف می‌کند، می‌توانند از cuDF برای ارائه تا 100 برابر عملکرد بهتر با پردازنده‌های گرافیکی NVIDIA RTX 6000 Ada در ایستگاه‌های کاری استفاده کنند. CPU معمولی

نمودار نشان می دهد که cuDF.pandas در مقایسه با چند دقیقه در پانداهای سنتی، ثانیه های تک رقمی طول می کشد تا همان فرآیند را اجرا کند.
دو عملیات رایج در علم داده – “پیوستن” و “تجمیع” – در محور y هستند، در حالی که محور x زمان لازم برای اجرای هر عملیات را نشان می دهد.

دانشمندان داده می توانند به راحتی با استفاده از RAPIDS cuDF در NVIDIA AI Workbench شروع به کار کنند. این مدیر محیط توسعه‌دهنده رایگان و کانتینری به دانشمندان و توسعه‌دهندگان داده اجازه می‌دهد تا حجم‌های کاری هوش مصنوعی و علم داده را در میان سیستم‌های GPU ایجاد، همکاری کرده، و در آن جابجا کنند. کاربران می توانند با چندین پروژه نمونه موجود در مخزن NVIDIA GitHub مانند پروژه cuDF AI Workbench شروع کنند.

cuDF همچنین به‌طور پیش‌فرض در HP AI Studio در دسترس است، یک پلتفرم متمرکز علم داده که به توسعه‌دهندگان هوش مصنوعی کمک می‌کند تا محیط توسعه خود را از ایستگاه‌های کاری به فضای ابری تکرار کنند. این به آنها اجازه می دهد تا بدون مدیریت چندین محیط پروژه ها را راه اندازی، توسعه و همکاری کنند.

مزایای cuDF در رایانه‌های شخصی مجهز به هوش مصنوعی و ایستگاه‌های کاری مجهز به پردازنده‌های RTX فراتر از تسریع عملکرد خام است. آنها عبارتند از:

  • با توسعه محلی با هزینه ثابت در GPUهای قدرتمندی که به طور یکپارچه در سرورهای داخلی یا نمونه های ابری تکرار می شوند، در زمان و هزینه صرفه جویی می شود.
  • پردازش سریع‌تر داده‌ها را برای تکرارهای سریع‌تر امکان‌پذیر می‌کند و به دانشمندان داده اجازه می‌دهد تا با سرعت‌های تعاملی، بینش‌هایی را از مجموعه داده‌ها آزمایش، بهبود و استخراج کنند.
  • پردازش داده های تاثیرگذارتری را برای نتایج مدل سازی بهتر در آینده فراهم می کند.
بخوانید:   نخستین گام چین در حذف دلار از معاملات تجاری

درباره RAPIDS cuDF بیشتر بیاموزید.

عصر جدیدی از علم داده

همانطور که هوش مصنوعی و علم داده به تکامل خود ادامه می دهند، توانایی پردازش و تجزیه و تحلیل سریع مجموعه داده های بزرگ به یک تمایز کلیدی برای امکان پیشرفت در صنایع تبدیل خواهد شد. RAPIDS cuDF چه در حال توسعه مدل‌های یادگیری ماشینی پیچیده، انجام تجزیه و تحلیل‌های آماری پیچیده یا کاوش در هوش مصنوعی مولد باشد، پایه و اساس پردازش داده‌های نسل بعدی را فراهم می‌کند.

NVIDIA با افزودن پشتیبانی از محبوب‌ترین ابزارهای قاب داده، از جمله Polars، یکی از سریع‌ترین کتابخانه‌های پایتون، که سرعت پردازش داده‌ها را در مقایسه با سایر ابزارهای CPU خارج از قفسه به طرز چشمگیری افزایش می‌دهد، این پایه را گسترش می‌دهد.

این ماه، Polars نسخه بتای باز موتور پردازش گرافیکی RAPIDS cuDF خود، Polars را اعلام کرد. کاربران Polars اکنون می توانند عملکرد کتابخانه فریم داده های سریع خود را تا 13 برابر افزایش دهند.

امکانات بی پایان برای مهندسان آینده با هوش مصنوعی RTX

پردازنده‌های گرافیکی NVIDIA – چه در مراکز داده دانشگاه اجرا شوند، چه لپ‌تاپ‌هایی با پردازنده‌های GeForce RTX یا ایستگاه‌های کاری با پردازنده‌های NVIDIA RTX – مطالعات را تسریع می‌کنند. دانش‌آموزان در زمینه‌های علم داده و فراتر از آن، تجربه یادگیری خود را افزایش می‌دهند و تجربه عملی در برخورد با دستگاه‌هایی که به طور گسترده در برنامه‌های کاربردی دنیای واقعی استفاده می‌شوند، به دست می‌آورند.

درباره اینکه چگونه رایانه‌های شخصی و ایستگاه‌های کاری مجهز به NVIDIA RTX به دانش‌آموزان کمک می‌کنند تا با ابزارهای مجهز به هوش مصنوعی تحصیلات خود را پیش ببرند، بیشتر بیاموزید.

هوش مصنوعی مولد بازی، کنفرانس ویدیویی و تجربیات تعاملی از همه نوع را متحول می کند. با اشتراک می توانید متوجه شوید چه چیزهای جدید و چه چیزی در راه است خبرنامه رمزگشایی شده با هوش مصنوعی.

منبع: https://blogs.nvidia.com/blog/rtx-ai-rapids-cudf-pandas/