یادداشت سردبیر: این پست بخشی از سری رمزگشایی هوش مصنوعیکه هوش مصنوعی را با در دسترستر کردن فناوری، نمایش سختافزار، نرمافزار، ابزار و شتابدهندههای جدید برای کاربران ایستگاههای کاری RTX و رایانههای شخصی، ابهام زدایی میکند.
در سراسر صنایع، هوش مصنوعی نوآوری را هدایت میکند و کارآییها را ممکن میسازد – اما برای بهکارگیری پتانسیل کامل آن، این فناوری باید بر روی حجم عظیمی از دادههای با کیفیت بالا آموزش داده شود.
دانشمندان داده نقش کلیدی در تهیه این داده ها ایفا می کنند، به ویژه در مناطق خاص دامنه که در آن داده های تخصصی و اختصاصی اغلب برای افزایش قابلیت های هوش مصنوعی ضروری است.
NVIDIA برای کمک به دانشمندان داده در رسیدگی به نیازهای افزایش بار کاری، اعلام کرد که RAPIDS cuDF، کتابخانهای که به کاربران امکان میدهد راحتتر با دادهها کار کنند، کتابخانه نرمافزار پانداها را بدون هیچ تغییری در کد سرعت میبخشد. Pandas یک کتابخانه تجزیه و تحلیل و دستکاری داده انعطاف پذیر، قدرتمند و محبوب برای زبان برنامه نویسی پایتون است. با cuDF، دانشمندان داده اکنون می توانند از پایگاه کد مورد علاقه خود بدون به خطر انداختن سرعت پردازش داده استفاده کنند.
سختافزار و فناوریهای NVIDIA RTX AI همچنین میتوانند سرعت پردازش دادهها را فراهم کنند. این شامل پردازندههای گرافیکی قدرتمندی است که عملکرد محاسباتی مورد نیاز برای تسریع سریع و کارآمد هوش مصنوعی در هر سطح را فراهم میکند – از گردشهای کاری علم داده تا آموزش و سفارشیسازی مدلها در رایانههای شخصی و ایستگاههای کاری.
گلوگاه در علم داده
رایج ترین فرمت داده ها، داده های جدولی است که در ردیف ها و ستون ها سازماندهی می شوند. مجموعه داده های کوچکتر را می توان با استفاده از ابزارهای صفحه گسترده مانند اکسل مدیریت کرد، با این حال، مجموعه داده ها و خطوط لوله مدل سازی حاوی ده ها میلیون ردیف معمولاً به کتابخانه های چارچوب داده در زبان های برنامه نویسی مانند پایتون متکی هستند.
پایتون یک انتخاب محبوب برای تجزیه و تحلیل داده است، در درجه اول به دلیل کتابخانه پانداها، که دارای یک API آسان برای استفاده است. با این حال، با افزایش اندازه دادهها، پانداها در مورد سرعت پردازش و کارایی در سیستمهای فقط CPU با مشکلاتی مواجه میشوند. این کتابخانه همچنین در مدیریت مجموعه دادههایی که حاوی متن متراکم هستند، مشکل ضعیفی دارد، که یک نوع داده مهم برای مدلهای زبان بزرگ است.
هنگامی که نیازهای داده از توانایی های پاندا فراتر می رود، دانشمندان داده با یک معضل مواجه می شوند: تحمل جدول زمانی پردازش آهسته یا برداشتن گام پیچیده و گران قیمت به سمت ابزارهای کارآمدتر اما کمتر کاربرپسند.
تسریع در پیش پردازش خطوط لوله با RAPIDS cuDF
با RAPIDS cuDF، دانشمندان داده می توانند از پایگاه کد مورد علاقه خود بدون به خطر انداختن سرعت پردازش استفاده کنند.
RAPIDS یک مجموعه منبع باز از کتابخانه های پایتون با شتاب GPU است که برای بهینه سازی خطوط لوله علوم داده و تجزیه و تحلیل طراحی شده است. cuDF یک کتابخانه DataFrame GPU است که یک API پاندا مانند برای بارگذاری، فیلتر کردن و دستکاری داده ها ارائه می دهد.
با استفاده از «حالت شتاب پانداها» cuDF، دانشمندان داده میتوانند کد پانداهای موجود خود را روی GPUها اجرا کنند تا از پردازش موازی قدرتمند بهره ببرند، در حالی که اطمینان حاصل کنند که کد در صورت لزوم به پردازندهها تغییر میکند. این سازگاری عملکرد پیشرفته و قابل اعتمادی را ارائه می دهد.
آخرین نسخه cuDF از مجموعه داده های بزرگتر و میلیاردها ردیف داده متن جدولی پشتیبانی می کند. این به دانشمندان داده اجازه می دهد تا از کد پانداها برای پیش پردازش داده ها برای موارد استفاده از هوش مصنوعی مولد استفاده کنند.
علم داده را در ایستگاه های کاری و رایانه های شخصی هوش مصنوعی مجهز به NVIDIA RTX تسریع کنید
طبق یک مطالعه اخیر، 57٪ از دانشمندان داده از منابع داخلی مانند رایانه های شخصی، رایانه های رومیزی یا ایستگاه های کاری برای علم داده استفاده می کنند.
دانشمندان داده میتوانند با پردازنده گرافیکی NVIDIA GeForce RTX 4090 به سرعتهای قابل توجهی دست یابند، همانطور که مجموعه دادهها رشد میکنند و حافظه پردازشی بیشتر مصرف میکند، میتوانند از cuDF برای ارائه تا 100 برابر عملکرد بهتر با پردازندههای گرافیکی NVIDIA RTX 6000 Ada در ایستگاههای کاری استفاده کنند. CPU معمولی
دانشمندان داده می توانند به راحتی با استفاده از RAPIDS cuDF در NVIDIA AI Workbench شروع به کار کنند. این مدیر محیط توسعهدهنده رایگان و کانتینری به دانشمندان و توسعهدهندگان داده اجازه میدهد تا حجمهای کاری هوش مصنوعی و علم داده را در میان سیستمهای GPU ایجاد، همکاری کرده، و در آن جابجا کنند. کاربران می توانند با چندین پروژه نمونه موجود در مخزن NVIDIA GitHub مانند پروژه cuDF AI Workbench شروع کنند.
cuDF همچنین بهطور پیشفرض در HP AI Studio در دسترس است، یک پلتفرم متمرکز علم داده که به توسعهدهندگان هوش مصنوعی کمک میکند تا محیط توسعه خود را از ایستگاههای کاری به فضای ابری تکرار کنند. این به آنها اجازه می دهد تا بدون مدیریت چندین محیط پروژه ها را راه اندازی، توسعه و همکاری کنند.
مزایای cuDF در رایانههای شخصی مجهز به هوش مصنوعی و ایستگاههای کاری مجهز به پردازندههای RTX فراتر از تسریع عملکرد خام است. آنها عبارتند از:
- با توسعه محلی با هزینه ثابت در GPUهای قدرتمندی که به طور یکپارچه در سرورهای داخلی یا نمونه های ابری تکرار می شوند، در زمان و هزینه صرفه جویی می شود.
- پردازش سریعتر دادهها را برای تکرارهای سریعتر امکانپذیر میکند و به دانشمندان داده اجازه میدهد تا با سرعتهای تعاملی، بینشهایی را از مجموعه دادهها آزمایش، بهبود و استخراج کنند.
- پردازش داده های تاثیرگذارتری را برای نتایج مدل سازی بهتر در آینده فراهم می کند.
درباره RAPIDS cuDF بیشتر بیاموزید.
عصر جدیدی از علم داده
همانطور که هوش مصنوعی و علم داده به تکامل خود ادامه می دهند، توانایی پردازش و تجزیه و تحلیل سریع مجموعه داده های بزرگ به یک تمایز کلیدی برای امکان پیشرفت در صنایع تبدیل خواهد شد. RAPIDS cuDF چه در حال توسعه مدلهای یادگیری ماشینی پیچیده، انجام تجزیه و تحلیلهای آماری پیچیده یا کاوش در هوش مصنوعی مولد باشد، پایه و اساس پردازش دادههای نسل بعدی را فراهم میکند.
NVIDIA با افزودن پشتیبانی از محبوبترین ابزارهای قاب داده، از جمله Polars، یکی از سریعترین کتابخانههای پایتون، که سرعت پردازش دادهها را در مقایسه با سایر ابزارهای CPU خارج از قفسه به طرز چشمگیری افزایش میدهد، این پایه را گسترش میدهد.
این ماه، Polars نسخه بتای باز موتور پردازش گرافیکی RAPIDS cuDF خود، Polars را اعلام کرد. کاربران Polars اکنون می توانند عملکرد کتابخانه فریم داده های سریع خود را تا 13 برابر افزایش دهند.
امکانات بی پایان برای مهندسان آینده با هوش مصنوعی RTX
پردازندههای گرافیکی NVIDIA – چه در مراکز داده دانشگاه اجرا شوند، چه لپتاپهایی با پردازندههای GeForce RTX یا ایستگاههای کاری با پردازندههای NVIDIA RTX – مطالعات را تسریع میکنند. دانشآموزان در زمینههای علم داده و فراتر از آن، تجربه یادگیری خود را افزایش میدهند و تجربه عملی در برخورد با دستگاههایی که به طور گسترده در برنامههای کاربردی دنیای واقعی استفاده میشوند، به دست میآورند.
درباره اینکه چگونه رایانههای شخصی و ایستگاههای کاری مجهز به NVIDIA RTX به دانشآموزان کمک میکنند تا با ابزارهای مجهز به هوش مصنوعی تحصیلات خود را پیش ببرند، بیشتر بیاموزید.
هوش مصنوعی مولد بازی، کنفرانس ویدیویی و تجربیات تعاملی از همه نوع را متحول می کند. با اشتراک می توانید متوجه شوید چه چیزهای جدید و چه چیزی در راه است خبرنامه رمزگشایی شده با هوش مصنوعی.
منبع: https://blogs.nvidia.com/blog/rtx-ai-rapids-cudf-pandas/