ترافلاپس چیست و کاربرد آن در گیمینگ چگونه است

وقتی اولین مشخصات کنسول های نسل هشتمی اکس باکس وان و پلی استیشن ۴ معرفی شدند، با وجود سخت افزارهای بسیار مشابه یک تفاوت فاحش در میان مشخصات گرافیکی آن دو به چشم می خورد. با مقایسه کنسول مایکروسافت می دانستیم که پردازنده گرافیکی آن حداقل ۱٫۲۳ ترافلاپس قدرت داشته، در حالی که دستگاه سونی میزانی به مراتب بالاتر، ۱٫۸۴ ترافلاپس ارایه می کرد.

روی کاغذ، قیاس این دو عدد تفاوت بسیار زیادی میان قدرت پردازش گرافیکی دو کنسول ایجاد می کرد و قبل از عرضه ی آنها به نظر می رسید مایکروسافت در دردسر بزرگی قرار می گیرد. مخاطبان با مشاهده و بررسی این آمار احساس می کردند پلی استیشن ۴ از قدرت گرافیکی نزدیک به ۵۰ درصد بیشتر برخوردار بوده؛ معیاری بسیار مهم برای بازیکنان که نشان دهنده بهترین سخت افزار ممکن نسل بعدی کنسول های بازی بود.

حالا با معرفی سری جدید این پلتفرم ها به نظر می رسد نیمه ی سنگین تر ترازو در جهتی مخالف قرار گرفته است. بر اساس اطلاعات مطرح شده، پلی استیشن ۴ نئو دارای قدرتی معادل با ۴٫۲ ترافلاپس بوده در حالی که پروژه اسکورپیو مایکروسافت توان گرافیکی ۶ ترافلاپس را ارایه می کند؛ یعنی حدود ۴۳ درصد قدرت بیشتر. بدون شک این ارقام در ذهنیت مخاطب تاثیر زیادی می گذارد اما سوال اصلی این است که اصلا ترافلاپس چیست؟ و این مسئله در واقع چه اثراتی روی بهره وری و تجربه گیم پلی و گرافیک بازی ها می گذارند؟

ترافلاپس چیست

mkl

برای شروع، یک «FLOPS» برگرفته از عبارت Floating Point Operation per Second به معنای عملیات ممیز شناور بر ثانیه است؛ این عبارت در واقع یکی از مقیاس های پایه برای سنجش کارایی پردازنده کامپیوتر است.

همانطور که می دانید در قلب کنسول های اکس باکس وان و پلی استیشن ۴، تکنولوژی پردازنده گرافیکی AMD حضور دارد. محاسبات توان این فناوری بسیار ساده است؛ در واقع مقدار هسته های Shader (شیدر) در سرعت کلاک ضرب می شود. در سخت افزار AMD تعداد ۶۴ شیدر به ازای هر واحد محاسباتی وجود دارد. اکس باکس وان دارای ۱۲ واحد محاسباتی و پلی استیشن ۴ دارای ۱۸ واحد است، در نتیجه به ترتیب دارای ۷۸۶ و ۱۱۵۲ شیدر هستند. سرعت کلاک هر کدام از کنسول ها نیز به ترتیب  ۸۵۳ و ۸۰۰ مگاهرتز است.

یک «FLOPS» برگرفته از عبارت Floating Point Operation per Second به معنای عملیات ممیز شناور بر ثانیه است؛ این عبارت در واقع یکی از مقیاس های پایه برای سنجش کارایی پردازنده کامپیوتر است.

سپس با ریاضی ساده اعداد به دست آمده را می بایست در ۲ ضرب کرد، چرا که برای هر کلاک ساعت دو نوع متفاوت از ساختار پردازشی وجود دارد (یکی تکثیر و دیگری عملیات ذخیره). این محاسبات، ارقام به شدت بزرگی را تولید می کند. همان گونه که اعداد محاسبه شده حافظه کامپیوتر برای نمایش به صورت مگابایت، گیگابایت یا ترابایت توصیف می شوند، ترافلاپس نیز به معنای فلاپس ضرب در ۱۰ به توان ۱۲ است. پس در محاسبات بالا برای بدست آوردن مقدار ترا، عدد نهایی را تقسیم بر ۱ میلیون می کنیم.

در زیر چگونگی انجام محاسابات ریاضی مشخصات اکس باکس وان، پلی استیشن ۴ و همینطور پلی استیشن ۴ نئو را مشاهده می کنید:

اکس باکس وان: ۷۶۸ شیدر x 853 مگا هرتز x 2 ساختار بر کلاک = ۱٫۳۱۰٫۲۰۸ مگافلاپس = ۱٫۳۱ ترافلاپس

پلی استیشن ۴: ۱۱۵۲ شیدر x 800 مگا هرتز x 2 ساختار بر کلاک = ۱٫۸۴۳٫۲۰۰ مگافلاپس = ۱٫۸۴ ترافلاپس

پلی استیشن ۴ نئو: ۲۳۰۴ شیدر x 911 مگا هرتز x 2 ساختار بر کلاک = ۴٫۱۹۷٫۸۸۸ مگافلاپس = ۴٫۲ ترافلاپس

image (1)

مایکروسافت در طی کنفرانس خود در نمایشگاه E3 2016 از قدرت گرافیکی پروژه اسکورپیو با رقم ۶ ترافلاپس یاد کرد، اما هیچ اطلاعات جزئی تری از پردازنده گرافیکی آن پرده برداری نشد. در واقع ما مقدار نهایی پاسخ محاسباتمان را داریم ولی در مورد میزان کلاک و تعداد شیدرها چیزی نمی دانیم. اما با این حال سعی کرده ایم بر اساس شایعات، دانش طراحی کنسول و البته اطلاعات لو رفته از پردازنده گرافیکی بعدی شرکت AMD به اسم پروژه Vega حدس و گمان هایی در مورد سخت افزار جدید مایکروسافت داشته باشیم.

سناریو اول اسکورپیو: ۳۵۸۴ شیدر x 840 مگا هرتز x 2 ساختار بر کلاک = ۶٫۰۲۱٫۱۲۰ مگافلاپس = ۶٫۰۲ ترافلاپس

سناریو دوم اسکورپیو: ۳۸۴۰ شیدر x 800 مگا هرتز x 2 ساختار بر کلاک = ۶٫۱۴۴٫۰۰۰ مگافلاپس = ۶٫۱۳ ترافلاپس

تخمین ما برای اسکورپیو بر مبنای سرعت کلاک پایین است، چرا که به نظر پردازنده این دستگاه نسبت به پلی استیشن ۴ نئو به مراتب بزرگتر است (پردازنده بزرگتر حرارت بسیار بیشتری نیز تولید می کند، در نتیجه معمولا روی آن از سرعت کلاک کمتری استفاده می شود). حال اگر تصور کنیم مایکروسافت از پردازنده در دست ساخت AMD Radeon Vega استفاده کند، بر اساس اعلام رسمی شرکت سازنده، دارای ۶۴ واحد محاسباتی معادل با ۴۰۹۸ شیدر است، در نتیجه برای رسیدن به ۶ ترافلاپس با استفاده از همان تکنولوژی پلی استیشن ۴ نئو، به رقم سرعت کلاک بسیار بالایی نیاز خواهیم داشت.

سناریو سوم اسکورپیو: ۲۳۰۴ شیدر x 1302 مگا هرتز x 2 ساختار بر کلاک = ۵٫۹۹۹٫۶۱۶ مگافلاپس = ۶ ترافلاپس

در واقع در صورت بهره وری از سخت افزار RX 480 که در پردازنده گرافیکی نئو به کار رفته، لازم است پردازنده مورد نظر در سرعت به شدت بالایی کلاک کند؛ مسئله ای که دور از ذهن به نظر رسیده و احتمالش خیلی پایین است. بنابراین ممکن ترین حالت دسترسی مایکروسافت به پردازنده گرافیکی نسل بعد AMD است، یا شاید نسخه ای تنزل یافته از وگا.

بر چه اساسی میزان ترافلاپس بازدهی یک سیستم را نشان می دهد

AMD-Radeon-e1460375042313-678x381

ترافلاپس یکی از ساده ترین معیارهای سنجش قدرت واحد محاسباتی بوده و کاملا مستثنی از سایر جنبه های طراحی پردازنده گرافیکی فعالیت می کند. به عنوان مثال معماری GCN پردازنده AMD نسبت به رقیبش یعنی Nvidia در محاسابات بسیار سنگین همواره بهتر عمل کرده است. هرچند حتی با این وجود لازم است بدانید که چنین مسئله ای اصلا ارتباطی به بازدهی یک بازی ویدیویی ندارد.

نمونه جالب این قضیه مقایسه ی پردازنده گرافیک انویدیا GTX 1080 با قدرت ۹ ترافلاپس و پردازنده گرافیک رادئون R9 Fury X با ۸٫۶ ترافلاپس قدرت است. بر اساس توان محاسباتی این دو کارت گرافیک به صورت جداگانه، انتظار می رود هر دو پردازنده دارای بهره وری تقریبا معادل با هم باشند. اما با توجه به بنچمارک ۴K جدول زیر، GTX 1080 بر خلاف انتظارمان (به جز در یک بازی) سرعتی بسیار بیشتر از حد تصور ارایه می کند. حتی نسخه ضعیف تر GTX 1070 (با قدرت ۶٫۵ ترافلاپس) به راحتی می تواند Fury X را در بسیاری از بازی ها شکست دهد. علاوه بر این، GTX 1070 که از نظر میزان ترافلاپس از Titan X انویدیا عقب تر به نظر می رسد، می تواند در موارد زیادی با آن برابری کرده یا حتی پیروز باشد.

روی کاغذ اسکورپیو قدرتی معادل با ۴٫۶ برابر توانایی اکس باکس وان دارد، در حالی که نئو ۲٫۳ برابر پلی استیشن ۴ قدرتمندتر است.

درایورها (نرم افزارهای نیروبخش سخت افزار) از اهمیت زیادی برخوردا هستند، اما مهم تر از آن طراحی معماری گرافیکی است؛ حتی بالاتر از سایر جنبه های سخت افزار مثل پهنای باند مموری و حافظه نهان تراشه.

هرچند مقایسه بین اجزای کنسول ها را می توان همراه با دو برهان متفاوت تشریح کرد. اول اینکه المان های پیرامون پردازنده گرافیکی به طور کامل با تراشه اصلی برای رندر محتوای مخصوص کنسول همگام سازی شده، و دوم اینکه پلی استیشن ۴ و اکس باکس وان هر دو از طراحی هسته اصلی کاملا مشابه و از یک خانواده بهره می برند.

bench

با این وجود، قیاس میان نسلی بین اکس باکس وان و اسکورپیو، در کنار پلی استیشن ۴ و نئو چندان به چشم نمی آید. اگرچه AMD اجزای گرافیکی این دو کنسول را به گونه ای تجهیز کرده که به طور کامل با نسل قبلی خود همگام است، اما با این حال بسیاری از المان های اصلی معماری پردازنده های گرافیکی پیشرفت زیادی داشته اند. به طور خلاصه امیدوار هستیم بهره وری بهتر و مفیدتری را شاهد باشیم.

با عرضه رسمی گرافیک RX 480 در ماه های آینده می توان نتایج دقیق و بهتری از طریق آزمایشات حساب شده بدست آورد. این پردازنده همچون رادئون HD 7850 از ۱۶ واحد محاسباتی برخوردار است، اما بر اساس معماری پلاریس طراحی شده است. به محض اینکه اطلاعات دقیق سرعت کلاک و پهنای باند مموری این دو دستگاه مشخص شود، با چند آزمایش بنچمارک می توان درباره نسل چهارم کارت گرافیک های AMD اظهار نظر دقیق و فنی کرد.

اما آنچه می دانیم به طور کلی به شرح زیر است: بر روی کاغذ اسکورپیو قدرتی معادل با ۴٫۶ برابر توانایی اکس باکس وان دارد، در حالی که نئو ۲٫۳ برابر پلی استیشن ۴ قدرتمندتر است. هرچند با وجود آمار بیان شده ی ترافلاپس در پردازنده های گرافیکی جدید، حتی احتمال مواجهه با قدرتی فراتر از انتظاراتمان نیز وجود دارد. با این حال لازم به ذکر است که ۴۰ درصد افزایش قدرت در واحد محاسبات، به معنای ۴۰ افزایش کارکرد و بازدهی نیست.

بازدهی پردازنده گرافیکی به طور کامل به قدرت واحد محاسبات مرتبط نیست

xbox-project-scorpio-specs-vr

به طور کلی وارد ساختن تعداد بیشتر واحدهای محاسباتی AMD منجر به کارکرد بهتر پردازنده گرافیکی خواهد شد. اما به عنوان مثال، دو برابر کردن میزان ترافلاپس به معنای دو برابر شدن فریم ریت نیست. دلایل منطقی بسیار زیادی برای اذعان این ادعا وجود دارد، اما به طور کلی مهم ترین آن فاکتور زیرساخت پهنای باند حافظه است.

برای نمونه کارت گرافیک رادئون R9 380X را در نظر داشته باشید. این پردازنده نسخه نهایی و پرقدرت معماری تراشه تونگا AMD است که از ۳۲ واحد محاسباتی استفاده کرده. اگر در پردازش گرافیک بازی های ویدیویی این پردازنده را با مدل R 380 (نسخه قبلی که از همان تراشه استفاده کرده اما دارای ۲۸ واحد محاسباتی است) مقایسه کنیم، تنها شاهد ۱۰ الی ۱۵ درصد پیشرفت کارکرد خواهیم بود.

این پیشرفت خود با احتساب سرعت کلاک هسته های پردازنده گرافیکی، پهنای باند حافظه و شیدرها ایجاد می شود. اختلاف بین بازدهی حقیقی پردازنده با میزان ترافلاپس ارتباط مستقیمی با رشد مشخصات تراشه گرافیکی دارد. در حال حاضر مایکروسافت تلاش بسیار زیادی برای انجام این مهم کرده است و با اسکورپیو توانسته به پردازنده گرافیکی با میزان ۶ ترافلاپس و ۳۲۰ گیگابایت بر ثانیه حافظه دست یابد (در مقابل سرعت ۲۱۸ گیگابایت بر ثانیه حافظه نئو).

در کنسول های بازی نیز اختلاف بین بازدهی پردازنده با میزان ترافلاپس ارتباط مستقیمی داشته و کاملا قابل لمس است. متاسفانه بنچمارک های سنگین و مهم تقریبا برای قدرت پردازنده گرافیکی کنسول ها موجود نیست؛ ولی بررسی ها و تحلیل ها سابقا نشان داده بازی ها معمولا سعی می کنند گاهی با فدا کردن رزولوشن بالاتر فریم ریت مناسب و بهتری ارایه داده تا بازدهی به مراتب تماشایی تری را در اختیار بازیکنان قرار دهند. جز یک مورد استثنا: هیتمن جدید. این بازی روی هر دو کنسول پلی استیشن ۴ و اکس باکس وان با رزولوشن ۱۰۸۰p اجرا شده و از فریم ریت آزاد بهره می برد؛ هیتمن را می توان نمونه ی ایده آلی برای بنچمارک نسل هشتم دانست.

اختلاف بین بازدهی حقیقی پردازنده با میزان ترافلاپس ارتباط مستقیمی با رشد مشخصات تراشه گرافیکی دارد.

نتایج جالب آزمایشات روی این بازی نشان دهنده تاثیر تقریبی اختلاف میزان ترافلاپس واحد محاسباتی (جدا از میزان پهنای باند که در اکس باکس وان کمتر بوده) است، طوری که پلی استیشن ۴ با وجود برتری ۴۰ درصدی پردازنده، بازدهی بهتر ۳۰ درصدی ارایه می کند. با این وجود نکته ظریفی وجود دارد: نسخه اکس باکس وان هیتمن در برخی موارد سرعت بسیار بهتری در رندر سناریوها دارد، که ما را به مسئله ی حائز اهمیت بعدی می رساند.

عملکرد و بازدهی بازی می تواند محصور به پردازنده اصلی باشد

playstation-ps4-demo-at-paris-game-week

هیتمن نمونه جالبی از چگونگی CPU-محور بودن یک بازی در مقابل انحصار پردازنده گرافیکی است. مرحله پاریس این بازی تعداد زیادی کاراکتر هوش مصنوعی در خود جای داده است که رفتار هر کدام می بایست در کنار انیمیشن گرافیکی خود جداگانه شبیه سازی شود. این عملکرد بیشتر مربوط به پردازنده اصلی است و از آنجایی که هر دو کنسول اکس باکس وان و پلی استیشن ۴ از پردازنده ضعیف جگوار AMD بهره می برند (این پردازنده برای تلفن های همراه طراحی شده بود) باید به سرعت کلاک توجه کرد. یادآوری کنیم که برای ارتقای توان پایین این پردازنده ها، هر دو پلتفرم تعداد هسته ها را دو برابر کردند (هرچند که عملی بیهوده به نظر می رسد). تفاوت اصلی در سرعت کلاک پردازنده هاست که کنسول مایکروسافت با ۱٫۷۵ گیگا هرتز نسبت به ۱٫۶ گیگا هرتز پلی استیشن ۴، در برخی از نواحی هیتمن عملکردی نزدیک به ۹٫۷ درصد بهتر از رقیب دارد.

سونی قصد کرده با نئو این مشکل را برطرف سازد. به نظر می رسد پردازنده اصلی نسل بعدی Zen محصول شرکت AMD در حال حاضر امکان یکپارچه سازی با پردازنده گرافیکی درون یک تراشه واحد را ندارد؛ در نتیجه سونی از نسخه ارتقا یافته ی پردازنده قبلی خود استفاده کرده است. این تراشه از ۸ هسته بهره می برد اما دارای سرعت کلاک بیشتری نسبت به نسل قبلی خود است؛ ۲٫۱ گیگا هرتز، یعنی معادل ۳۱٫۳ درصد ارتقای بازدهی.

نگرانی اصلی ما در مورد نئو و اسکورپیو این است که مانور تبلیغاتی شرکت های سازنده روی افزایش رقم ترافلاپس بوده، اما همانطور که می دانیم هیچ پیشرفتی به اندازه ارتقای قدرت پردازنده اصلی موثر نخواهد بود.

در حال حاضر هنوز نمی دانیم معماری پردازنده اصلی پروژه اسکورپیو چیست، اما با توجه به احتمال متعادل سازی این دو شرکت، شانس استفاده از نسخه ارتقا یافته با سرعت کلاک بیشتر هسته های جگوار در پردازنده اصلی مایکروسافت نیز بسیار بالاست.

نگرانی اصلی ما در مورد نئو و اسکورپیو این است که مانور تبلیغاتی شرکت های سازنده روی قدرت گرافیکی بیشتر با پردازنده گرافیکی بهتر و افزایش رقم ترافلاپس بوده، اما همانطور که می دانیم هیچ پیشرفتی به اندازه ارتقای قدرت پردازنده اصلی موثر نخواهد بود. در واقع همین موضوع یکی از دلایلی است که مایکروسافت و سونی بیشتر روی ابعاد ۴K و امثالهم مانور داده و تذکر چندانی درباره فریم ریت نمی بینیم. افزایش فریم ریت بازی ها از ۳۰ به ۶۰ بدون شک ترجیح تمام بازیکنان خواهد بود که البته این مهم نیز متکی بر توان بیشتر CPU خواهد بود. حتی در حالی که مشخصات نئو را می دانیم، هنوز امکانات دو برابر کردن خواسته هایمان دیده نمی شود.

نکته اصلی: میزان ترافلاپس نمی تواند کاملا قدرت گرافیکی یک کنسول را تشریح کند

Project Scorpio-970-80

هیچ ارتباط معین و مستقیمی بین عملکرد و بازدهی بازی با قدرت واحد محاسباتی با معیار ترافلاپس وجود ندارد؛ با این حال اگر بخواهیم درگیر قیاس و اندازه گیری تفاوت ها شویم می بایست اختلاف ترافلاپس را روی یک معماری مشخص از پردازنده گرافیکی اندازه گیری کنیم. علاوه بر این حتی اذعان پیشرفت ۴۰ درصدی عملکرد بدون تردید در بازدهی عملی و نهایی بازی ها تاثیر مستقیم ۴۰ درصدی نخواهد داشت. توانایی های پردازنده گرافیکی نیز حتی به مواردی بسیار بیشتر از واحد محاسباتی متکی است؛ باز هم شایان ذکر است که پهنای باند حافظه المانی اساسی محسوب می شود.

اگرچه بدون شک مشخص است تعداد ۱۲ واحد محاسباتی اکس باکس وان با توان ۱٫۳۱ ترافلاپس نسبت به ۱۸ واحد محاسباتی پلی استیشن ۴ و قدرت ۱٫۸۴ ترافلاپس کاستی و ضعف مهمی محسوب می شود، اما مایکروسافت تا حد زیادی این مشکل را با پهنای باند حافظه بیشتر رفع و رجوع کرده است. با این وجود توسعه دهندگان بازی های ویدیویی معمولا تجربه ای کاملا متعادل و مشابه با یکدیگر در پلتفرم های مختلف ارایه کرده اند، و تفاوت اصلی تنها به رزولوشن (مثلا ۱۰۸۰p در مقابل ۹۰۰p) محصور می شود. هرچند که به صورت کلی پلی استیشن ۴ فریم ریت بهتر و قابل اتکاتری ارایه می کند.

پیشرفت ۴۰ درصدی عملکرد پردازنده گرافیکی بدون تردید در بازدهی عملی و نهایی بازی ها تاثیر مستقیم ۴۰ درصدی نخواهد داشت.

تمامی شایعات و اطلاعات کنسول های پلی استیشن ۴ نئو و اکس باکس اسکورپیو نشان دهنده ی مشخصاتی مشابه با یکدیگر است، منتها این بار کفه ترازو به نفع مایکروسافت بیشتر میل می کند. هرچند چگونگی تجربه و کیفیت بازی ها نا مشخص بوده و باید منتظر اخبار بیشتری باشیم.

مایکروسافت بیشتر تمرکز خود را روی گیم پلی رزولوشن ۴k گذاشته است؛ سونی نیز برنامه ای کاملا مشابه دارد، هرچند افزایش ابعاد تصویر (Up-Scale) بیشتر در نظر گرفته شده است. اگرچه با فعالیت های سنگین رقیب شاید سونی نیز تصمیم بگیرد توسعه دهندگان خود را به ساخت بازی های با رزولوشن بالاتر از ۱۰۸۰P تشویق کند. در حال حاضر زمینه های بسیار زیادی برای پیشرفت و حرکت رو به جلو در کنسول های میان نسلی وجود دارد. این دوره آغاز عصر جدیدی است.

شاید این مطالب را هم دوست داشته باشید

یک پاسخ

  1. ایمان کمالی می‌گه:

    تکنولوژی به ثانیه داره آپدیت میشه ممنونم جناب رجایی

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *