ग्राफ़िक्स डेटा और शेडर कैलकुलेशन के संख्यात्मक फ़ॉर्मैट का, आपके गेम की परफ़ॉर्मेंस पर काफ़ी असर पड़ सकता है.
सबसे सही फ़ॉर्मैट से ये काम किए जा सकते हैं:
- जीपीयू कैश मेमोरी के इस्तेमाल को ज़्यादा असरदार बनाना
- मेमोरी बैंडविड्थ की खपत कम होती है, जिससे बिजली की बचत होती है और परफ़ॉर्मेंस बेहतर होती है
- शेडर प्रोग्राम में कंप्यूटेशनल थ्रूपुट को ज़्यादा से ज़्यादा करना
- अपने गेम के लिए सीपीयू और रैम के इस्तेमाल को कम करना
फ़्लोटिंग पॉइंट फ़ॉर्मैट
मॉडर्न 3D ग्राफ़िक में ज़्यादातर कैलकुलेशन और डेटा के लिए, फ़्लोटिंग पॉइंट नंबर का इस्तेमाल किया जाता है. Android पर Vulkan, 32 या 16 बिट के फ़्लोटिंग पॉइंट नंबर का इस्तेमाल करता है. 32-बिट फ़्लोटिंग पॉइंट नंबर को आम तौर पर सिंगल प्रेसिज़न या फ़ुल प्रेसिज़न कहा जाता है. वहीं, 16-बिट फ़्लोटिंग पॉइंट नंबर को हाफ़ प्रेसिज़न कहा जाता है.
Vulkan, 64-बिट फ़्लोटिंग पॉइंट टाइप को तय करता है. हालांकि, Android पर Vulkan डिवाइसों में यह टाइप आम तौर पर काम नहीं करता. इसलिए, इसका इस्तेमाल करने का सुझाव नहीं दिया जाता. 64-बिट वाले फ़्लोटिंग पॉइंट नंबर को आम तौर पर डबल प्रिसिशन कहा जाता है.
पूर्णांक फ़ॉर्मैट
डेटा और कैलकुलेशन के लिए, पूर्णांक संख्याओं का भी इस्तेमाल किया जाता है. इनमें नेगेटिव और पॉज़िटिव, दोनों तरह की संख्याएं शामिल होती हैं. स्टैंडर्ड इंटिजर का साइज़ 32 बिट होता है. अन्य बिट साइज़ के लिए सहायता, डिवाइस पर निर्भर करती है. Android पर चलने वाले Vulkan डिवाइसों में, आम तौर पर 16-बिट और 8-बिट पूर्णांक काम करते हैं. Vulkan, 64-बिट पूर्णांक टाइप को तय करता है. हालांकि, Android पर Vulkan डिवाइसों में यह टाइप आम तौर पर काम नहीं करता. इसलिए, इसका इस्तेमाल करने का सुझाव नहीं दिया जाता.
आधे-अंक की सटीक वैल्यू के लिए, सबऑप्टिमल व्यवहार
आधुनिक जीपीयू आर्किटेक्चर, दो 16-बिट वैल्यू को एक साथ 32-बिट पेयर में जोड़ते हैं. साथ ही, ऐसे निर्देश लागू करते हैं जो पेयर पर काम करते हैं. बेहतर परफ़ॉर्मेंस के लिए, स्केलर 16-बिट फ़्लोट वैरिएबल का इस्तेमाल न करें. डेटा को दो या चार एलिमेंट वाले वेक्टर में बदलें. शेडर कंपाइलर, वेक्टर ऑपरेशन में स्केलर वैल्यू का इस्तेमाल कर सकता है. हालांकि, अगर आपको स्केलर को ऑप्टिमाइज़ करने के लिए कंपाइलर पर भरोसा है, तो वेक्टर बनाने की पुष्टि करने के लिए कंपाइलर के आउटपुट की जांच करें.
32-बिट और 16-बिट फ़्लोटिंग पॉइंट में बदलने और इससे वापस बदलने में, कंप्यूटिंग का खर्च आता है. अपने कोड में सटीक कन्वर्ज़न को कम करके, ओवरहेड को कम करें.
आपके एल्गोरिदम के 16-बिट और 32-बिट वर्शन के बीच, बेंचमार्क परफ़ॉर्मेंस में अंतर. हाफ़ प्रिसिशन का इस्तेमाल करने से, परफ़ॉर्मेंस हमेशा बेहतर नहीं होती. खास तौर पर, मुश्किल कैलकुलेशन के लिए. वेक्टर किए गए डेटा पर फ़्यूज़्ड मल्टिप्लाई-ऐड (एफ़एमए) निर्देशों का ज़्यादा इस्तेमाल करने वाले एल्गोरिदम, हाफ़ प्रिसिशन पर बेहतर परफ़ॉर्मेंस के लिए अच्छे विकल्प होते हैं.
संख्या वाले फ़ॉर्मैट के साथ काम करता है
Android पर मौजूद सभी Vulkan डिवाइस, डेटा और शेडर कैलकुलेशन में सिंगल-प्रिसिज़न, 32-बिट फ़्लोटिंग पॉइंट नंबर, और 32-बिट पूर्णांक संख्याओं के साथ काम करते हैं. इस बात की कोई गारंटी नहीं है कि अन्य फ़ॉर्मैट के लिए सहायता उपलब्ध होगी. अगर सहायता उपलब्ध होती है, तो इस बात की कोई गारंटी नहीं है कि यह सभी इस्तेमाल के मामलों के लिए उपलब्ध होगी.
Vulkan में, संख्या वाले वैकल्पिक फ़ॉर्मैट के लिए दो तरह की सुविधाएं उपलब्ध हैं: अंकगणित और स्टोरेज. किसी फ़ॉर्मैट का इस्तेमाल करने से पहले, पक्का करें कि डिवाइस पर दोनों कैटगरी में वह फ़ॉर्मैट काम करता हो.
अंकगणित से जुड़ी सहायता
Vulkan डिवाइस को, न्यूमेरिक फ़ॉर्मैट के लिए अंकगणित की सुविधा के बारे में बताना होगा, ताकि इसका इस्तेमाल शेडर प्रोग्राम में किया जा सके. Android पर Vulkan डिवाइस, आम तौर पर अंकगणित के लिए इन फ़ॉर्मैट के साथ काम करते हैं:
- 32-बिट पूर्णांक (ज़रूरी है)
- 32-बिट फ़्लोटिंग पॉइंट (ज़रूरी है)
- 8-बिट इंटिजर (ज़रूरी नहीं)
- 16-बिट इंटिजर (ज़रूरी नहीं)
- 16-बिट हाफ़-प्रिसिज़न फ़्लोटिंग पॉइंट (ज़रूरी नहीं)
यह पता लगाने के लिए कि Vulkan डिवाइस पर अंकगणित के लिए 16-बिट पूर्णांक काम करते हैं या नहीं, vkGetPhysicalDeviceFeatures2() फ़ंक्शन को कॉल करके डिवाइस की सुविधाएं पाएं. इसके बाद, देखें कि VkPhysicalDeviceFeatures2 नतीजे के स्ट्रक्चर में मौजूद shaderInt16
फ़ील्ड सही है या नहीं.
यह पता लगाने के लिए कि Vulkan डिवाइस, 16-बिट फ़्लोट या 8-बिट पूर्णांकों के साथ काम करता है या नहीं, यह तरीका अपनाएं:
- यह जांच करता है कि डिवाइस पर VK_KHR_shader_float16_int8 Vulkan एक्सटेंशन काम करता है या नहीं. 16-बिट फ़्लोट और 8-बिट पूर्णांक के लिए, इस एक्सटेंशन का इस्तेमाल करना ज़रूरी है.
- अगर
VK_KHR_shader_float16_int8
काम करता है, तोVkPhysicalDeviceFeatures2.pNext
चेन में VkPhysicalDeviceShaderFloat16Int8Features स्ट्रक्चर पॉइंटर जोड़ें. vkGetPhysicalDeviceFeatures2()
को कॉल करने के बाद,VkPhysicalDeviceShaderFloat16Int8Features
के नतीजे के स्ट्रक्चर केshaderFloat16
औरshaderInt8
फ़ील्ड देखें. अगर फ़ील्ड की वैल्यूtrue
है, तो इसका मतलब है कि इस फ़ॉर्मैट का इस्तेमाल, शेडर प्रोग्राम के अंकगणित के लिए किया जा सकता है.
Vulkan 1.1 या 2022 की Android Baseline प्रोफ़ाइल में, VK_KHR_shader_float16_int8
एक्सटेंशन के लिए सपोर्ट होना ज़रूरी नहीं है. हालांकि, Android डिवाइसों पर यह एक्सटेंशन बहुत आम है.
स्टोरेज से जुड़ी सहायता
Vulkan डिवाइस को, स्टोरेज के कुछ खास टाइप के लिए, संख्या वाले वैकल्पिक फ़ॉर्मैट के साथ काम करने की सुविधा के बारे में बताना होगा. VK_KHR_16bit_storage एक्सटेंशन, 16-बिट पूर्णांक और 16-बिट फ़्लोटिंग-पॉइंट फ़ॉर्मैट के साथ काम करता है. एक्सटेंशन के लिए, चार तरह के स्टोरेज तय किए गए हैं. कोई डिवाइस, किसी भी तरह के स्टोरेज के लिए 16-बिट नंबर इस्तेमाल कर सकता है. ऐसा हो सकता है कि वह कुछ स्टोरेज के लिए 16-बिट नंबर इस्तेमाल करे या सभी स्टोरेज के लिए 16-बिट नंबर इस्तेमाल करे.
स्टोरेज के टाइप ये हैं:
- स्टोरेज बफ़र ऑब्जेक्ट
- यूनिफ़ॉर्म बफ़र ऑब्जेक्ट
- पुश कॉन्स्टेंट ब्लॉक
- शेडर इनपुट और आउटपुट इंटरफ़ेस
Android पर Vulkan 1.1 का इस्तेमाल करने वाले ज़्यादातर डिवाइसों में, स्टोरेज बफ़र ऑब्जेक्ट में 16-बिट फ़ॉर्मैट काम करते हैं. हालांकि, सभी डिवाइसों में ऐसा नहीं होता. जीपीयू मॉडल के आधार पर, यह न मान लें कि यह सुविधा काम करेगी. किसी जीपीयू के पुराने ड्राइवर वाले डिवाइसों पर, स्टोरेज बफ़र ऑब्जेक्ट काम नहीं कर सकते. हालांकि, नए ड्राइवर वाले डिवाइसों पर ये काम करते हैं.
यूनिफ़ॉर्म बफ़र, पुश कॉन्स्टेंट ब्लॉक, और शेडर इनपुट/आउटपुट इंटरफ़ेस में 16-बिट फ़ॉर्मैट के लिए सहायता, आम तौर पर जीपीयू बनाने वाली कंपनी पर निर्भर करती है. Android पर, जीपीयू आम तौर पर इन तीनों टाइप के साथ काम करता है या किसी के साथ भी काम नहीं करता.
यहां एक फ़ंक्शन का उदाहरण दिया गया है. यह फ़ंक्शन, Vulkan के अंकगणित और स्टोरेज फ़ॉर्मैट के साथ काम करने की सुविधा की जांच करता है:
struct ReducedPrecisionSupportInfo {
// Arithmetic support
bool has_8_bit_int_ = false;
bool has_16_bit_int_ = false;
bool has_16_bit_float_ = false;
// Storage support
bool has_16_bit_SSBO_ = false;
bool has_16_bit_UBO_ = false;
bool has_16_bit_push_ = false;
bool has_16_bit_input_output_ = false;
// Use 16-bit floats if we have arithmetic
// support and at least SSBO storage support.
bool use_16bit_floats_ = false;
};
void CheckFormatSupport(VkPhysicalDevice physical_device,
ReducedPrecisionSupportInfo &info) {
// Retrieve the device extension list so we
// can check for our desired extensions.
uint32_t device_extension_count;
vkEnumerateDeviceExtensionProperties(physical_device, nullptr,
&device_extension_count, nullptr);
std::vector<VkExtensionProperties> device_extensions(device_extension_count);
vkEnumerateDeviceExtensionProperties(physical_device, nullptr,
&device_extension_count, device_extensions.data());
bool has_16_8_extension = HasDeviceExtension("VK_KHR_shader_float16_int8",
device_extensions);
// Initialize the device features structure and
// chain the storage features structure and 8/16-bit
// support structure if applicable.
VkPhysicalDeviceFeatures2 device_features;
memset(&device_features, 0, sizeof(device_features));
device_features.sType = VK_STRUCTURE_TYPE_PHYSICAL_DEVICE_FEATURES_2;
VkPhysicalDeviceShaderFloat16Int8Features f16_int8_features;
memset(&f16_int8_features, 0, sizeof(f16_int8_features));
f16_int8_features.sType =
VK_STRUCTURE_TYPE_PHYSICAL_DEVICE_FLOAT16_INT8_FEATURES_KHR;
VkPhysicalDevice16BitStorageFeatures storage_features;
memset(&storage_features, 0, sizeof(storage_features));
storage_features.sType =
VK_STRUCTURE_TYPE_PHYSICAL_DEVICE_16BIT_STORAGE_FEATURES;
device_features.pNext = &storage_features;
if (has_16_8_extension) {
storage_features.pNext = &f16_int8_features;
}
vkGetPhysicalDeviceFeatures2(physical_device, &device_features);
// Parse the storage features and determine
// what kinds of 16-bit storage access are available.
if (storage_features.storageBuffer16BitAccess ||
storage_features.uniformAndStorageBuffer16BitAccess) {
info.has_16_bit_SSBO_ = true;
}
info.has_16_bit_UBO_ = storage_features.uniformAndStorageBuffer16BitAccess;
info.has_16_bit_push_ = storage_features.storagePushConstant16;
info.has_16_bit_input_output_ = storage_features.storageInputOutput16;
info.has_16_bit_int_ = device_features.features.shaderInt16;
if (has_16_8_extension) {
info.has_16_bit_float_ = f16_int8_features.shaderFloat16;
info.has_8_bit_int_ = f16_int8_features.shaderInt8;
}
// Get arithmetic and at least some form of storage
// support before enabling 16-bit float usage.
if (info.has_16_bit_float_ && info.has_16_bit_SSBO_) {
info.use_16bit_floats_ = true;
}
}
डेटा के सटीक होने का लेवल
हाफ़-प्रिसिज़न फ़्लोटिंग पॉइंट नंबर, सिंगल-प्रिसिज़न फ़्लोटिंग पॉइंट नंबर की तुलना में कम सटीक होता है. साथ ही, यह वैल्यू की छोटी रेंज को दिखाता है. सिंगल-प्रिसिशन की तुलना में, हाफ़-प्रिसिशन अक्सर एक आसान और परसेप्चुअली लॉसलेस विकल्प होता है. हालांकि, ऐसा हो सकता है कि सभी स्थितियों में हाफ़-प्रिसिज़न का इस्तेमाल करना सही न हो. कुछ तरह के डेटा के लिए, रेंज और सटीक जानकारी कम होने की वजह से ग्राफ़िक आर्टफ़ैक्ट दिख सकते हैं या रेंडरिंग गलत हो सकती है.
हाफ़-प्रिसिशन फ़्लोटिंग पॉइंट में दिखाने के लिए, इन डेटा टाइप का इस्तेमाल किया जा सकता है:
- लोकल स्पेस कोऑर्डिनेट में पोज़िशन का डेटा
- छोटी बनावट के लिए यूवी, जिनमें यूवी रैपिंग सीमित होती है. इन्हें -1.0 से 1.0 की कोऑर्डिनेट रेंज तक सीमित किया जा सकता है
- नॉर्मल, टैंजेंट, और बिटैंजेंट डेटा
- वर्टेक्स के रंग का डेटा
- ऐसा डेटा जिसमें कम सटीक गणना की ज़रूरत होती है और जो 0.0 के आस-पास होता है
हाफ़-प्रिसिज़न फ़्लोट में दिखाने के लिए, इन डेटा टाइप का इस्तेमाल करने का सुझाव नहीं दिया जाता:
- ग्लोबल वर्ल्ड कोऑर्डिनेट में पोज़िशन का डेटा
- टेक्स्चर यूवी, जिनका इस्तेमाल ज़्यादा सटीक जानकारी देने वाले उदाहरणों के लिए किया जाता है. जैसे, ऐटलस शीट में यूज़र इंटरफ़ेस (यूआई) एलिमेंट के कोऑर्डिनेट
शेडर कोड में सटीक जानकारी
OpenGL Shading Language (GLSL) और High-level Shader Language (HLSL) शेडर प्रोग्रामिंग भाषाओं में, संख्यात्मक टाइप के लिए कम सटीक या सटीक वैल्यू तय करने की सुविधा होती है. कम सटीक वैल्यू को, शेडर कंपाइलर के लिए सुझाव के तौर पर माना जाता है. सटीक जानकारी के लिए, तय की गई सटीक जानकारी देना ज़रूरी है. Android पर Vulkan डिवाइस, आम तौर पर कम सटीक फ़ॉर्मैट का सुझाव मिलने पर 16-बिट फ़ॉर्मैट का इस्तेमाल करते हैं. Vulkan का इस्तेमाल करने वाले अन्य डिवाइसों पर, खास तौर पर ऐसे डेस्कटॉप कंप्यूटर पर जिनमें 16-बिट फ़ॉर्मैट के साथ काम न करने वाला ग्राफ़िक्स हार्डवेयर इस्तेमाल किया जाता है, कम सटीक फ़ॉर्मैट को अनदेखा किया जा सकता है. साथ ही, 32-बिट फ़ॉर्मैट का इस्तेमाल किया जा सकता है.
GLSL में स्टोरेज एक्सटेंशन
स्टोरेज और यूनिफ़ॉर्म बफ़र स्ट्रक्चर में 16-बिट या 8-बिट के न्यूमेरिक फ़ॉर्मैट के लिए, GLSL एक्सटेंशन को सही तरीके से तय किया जाना चाहिए. एक्सटेंशन से जुड़ी ज़रूरी घोषणाएं ये हैं:
// Enable 16-bit formats in storage and uniform buffers.
#extension GL_EXT_shader_16bit_storage : require
// Enable 8-bit formats in storage and uniform buffers.
#extension GL_EXT_shader_8bit_storage : require
ये एक्सटेंशन, GLSL के लिए खास तौर पर बनाए गए हैं. इनका कोई भी वर्शन HLSL में उपलब्ध नहीं है.
GLSL में प्रीसिज़न को कम करना
सिंगल-प्रिसिशन फ़्लोट का सुझाव देने के लिए, फ़्लोटिंग पॉइंट टाइप से पहले highp
क्वालिफ़ायर का इस्तेमाल करें. साथ ही, हाफ़-प्रिसिशन फ़्लोट के लिए mediump
क्वालिफ़ायर का इस्तेमाल करें.
Vulkan के लिए GLSL कंपाइलर, लेगसी lowp
क्वालिफ़ायर को mediump
के तौर पर इंटरप्रेट करते हैं.
कम सटीक जवाब के कुछ उदाहरण:
mediump vec4 my_vector; // Suggest 16-bit half precision
highp mat4 my_matrix; // Suggest 32-bit single precision
GLSL में सटीक जानकारी
16-बिट फ़्लोटिंग पॉइंट टाइप का इस्तेमाल करने के लिए, अपने GLSL कोड में GL_EXT_shader_explicit_arithmetic_types_float16
एक्सटेंशन शामिल करें:
#extension GL_EXT_shader_explicit_arithmetic_types_float16 : require
GLSL में 16-बिट फ़्लोटिंग पॉइंट स्केलर, वेक्टर, और मैट्रिक्स टाइप का एलान करने के लिए, इन कीवर्ड का इस्तेमाल करें:
float16_t f16vec2 f16vec3 f16vec4
f16mat2 f16mat3 f16mat4
f16mat2x2 f16mat2x3 f16mat2x4
f16mat3x2 f16mat3x3 f16mat3x4
f16mat4x2 f16mat4x3 f16mat4x4
नीचे दिए गए कीवर्ड का इस्तेमाल करके, GLSL में 16-बिट पूर्णांक स्केलर और वेक्टर टाइप का एलान करें:
int16_t i16vec2 i16vec3 i16vec4
uint16_t u16vec2 u16vec3 u16vec4
HLSL में प्रीसिज़न को कम करना
HLSL, रिलैक्स्ड प्रेसिज़न के बजाय मिनिमल प्रेसिज़न शब्द का इस्तेमाल करता है. कम से कम सटीक टाइप वाला कीवर्ड, कम से कम सटीक वैल्यू तय करता है. हालांकि, अगर टारगेट हार्डवेयर के लिए ज़्यादा सटीक वैल्यू बेहतर विकल्प है, तो कंपाइलर ज़्यादा सटीक वैल्यू का इस्तेमाल कर सकता है. min16float
कीवर्ड से, कम से कम सटीक 16-बिट फ़्लोट तय किया जाता है. साइन किए गए और बिना साइन किए गए 16-बिट पूर्णांकों के लिए, कम से कम सटीक वैल्यू को min16int
और min16uint
कीवर्ड से तय किया जाता है. कम से कम सटीक जानकारी देने वाले उदाहरणों में ये भी शामिल हैं:
// Four element vector and four-by-four matrix types
min16float4 my_vector4;
min16float4x4 my_matrix4x4;
HLSL में सटीक जानकारी
हाफ़-प्रिसिज़न फ़्लोटिंग-पॉइंट को half
या float16_t
कीवर्ड से तय किया जाता है. साइन किए गए और बिना साइन किए गए 16-बिट पूर्णांकों को क्रमशः int16_t
और uint16_t
कीवर्ड से तय किया जाता है. सटीक जानकारी देने के बारे में साफ़ तौर पर किए गए एलान के अन्य उदाहरण यहां दिए गए हैं:
// Four element vector and four-by-four matrix types
half4 my_vector4;
half4x4 my_matrix4x4;