कम सटीक जानकारी के साथ ऑप्टिमाइज़ करें

ग्राफ़िक्स डेटा और शेडर कैलकुलेशन के संख्या वाले फ़ॉर्मैट में आपके गेम की परफ़ॉर्मेंस पर काफ़ी असर पड़ सकता है.

सबसे सही फ़ॉर्मैट के इस्तेमाल के लिए ये चीज़ें ज़रूरी हैं:

  • जीपीयू कैश मेमोरी के इस्तेमाल की क्षमता बढ़ाएं
  • मेमोरी बैंडविड्थ की खपत कम करें, पावर बचाएं, और परफ़ॉर्मेंस बढ़ाएं
  • शेडर प्रोग्राम में कंप्यूटेशनल थ्रूपुट को बढ़ाएं
  • अपने गेम में सीपीयू रैम का इस्तेमाल कम से कम करें

फ़्लोटिंग पॉइंट फ़ॉर्मैट

आधुनिक 3D ग्राफ़िक में ज़्यादातर कैलकुलेशन और डेटा, फ़्लोटिंग पॉइंट का इस्तेमाल करते हैं नंबर. Android पर Vulkan, फ़्लोटिंग पॉइंट नंबर का इस्तेमाल करता है: 32 या साइज़ में 16 बिट. 32-बिट फ़्लोटिंग पॉइंट नंबर को आम तौर पर, एक सटीक या पूरी तरह से सटीक; 16-बिट का फ़्लोटिंग पॉइंट नंबर, आधा प्रिसिज़न.

Vulkan, 64-बिट फ़्लोटिंग पॉइंट टाइप को तय करता है. हालांकि, आम तौर पर यह यह सुविधा Android पर Vulkan डिवाइसों पर काम करती है. इसलिए, इसके इस्तेमाल का सुझाव नहीं दिया जाता. 64-बिट फ़्लोटिंग पॉइंट नंबर को आम तौर पर डबल प्रिसिज़न कहा जाता है.

पूर्णांक फ़ॉर्मैट

डेटा और कैलकुलेशन के लिए, हस्ताक्षर वाली और बिना हस्ताक्षर वाली पूर्णांक संख्याओं का भी इस्तेमाल किया जाता है. कॉन्टेंट बनाने स्टैंडर्ड पूर्णांक साइज़ 32 बिट होता है. अन्य बिट साइज़ के लिए, डिवाइस का इस्तेमाल किया जा सकता है निर्भर. Android पर चलने वाले Vulkan डिवाइस आम तौर पर, 16-बिट और 8-बिट पर काम करते हैं पूर्णांक. Vulkan, 64-बिट वाला पूर्णांक टाइप तय करता है. हालांकि, आम तौर पर यह टाइप इस्तेमाल नहीं किया जाता यह सुविधा Android पर Vulkan डिवाइसों पर काम करती है. इसलिए, इसके इस्तेमाल का सुझाव नहीं दिया जाता.

आधा सटीक व्यवहार नहीं होने की वजह से

आधुनिक जीपीयू आर्किटेक्चर में, 32-बिट पेयर में दो 16-बिट की वैल्यू को एक साथ जोड़ा जाता है और पेयर पर लागू होने वाले निर्देशों को लागू करें. सबसे अच्छी परफ़ॉर्मेंस के लिए, ऐसा न करें स्केलर 16-बिट फ़्लोट वैरिएबल का इस्तेमाल करके; डेटा को दो या चार-तत्वों में सदिशित करना वेक्टर. शेडर कंपाइलर, वेक्टर में स्केलर वैल्यू का इस्तेमाल कर सकता है कार्रवाइयां. हालांकि, अगर आप स्केलर को ऑप्टिमाइज़ करने के लिए कंपाइलर पर भरोसा करते हैं, तो वेक्टराइज़ेशन की पुष्टि करने के लिए, कंपाइलर आउटपुट का इस्तेमाल करता है.

32-बिट और 16-बिट&#ndash;प्रीसिज़न फ़्लोटिंग पॉइंट में और उससे बदलने पर कम्प्यूटेशनल कॉस्ट. अपने विज्ञापनों में सटीक कन्वर्ज़न कम करके ओवरहेड कम करें कोड.

आपके डिवाइस के 16-बिट और 32-बिट वर्शन के बीच, बेंचमार्क की परफ़ॉर्मेंस का अंतर एल्गोरिदम पर काम करता है. आधी सटीक जानकारी से परफ़ॉर्मेंस में हमेशा सुधार नहीं होता. खासकर मुश्किल कैलकुलेशन के लिए. फ़्यूज़्ड का बहुत ज़्यादा इस्तेमाल करने वाले एल्गोरिदम वेक्टराइज़्ड डेटा के लिए, मल्टी-ऐड (एफ़एमए) के निर्देशों का पालन करना सही होता है आधी सटीकता पर बेहतर प्रदर्शन मिला है.

संख्या वाली फ़ॉर्मैट की सुविधा

Android पर काम करने वाले सभी Vulkan डिवाइस, 32-बिट के फ़्लोटिंग पॉइंट वाले मॉडल पर काम करते हैं. डेटा और शेडर कैलकुलेशन में संख्याएं और 32-बिट पूर्णांक संख्याएं होती हैं. इसके लिए सहायता अन्य फ़ॉर्मैट उपलब्ध होने की कोई गारंटी नहीं है. साथ ही, उपलब्ध होने पर, इसकी कोई गारंटी नहीं है इस्तेमाल के सभी उदाहरणों के लिए.

वैकल्पिक न्यूमेरिक फ़ॉर्मैट के लिए, Vulkan की दो कैटगरी हैं: अंकगणित और स्टोरेज. किसी खास फ़ॉर्मैट का इस्तेमाल करने से पहले, पक्का करें कि डिवाइस पर दोनों फ़ॉर्मैट काम करते हों श्रेणियां.

अंकगणित से जुड़ी सहायता

Vulkan डिवाइस को अंकों के फ़ॉर्मैट के लिए अंकगणित के सपोर्ट का एलान करना होगा शेडर प्रोग्राम में उपयोग करने योग्य होनी चाहिए. Android पर Vulkan डिवाइस, आम तौर पर ये अंकगणित के फ़ॉर्मैट हैं:

  • 32-बिट पूर्णांक (ज़रूरी है)
  • 32-बिट फ़्लोटिंग पॉइंट (ज़रूरी)
  • 8-बिट पूर्णांक (ज़रूरी नहीं)
  • 16-बिट पूर्णांक (ज़रूरी नहीं)
  • 16-बिट आधा सटीक फ़्लोटिंग पॉइंट (ज़रूरी नहीं)

यह पता लगाने के लिए कि Vulkan डिवाइस, अंकगणित के 16-बिट पूर्णांकों की सुविधा देता है या नहीं, इस लिंक पर कॉल करके, डिवाइस की सुविधाएँ फिर से पाएं vkGetFamilyDeviceFeatures2() फ़ंक्शन इस्तेमाल कर सकते हैं और यह जांच कर रहे हैं कि क्या VkBodyDeviceFeatures2 में shaderInt16 फ़ील्ड नतीजा संरचना सही है.

Vulkan डिवाइस 16-बिट फ़्लोट या 8-बिट पूर्णांक में काम करता है या नहीं, यह पता करने के लिए, यह तरीका अपनाएं:

  1. देखें कि डिवाइस, VK_KHR_shader_float16_int8 Vulkan एक्सटेंशन. यह एक्सटेंशन है 16-बिट फ़्लोट और 8-बिट पूर्णांक की सुविधा के लिए ज़रूरी है.
  2. अगर VK_KHR_shader_float16_int8 काम करता है, तो VkPHDeviceShaderFloat16Int8Features स्ट्रक्चर पॉइंटर VkPhysicalDeviceFeatures2.pNext चेन के लिए.
  3. इसके shaderFloat16 और shaderInt8 फ़ील्ड की जांच करें: कॉल करने के बाद दिखने वाला VkPhysicalDeviceShaderFloat16Int8Features नतीजा vkGetPhysicalDeviceFeatures2(). अगर फ़ील्ड की वैल्यू true है, तो फ़ॉर्मैट यह होगा शेडर प्रोग्राम अंकगणित के लिए समर्थित है.

हालांकि, Vulkan 1.1 या 2022 में ज़रूरी नहीं है Android बेसलाइन प्रोफ़ाइल, VK_KHR_shader_float16_int8 के लिए सहायता एक्सटेंशन का इस्तेमाल Android डिवाइसेस पर बहुत आम है.

स्टोरेज से जुड़ी सहायता

Vulkan डिवाइस को तय करें. VK_KHR_16bit_storage एक्सटेंशन 16-बिट पूर्णांक और 16-बिट फ़्लोटिंग-पॉइंट फ़ॉर्मैट के साथ काम करने की घोषणा करता है. चार स्टोरेज के टाइप को एक्सटेंशन से तय किया जाता है. किसी डिवाइस पर 16-बिट वाले नंबर काम कर सकते हैं कुछ भी नहीं, कुछ या सभी तरह के स्टोरेज के लिए.

स्टोरेज के टाइप:

  • स्टोरेज बफ़र ऑब्जेक्ट
  • यूनिफ़ॉर्म बफ़र ऑब्जेक्ट
  • कॉन्सटेंट ब्लॉक पुश करें
  • शेडर इनपुट और आउटपुट इंटरफ़ेस

सभी नहीं, लेकिन Android पर चलने वाले ज़्यादातर Vulkan 1.1 डिवाइस, 16-बिट वाले फ़ॉर्मैट में स्टोरेज बफ़र ऑब्जेक्ट. पक्का करें कि यह सुविधा जीपीयू मॉडल के आधार पर काम करती है. डिवाइसों की सूची हो सकता है कि दिए गए जीपीयू के लिए पुराने ड्राइवर, स्टोरेज बफ़र ऑब्जेक्ट के साथ काम न करें, जबकि नए ड्राइवर वाले डिवाइस काम करते हैं.

एक जैसे बफ़र, पुश कॉन्सटेंट ब्लॉक, और शेडर में 16-बिट फ़ॉर्मैट के साथ काम करता है इनपुट/आउटपुट इंटरफ़ेस आम तौर पर जीपीयू के मैन्युफ़ैक्चरर पर निर्भर करते हैं. चालू है Android के लिए, जीपीयू आम तौर पर इन तीनों टाइप के साथ काम करता है या इनमें से कोई भी नहीं उन्हें.

इस फ़ंक्शन का इस्तेमाल करके, Vulkan अंकगणित और स्टोरेज फ़ॉर्मैट के साथ काम करने की सुविधा की जांच की जाती है:

struct ReducedPrecisionSupportInfo {
  // Arithmetic support
  bool has_8_bit_int_ = false;
  bool has_16_bit_int_ = false;
  bool has_16_bit_float_ = false;
  // Storage support
  bool has_16_bit_SSBO_ = false;
  bool has_16_bit_UBO_ = false;
  bool has_16_bit_push_ = false;
  bool has_16_bit_input_output_ = false;
  // Use 16-bit floats if we have arithmetic
  // support and at least SSBO storage support.
  bool use_16bit_floats_ = false;
};

void CheckFormatSupport(VkPhysicalDevice physical_device,
    ReducedPrecisionSupportInfo &info) {

  // Retrieve the device extension list so we
  // can check for our desired extensions.
  uint32_t device_extension_count;
  vkEnumerateDeviceExtensionProperties(physical_device, nullptr,
      &device_extension_count, nullptr);
  std::vector<VkExtensionProperties> device_extensions(device_extension_count);
  vkEnumerateDeviceExtensionProperties(physical_device, nullptr,
      &device_extension_count, device_extensions.data());

  bool has_16_8_extension = HasDeviceExtension("VK_KHR_shader_float16_int8",
      device_extensions);

  // Initialize the device features structure and
  // chain the storage features structure and 8/16-bit
  // support structure if applicable.
  VkPhysicalDeviceFeatures2 device_features;
  memset(&device_features, 0, sizeof(device_features));
  device_features.sType = VK_STRUCTURE_TYPE_PHYSICAL_DEVICE_FEATURES_2;

  VkPhysicalDeviceShaderFloat16Int8Features f16_int8_features;
  memset(&f16_int8_features, 0, sizeof(f16_int8_features));
  f16_int8_features.sType =
      VK_STRUCTURE_TYPE_PHYSICAL_DEVICE_FLOAT16_INT8_FEATURES_KHR;

  VkPhysicalDevice16BitStorageFeatures storage_features;
  memset(&storage_features, 0, sizeof(storage_features));
  storage_features.sType =
      VK_STRUCTURE_TYPE_PHYSICAL_DEVICE_16BIT_STORAGE_FEATURES;
  device_features.pNext = &storage_features;

  if (has_16_8_extension) {
    storage_features.pNext = &f16_int8_features;
  }

  vkGetPhysicalDeviceFeatures2(physical_device, &device_features);

  // Parse the storage features and determine
  // what kinds of 16-bit storage access are available.
  if (storage_features.storageBuffer16BitAccess ||
      storage_features.uniformAndStorageBuffer16BitAccess) {
    info.has_16_bit_SSBO_ = true;
  }
  info.has_16_bit_UBO_ = storage_features.uniformAndStorageBuffer16BitAccess;
  info.has_16_bit_push_ = storage_features.storagePushConstant16;
  info.has_16_bit_input_output_ = storage_features.storageInputOutput16;

  info.has_16_bit_int_ = device_features.features.shaderInt16;
  if (has_16_8_extension) {
    info.has_16_bit_float_ = f16_int8_features.shaderFloat16;
    info.has_8_bit_int_ = f16_int8_features.shaderInt8;
  }

  // Get arithmetic and at least some form of storage
  // support before enabling 16-bit float usage.
  if (info.has_16_bit_float_ && info.has_16_bit_SSBO_) {
    info.use_16bit_floats_ = true;
  }
}

डेटा के लिए सटीक लेवल

आधा सटीक फ़्लोटिंग पॉइंट नंबर, वैल्यू की कम रेंज को दिखा सकता है सटीक होने पर भी ऐसा हो सकता है. आधी-सटीकता अक्सर सरल और लगता है कि एक नुकसान नहीं होगा सटीक होता है. हालांकि, ऐसा भी हो सकता है कि कुछ मामलों में आधी-सटीक जानकारी सही न हो. कुछ तरह के डेटा के लिए, कम रेंज और सटीक होने की वजह से ग्राफ़िक आर्टफ़ैक्ट या गलत रेंडरिंग हो.

ऐसे डेटा टाइप जो आधी सटीक जानकारी देने के लिहाज़ से अच्छे होते हैं फ़्लोटिंग पॉइंट में ये शामिल हैं:

  • स्थानीय अंतरिक्ष निर्देशांकों में डेटा की जगह तय करना
  • छोटे टेक्सचर के लिए, सीमित यूवी रैपिंग के साथ टेक्सचर यूवी -1.0 से 1.0 निर्देशांक रेंज तक सीमित
  • सामान्य, टैंजेंट, और बिटेंजेंट डेटा
  • वर्टेक्स कलर डेटा
  • कम सटीक ज़रूरतों वाला डेटा 0.0 पर आधारित

ऐसे डेटा टाइप जिन्हें आधा सटीक फ़्लोट में दिखाने के लिए, इस्तेमाल नहीं किया जाता शामिल करें:

  • वैश्विक विश्व के निर्देशांकों में डेटा की स्थिति तय करना
  • उच्च-सटीक उपयोग मामलों के लिए टेक्सचर यूवी, जैसे कि यूज़र इंटरफ़ेस (यूआई) एलिमेंट निर्देशांक एटलस शीट

शेडर कोड में प्रिसिज़न

OpenGL शेडिंग लैंग्वेज (जीएलएसएल) और हाई-लेवल शेडर लैंग्वेज (एचएलएसएल) शेडर प्रोग्रामिंग भाषाएँ आराम से जुड़ी जानकारी के लिए सहायता करती हैं संख्या वाले टाइप के लिए, सटीक या साफ़ तौर पर सटीक जानकारी. आसान और सटीक तरीके से इस्तेमाल किया जाता है शेडर कंपाइलर के लिए सुझाव के रूप में. स्पष्ट तय सटीक होने की ज़रूरत है. Android पर Vulkan डिवाइस आम तौर पर, इन डिवाइसों का इस्तेमाल करते हैं 16-बिट फ़ॉर्मैट, जब तक की सटीक तकनीक के सुझाव दिए जाते हैं. अन्य Vulkan डिवाइस, विशेष रूप से ऐसे डेस्कटॉप कंप्यूटर पर जो ग्राफ़िक हार्डवेयर का समर्थन नहीं करते 16-बिट वाले फ़ॉर्मैट के लिए, डाउनलोड की गई सटीक वैल्यू को अनदेखा कर सकता है. साथ ही, 32-बिट फ़ॉर्मैट का इस्तेमाल कर सकता है.

जीएलएसएल में स्टोरेज एक्सटेंशन

16-बिट या स्टोरेज और यूनिफ़ॉर्म बफ़र स्ट्रक्चर में 8-बिट न्यूमेरिक फ़ॉर्मैट. काम के एक्सटेंशन के एलान इस तरह हैं:

// Enable 16-bit formats in storage and uniform buffers.
#extension GL_EXT_shader_16bit_storage : require
// Enable 8-bit formats in storage and uniform buffers.
#extension GL_EXT_shader_8bit_storage : require

ये एक्सटेंशन सिर्फ़ जीएलएसएल (जीएलएसएल) के लिए होते हैं और एचएलएसएल में इनके बराबर नहीं होते.

जीएलएसएल में आसान और सटीक

किसी फ़्लोटिंग पॉइंट टाइप से पहले, highp क्वालीफ़ायर का इस्तेमाल करके, सिंगल-प्रीसिज़न फ़्लोट और हाफ़-सटीक फ़्लो के लिए mediump क्वालीफ़ायर. Vulkan के लिए जीएलएसएल कंपाइलर, लेगसी lowp क्वालीफ़ायर को mediump समझते हैं. आसान और सटीक होने के कुछ उदाहरण:

mediump vec4 my_vector; // Suggest 16-bit half precision
highp mat4 my_matrix;   // Suggest 32-bit single precision

जीएलएसएल में साफ़ तौर पर सटीक जानकारी

अपनेGL_EXT_shader_explicit_arithmetic_types_float16 जीएलएसएल कोड, जिससे 16-बिट फ़्लोटिंग पॉइंट टाइप का इस्तेमाल चालू किया जा सकता है:

#extension GL_EXT_shader_explicit_arithmetic_types_float16 : require

GLSL में 16-बिट फ़्लोटिंग पॉइंट अदिश, सदिश, और आव्यूह प्रकारों को निम्न कीवर्ड:

float16_t   f16vec2     f16vec3    f16vec4
f16mat2     f16mat3     f16mat4
f16mat2x2   f16mat2x3   f16mat2x4
f16mat3x2   f16mat3x3   f16mat3x4
f16mat4x2   f16mat4x3   f16mat4x4

नीचे दिए गए विकल्पों का इस्तेमाल करके, GLSL में 16-बिट पूर्णांक स्केलर और वेक्टर टाइप तय करें कीवर्ड:

int16_t     i16vec2     i16vec3    i16vec4
uint16_t    u16vec2     u16vec3    u16vec4

एचएलएसएल में आसान और सटीक

HLSL, आसान सटीक के बजाय मिनिमल सटीक शब्द का इस्तेमाल करता है. मिनिमल सटीक प्रकार का कीवर्ड कम से कम सटीक जानकारी देता है, लेकिन कंपाइलर यदि उच्च परिशुद्धता वाला विकल्प बेहतर है, तो उच्च टारगेट हार्डवेयर. न्यूनतम सटीक 16-बिट फ़्लोट min16float कीवर्ड. कम सटीक हस्ताक्षर वाले और बिना साइन वाले 16-बिट वाले पूर्णांक हैं min16int और min16uint कीवर्ड से तय किए जाते हैं. अन्य जानकारी कम सटीक जानकारी के उदाहरणों में ये शामिल हैं:

// Four element vector and four-by-four matrix types
min16float4 my_vector4;
min16float4x4 my_matrix4x4;

एचएलएसएल में साफ़ तौर पर सटीक जानकारी

हाफ़-प्रीसिज़न फ़्लोटिंग-पॉइंट की जानकारी half या float16_t में दी गई है कीवर्ड. साइन किए हुए और साइन नहीं किए गए 16-बिट वाले पूर्णांक की जानकारी int16_t में दी जाती है और uint16_t कीवर्ड. साफ़ तौर पर जानकारी देने के अतिरिक्त उदाहरण एलानों में ये चीज़ें शामिल हैं:

// Four element vector and four-by-four matrix types
half4 my_vector4;
half4x4 my_matrix4x4;